跳至主要內容
FAQ

NVIDIA發布Cosmos Reason 2與GR00T N1.6,全力加速實體AI機器人發展

2026年全國機器人週期間,NVIDIA發布Cosmos Reason 2——一個在物理世界推理排行榜上名列前茅的視覺語言模型——以及GR00T N1.6,一個用於仿人機器人全身控制的開源VLA模型。搭配Isaac Lab-Arena評估框架與OSMO算力架構,NVIDIA正積極打造下一代機器人領域的平台層,吸引從Franka到NEURA Robotics的全球合作夥伴紛紛加入。

1 分鐘閱讀

NVIDIA打造「機器人界Android」的戰略全力加速

今年1月黃仁勳在CES登台時,他提出了定義NVIDIA全年走向的論點:實體AI——嵌入能夠感知現實世界並採取行動之系統中的人工智慧——是公司的下一個疆界。GPU業務建立了NVIDIA;AI訓練與推理業務讓它脫胎換骨;而實體AI,黃仁勳認為,將定義它未來十年的面貌。

這個戰略押注,如今正從願景轉化為產品。2026年4月全國機器人週期間,NVIDIA發布了兩款新的開源模型——Cosmos Reason 2GR00T N1.6——並配套推出一系列開發者工具,旨在大幅加速建構、訓練與部署實體AI系統的速度。此次發布吸引了大批全球機器人公司宣布推出基於NVIDIA技術棧的新機器人平台,顯示NVIDIA成為下一代智慧機器「事實標準平台層」的嘗試正在獲得業界的廣泛回應。

Cosmos Reason 2:理解物理世界的推理模型

Cosmos Reason 2是NVIDIA最新的開源推理視覺語言模型(VLM),專為機器人、自動駕駛汽車及需要理解和推理現實世界的實體AI系統而設計。

模型的核心貢獻是NVIDIA所稱的「時空推理」(spatio-temporal reasoning)能力——追蹤物件如何在空間與時間中移動、變化和互動的能力。對一台在倉庫中導航的機器人而言,這意味著不只是理解當前眼前的狀況,更能預測物件到達時的位置、人類同事的移動軌跡將如何與自身路徑交叉,以及紙箱後方被部分遮擋的物體是否可能造成危險。這種以物理直覺和因果關係為基礎的推理能力,正是能執行預設程序的機器人與能應對全新情況的機器人之間的本質差異。

Cosmos Reason 2提供兩種模型尺寸——2B與8B參數——能夠靈活部署於從工廠現場邊緣裝置到雲端推理伺服器的各種算力環境。模型支援最長25.6萬token的上下文,對需要保存大量觀察記錄和行動歷史的長時程推理任務至關重要。

一項關鍵的實用能力,是針對影片的時間戳標注推理。Cosmos Reason 2能夠處理真實或合成訓練影片,為影片中的事件生成精確的時間戳描述——這一能力大幅加速了機器人學習系統所需標注訓練數據的生成。高品質標注訓練數據的生成,長期以來是實體AI開發中代價最高的瓶頸之一;Cosmos Reason 2直接針對這一約束發起攻勢。

在已公布的基準測試上,Cosmos Reason 2在實體AI推理排行榜上名列前茅,在需要空間理解、物件追蹤和物理推理的任務上,超越了同類開放權重模型。

GR00T N1.6:開源仿人機器人全身控制模型

GR00T N1.6是NVIDIA專為仿人機器人打造的開源視覺語言動作模型(VLA)的最新版本。若說Cosmos Reason 2是感知與推理模型,GR00T N1.6則是動作模型——以視覺觀察和語言指令作為輸入,生成控制機器人全身動作的低階運動指令。

N1.6更新將Cosmos Reason 2的推理能力直接整合進動作執行管線,使仿人機器人在發出運動指令之前,能夠受益於增強的空間理解與因果推理。在實際應用中,這意味著採用GR00T N1.6的機器人,能夠在非結構化環境中處理更複雜的多步驟操作任務——這類任務在歷史上需要大量手工設計的控制邏輯,且在真實世界部署中仍頻繁失敗。

GR00T N1.6開源並在Hugging Face上公開,降低了全球機器人團隊在NVIDIA實體AI技術棧上建構與貢獻的門檻。多家領先的仿人機器人公司——包括Franka RoboticsNEURA RoboticsHumanoid——已宣布使用GR00T工作流程在製造業和物流領域模擬、訓練和驗證新的機器人行為,並正推進真實世界部署。

Isaac Lab-Arena與OSMO:工具層的到位

模型本身並不足以建構機器人系統。此次發布還配套推出了兩項工具更新,完善了開發者平台的面貌:

Isaac Lab-Arena是NVIDIA全新的機器人評估框架,提供標準化基準測試與模擬環境,用於衡量機器人策略性能。在此之前,業界缺乏一種統一的方式來比較不同任務、硬體平台和訓練方案下的機器人表現。Isaac Lab-Arena建立了共同的評估層——這是整個領域系統性進步所不可或缺的基礎設施。

OSMO是NVIDIA面向實體AI工作流程的邊緣到雲端算力協調框架。它簡化了機器人訓練工作負載跨開發環境遷移的過程:工廠現場的數據採集、模擬環境中的合成數據增強、雲端GPU叢集上的大規模強化學習訓練,以及回到機器人邊緣裝置的部署。通過提供統一的算力基礎設施,OSMO消除了歷來使機器人開發遠比軟體開發緩慢的整合開銷。

Isaac Lab-Arena與OSMO合在一起,代表NVIDIA打造「機器人界Android」的嘗試——不只提供晶片和模型,更建立機器人開發者完整開發、測試和交付產品所依賴的全棧平台。其戰略邏輯與Google在智慧型手機時代的佈局如出一轍,且這樣的類比絕非偶然。

全國機器人週與業界動能

此次發布選在全國機器人週進行,是精心設計的品牌定位,旨在鞏固NVIDIA作為全球機器人生態系重心的地位。公司借此時機展示了一系列合作夥伴公告,包括:

  • Serve Robotics在NVIDIA GTC 2026聖荷西大會上現場展示「Maggie」,公司首款具備AI對話能力的配送機器人。
  • 農業機器人在精準農業中的應用,視覺AI模型正在實現自主除草、採收和作物監測。
  • 能源行業機器人部署於環境過於危險或偏遠、人力難以作業的場所進行檢查和維護。
  • 多家合作夥伴的倉儲物流機器人,使用GR00T N1.6執行揀貨、包裝和庫存管理任務。

應用場域的廣度,反映了NVIDIA實體AI戰略背後的核心洞見:在多樣化物理世界數據上訓練的基礎模型,具備特定任務機器人控制器所不具備的泛化能力。一個對物理原理、因果關係和空間關係理解足夠深入的模型,能夠以比從頭重新設計傳統控制系統快得多的速度,針對新的應用場景進行微調。

競爭格局

NVIDIA的實體AI技術棧面臨多方競爭。Google DeepMind的Gemini Robotics計畫——建立在Gemini 3.1多模態能力之上——是基礎模型層最直接的競爭者,尤其聚焦於靈巧操作和物理推理。波士頓動力持續為Atlas開發自有基礎模型,但在開源發布上態度更為謹慎。Figure AI與1X Technologies這兩家融資最多的仿人機器人新創,也在開發針對各自硬體優化的專有VLA模型。

NVIDIA在這場競爭中的結構性優勢,與其AI訓練霸主地位的來源相同:CUDA軟體生態系、用於訓練這些模型的NVIDIA DGX基礎設施,以及用於在機器人上部署的Jetson邊緣算力平台。一個在NVIDIA硬體上訓練、在Jetson上部署的機器人團隊,擁有無縫整合的開發工具鏈——相較於需要從多個廠商拼湊異質基礎設施的競爭者,這是顯著的實際優勢。

實體AI為何是NVIDIA的下一場大戲

NVIDIA投資實體AI的商業邏輯清晰明了。AI訓練與推理市場——雖然仍在快速成長——有一個由建構大型AI系統的公司數量所決定的天花板。而實體AI市場的天花板,則由世界上原則上可被智慧化的機器數量決定:工廠機器人、倉儲系統、配送車輛、建築設備、農業機械,以及終將走進千家萬戶的家用機器人。那個市場比AI軟體市場大上數個數量級。

黃仁勳將這個機會比作從單一用途計算器到通用電腦的轉變。這個類比並不完美,但方向上令人信服。NVIDIA的押注是:從單一用途工業機器人到通用實體AI系統的轉變,將創造出一個與向AI加速算力轉型同等規模的科技平台機會——而提供基礎模型技術棧、訓練基礎設施與部署邊緣算力的公司,將捕獲其中的最大份額。

Cosmos Reason 2與GR00T N1.6,不是這場押注的終點,而是建設進程按計劃推進的最新佐證。

NVIDIA 機器人 實體AI Cosmos GR00T 仿人機器人 基礎模型
分享

相關報導

Cognichip 獲 6,000 萬美元融資,以 AI 設計下一代晶片,Intel 執行長親自入董事會

舊金山新創 Cognichip 利用物理資訊 AI 模型大幅壓縮晶片設計成本與週期,完成由 Seligman Ventures 領投的 6,000 萬美元 A 輪融資。公司宣稱可實現 75% 成本降低與 50% 週期縮短。Intel 執行長 Lip-Bu Tan 加入董事會,為這家旨在顛覆 EDA 工作流程的新創公司送出了業界最重量級的背書。

1 分鐘閱讀

WeRide 攜手 Uber 在杜拜推出全自動無人計程車——車內無安全駕駛,正式商業收費

中國自動駕駛公司文遠知行(WeRide)與 Uber 合作,於 4 月 1 日在杜拜啟動全無人駕駛商業收費計程車服務,成為中東首個商業化全自動無人計程車服務。乘客透過 Uber 應用程式叫車,車內無任何人員,服務覆蓋主要海岸與商業區,並計畫年底前在波灣三城部署 1,200 輛車隊。

1 分鐘閱讀