Genesis AI 發布 GENE-26.5:能下幨、解魔方、彈貴琴的全棧機器人大腦
由 Khosla Ventures 支持的 Genesis AI 發布 GENE-26.5,一個宣稱達到人類水準肢體操控能力的機器人基礎模型,並搭配自研的靈巧機械手與資料採集系統。展示影片顯示系統完成 20 步驟烹飪、空中解魔方、彈奏貴琴和實驗室移液等任務——這些任務過去從未被單一 AI 與硬體堆疊以此精度完整展示。
展示影片從一雙機械手下幨開始——完整 20 個步驟,包括切菜、翻炒和擺盤——全程零人工介入。接著畫面切換到空中解魔方,機械手以競速玩家的流暢速度旋轉每個面。然後是貴琴演奏。然後是實驗室移液。最後是同時抓取四個大小截然不同的物體,再分類放入不同的收納箔。
如果這支影片能通過科學驗證,這將是實體 AI 發展史上的一個重要時刻。由 Khosla Ventures 支持、完成 1.05 億美元種子輪的舊金山新創 Genesis AI,上週發布了 GENE-26.5——一個公司宣稱代表首個達到人類水準肢體操控能力的 AI 系統的機器人基礎模型。公司選擇全棧出擊:不只是模型,還有運行模型的硬體。
GENE-26.5 究竟是什麼
GENE-26.5 是一個用於機器人操控的基礎模型——一個經過訓練、能夠控制靈巧機械手完成廣泛非結構化真實世界任務的單一 AI 系統。與那些被程式化在受限環境中執行特定操作的專業機器人系統不同(例如每天爄接同一個接頭數千次的工業機械臂),GENE-26.5 的設計目標是泛化能力:處理新奇物體、不可預測情況,以及未明確訓練過的任務序列。
這個模型搭配了與中國精密致動器製造商吴極科技(Wuji Tech)合作開發的自研靈巧機械手。這雙手設計為人類尺度,自由度與人手相同,能夠將人類示範任務直接轉移到機器人執行。
這裡,資料策略就顯得尤為關鍵。Genesis 使用一只配備感測器的資料手套,在人手、手套和機械手之間建立 1:1:1 的對映關係。人類戴著手套示範任務,動作資料直接被捕捉為訓練資料。公司聲稱這個方法以傳統替代方案百分之一的成本,收集到多達五倍的可用訓練資料。
訓練管道再通過一個自研的模擬環境——Genesis 描述為「AI 訓練 AI 的自我演化循環」——生成的合成場景泛化訓練分布,無需額外的物理示範。公司表示,這讓訓練和評估的速度比傳統物理測試「快出數個數量級」。
技術主張及其解讀方式
Genesis「人類水準肢體操控」的主張需要一些拆解。人手具有非凡的能力——能對易碟物體施加精準、可變的力道,透過皮膚感知紋理和溫度,並在毫秒內調整抓握以防滞落。目前沒有任何機器人系統能在人手任務的完整範圍內達到這個水準。
GENE-26.5 看來展示的,是在特定、精心策劃的操控任務組合上的人類水準表現——也就是展示影片中展示的那些任務。這些任務確實令人印象深刻:空中解魔方需要大多數機械手難以持續的快速、精準多手指協調;20 步驟烹飪需要在數十種不同形狀、重量和質地的物體之間進行泛化。
但「人類水準肢體操控」作為通用主張,需要在機器人未經特定訓練或微調的任務上也能良好表現——這個領域所稱的「開放世界靈巧性」基準測試。相關評估結果尚未發表。獨立研究人員需要在未見過的任務上測試 GENE-26.5,才能驗證更廣泛的主張。
話雖如此,展示任務本身代表了一個有意義的進步。大多數機器人操控研究展示的是單一任務或非常狹窄的任務族群。一個能夠在單一模型和硬體堆疊中處理烹飪、解謎、樂器演奏和實驗室工作的系統——即使這些任務是經過特定訓練的——也是一種與過去公開展示截然不同的能力類別。
全棧作為戰略選擇
選擇同時發布模型和硬體,是 Genesis 最關鍵的战略决定。幾乎所有其他主要的機器人 AI 公司——Google DeepMind 的機器人部門、Physical Intelligence(Pi)、Covariant 等——都在開發設計用來在合作廠商硬體上運行的模型軟體。Genesis 押注的是:硬體與軟體的协同設計能夠實現純軟體方法無法達到的性能。
這個論點有歷史先例:Apple 在行動運算中的競爭優勢,長期建立在其自研晶片與 iOS 的緊密整合上。Tesla 完全自動駕駛的開發,得益於同時擁有硬體和訓練資料管道。在機器人領域,感測器資料手套相當於 Tesla 的車隊資料——一種難以復製、且隨時間複利累積的自有輸入。
全棧方式也改變了市場進入策略。Genesis 不是在销售客戶可以插入現有硬體的軟體授權。它销售的是一套完整系統——模型、機械手和資料平台——這很可能意味著更高的平均售價、對客戶體驗的更強改控,以及更長的销售週期。企業製造、物流和實驗室自動化是最明顯的目標市場。
Genesis 在實體 AI 競賽中的位置
2026 年的機器人 AI 領域競爭激烈程度前所未有。Google DeepMind 的 Gemini Robotics ER 模型(驅動 Boston Dynamics 的 Spot 和其他平台)已展示出跨操控和導航任務的強大泛化能力。Physical Intelligence 在 2025 年融資逾 4 億美元,並已將 pi0 部署到生產環境。Figure AI 和 Agility Robotics 更偶向全身人形機器人的市場端。中國的宇樹科技 IPO 正在進行中。
Genesis 的差異化是「窄而深」的:它押注靈巧手部操控——具體而言是人手精細動作控制的能力範圍——是能夠解鎖最具經濟價値用例的能力缺口,尤其在近代工業機器人無法應付所需多樣性和精度的製造和實驗室場景。
1.05 億美元的種子輪按任何歷史標準都屬于巨額,但相對於實體 AI 中正在部署的資本而言仍屬小規模。如果 GENE-26.5 的能力能通過獨立評估,一輪規模大得多的融資很可能隨之而來。更迫切的問題是,Genesis 能否展示模型在實際客戶環境中運作——不是在精心策劃的展示任務上,而是在工業部署所需的雜亂、多變的真實世界條件下。
目前,這支展示影片是今年機器人操控領域最引人入勝的展示之一。整個領域都在密切關注獨立評估的結果。