跳至主要內容
FAQ

Grok 5 錯過第一季發布,xAI 將 Colossus 2 超算擴容至 1.5 GW

xAI 傳聞中擁有 6 兆參數混合專家架構的 Grok 5 未能在 2026 年第一季如期發布,目標改為第二季。馬斯克確認,位於田納西州孟菲斯的 Colossus 2 超算正從 1 GW 擴充至 1.5 GW,為日後的模型微調與大規模推理提供算力支撐。

1 分鐘閱讀

馬斯克年初確認 Grok 5 將在 2026 年第一季發布時,這個承諾加入了一份越來越長的名單——AI 模型發布日期,雄心永遠走在實際之前。第一季在 3 月 31 日悄然結束,Grok 5 依然不見蹤影。現在,xAI 的旗艦模型目標改成了第二季,而公司對「第二季」究竟意味著哪個月份保持著刻意的沉默。

這次延誤的意義,超越了平常圍觀 AI 發布時程的看熱鬧心態。Grok 5 是 xAI 押注競爭地位的核心資產:傳聞中採用混合專家(MoE)架構、擁有 6 兆(6 trillion)參數——如果這個數字屬實,將是公開可用模型中參數量最大的存在。作為參照,GPT-4o 估計約有 2,000 億參數;Meta 的 Llama 4 Scout 在 4,000 億總參數的 MoE 架構中使用約 1,090 億活躍參數。6 兆參數的模型屬於完全不同量級的工程挑戰。

為何延誤

xAI 沒有公開說明推遲的原因,但熟悉公司技術運作的消息人士指出兩個相互關聯的因素:在前所未有的參數規模下維持訓練穩定性的挑戰,以及超算擴容工程的完工時間晚於計畫。

訓練 6 兆參數模型並不只是把較小模型的流程放大而已。工程挑戰隨規模非線性增長——損失值突刺(loss spikes)、檢查點不穩定、梯度流問題在模型需要數十萬 GPU 小時才能從頭重跑的情況下,診斷和修復的難度呈指數級上升。業界消息人士透露,xAI 在 1 月遭遇了至少一次嚴重的訓練不穩定事件,需要回滾並對 MoE 路由架構進行額外調優。

位於田納西州孟菲斯的 Colossus 2 超算是 Grok 5 訓練的物理基礎。馬斯克確認,這座設施正從最初的 1 GW(吉瓦)電力容量擴充至 1.5 GW——增幅 50%。新增算力的主要用途是支援 Grok 5 主訓練完成後的微調與大規模推理,而非加速訓練本身。這一排序意味著,xAI 更在意把 Grok 5 做對,而非做快。

參數規模的迷思

6 兆這個數字需要一些背景脈絡來理解。在混合專家架構中,並非所有參數都在每次推理時被啟用。MoE 模型將每個輸入 token 路由至一組「專家」子網路,通常每次只啟用約 10–15% 的總參數。這意味著 6 兆參數的 MoE 模型,實際活躍參數可能在 6,000 億至 9,000 億之間——依然龐大,但與原始數字所暗示的效能和成本樣貌截然不同。

MoE 架構也是 Grok 3 在 2026 年初展現競爭力的關鍵因素之一。Grok 3 在程式碼、數學和長上下文推理基準上的成績相當亮眼,分析人士認為這得益於 MoE 設計帶來的效率優勢。Grok 5 似乎將同樣的架構哲學推向極致——追求極高的原始參數密度,同時借助 MoE 路由將推理成本控制在合理範圍。

Colossus 2:基礎設施賭注

孟菲斯超算代表著 AI 史上最激進的資料中心建設之一。第一期於 2024 年底上線,搭載初始 10 萬張 Nvidia H100 GPU 和 200 MW 電力;後續擴容將其推至 1 GW,使其成為全球最大的 AI 專用算力設施之一。目前擴充至 1.5 GW 的工程完成後,它將進入全球僅有寥寥幾座的超大型超算行列。

對 xAI 而言,Colossus 2 不只是一個訓練設施,更是一份關於垂直整合的長期承諾。不同於向微軟 Azure 和 Google Cloud 租用算力的 Anthropic 和 OpenAI,xAI 自有其主要的訓練和推理基礎設施。這帶來了更嚴格的訓練過程掌控、規模化後更低的推理成本,以及不受雲端巨頭擺布的談判籌碼。但代價是:當 Colossus 2 出問題時——停電、硬體故障、訓練不穩定——沒有廠商支援可以升級,所有工程挑戰都必須內部消化。

擴充後的 1.5 GW 容量據報還將支撐 xAI 日益壯大的商業 API 業務。現任旗艦 Grok 4.20 Beta 2 已積累了相當數量的企業客戶,他們透過 xAI API 處理推理密集型任務。一旦 Grok 5 上線,xAI 需要同時支撐研究和商業負載的推理量能——這正是提前投入基礎設施的邏輯所在。

競爭態勢

Grok 5 的延誤給了競爭對手喘息空間。截至 2026 年第一季末,前沿模型格局如下:GPT-5.4(OpenAI)在智能體任務基準和百萬 token 上下文視窗上領先;Anthropic 的 Claude Mythos 正進行內部測試,傳聞能力實現「跨越式提升」;Google Gemini 3.1 Pro 在多模態任務上表現穩健;DeepSeek V4 預計數週內發布,可能再次顛覆定價基準。

Grok 5 的延誤意味著 xAI 在所有主要競爭對手都在積極發布或預覽下一代能力的當口,沒有任何新前沿模型可供展示。現任的 Grok 4.20 Beta 2 在部分基準上有競爭力,但從未被定位為能與 GPT-5 級別模型長期抗衡的產品。每多延誤一週,xAI 就面臨更高的企業 API 客戶流失風險。

預測市場目前給出 Grok 5 在 2026 年 6 月 30 日前發布的機率約為 33%,而就在兩個月前,這一數字還高達 70%。

xAI 的賭注

延誤以特定的方式考驗著 xAI 的品牌敘事。公司一直將自己定位為技術上最有野心的實驗室——那個敢於押注其他人認為操之過急的規模和架構的那個。6 兆參數是這種野心最直白的外化表達。如果 Grok 5 最終上線時兌現了傳聞中的能力——在硬科學和數學上的強勁表現、延展的推理鏈條、有競爭力的每 token 成本——這次延誤很快會被遺忘。如果在龐大硬體投資之後,它的到來伴隨著顯著低於預期的表現,這套敘事就會變得難以為繼。

目前,公司專注於把訓練做對。基礎設施還在擴張。現有模型仍然在支付用戶帳單。而馬斯克——罕見地——在公開場合對時程收起了慣常的豪言。這份克制,或許比任何官方聲明都更能說明 Colossus 2 裡真實發生著什麼。

xAI Grok 5 Colossus 2 馬斯克 大型語言模型 混合專家架構 AI 基礎設施
分享

相關報導