Grok 5 錯過第一季發布，xAI 將 Colossus 2 超算擴容至 1.5 GW

xAI 傳聞中擁有 6 兆參數混合專家架構的 Grok 5 未能在 2026 年第一季如期發布，目標改為第二季。馬斯克確認，位於田納西州孟菲斯的 Colossus 2 超算正從 1 GW 擴充至 1.5 GW，為日後的模型微調與大規模推理提供算力支撐。

2026年4月5日 1 分鐘閱讀

馬斯克年初確認 Grok 5 將在 2026 年第一季發布時，這個承諾加入了一份越來越長的名單——AI 模型發布日期，雄心永遠走在實際之前。第一季在 3 月 31 日悄然結束，Grok 5 依然不見蹤影。現在，xAI 的旗艦模型目標改成了第二季，而公司對「第二季」究竟意味著哪個月份保持著刻意的沉默。

這次延誤的意義，超越了平常圍觀 AI 發布時程的看熱鬧心態。Grok 5 是 xAI 押注競爭地位的核心資產：傳聞中採用混合專家（MoE）架構、擁有 6 兆（6 trillion）參數——如果這個數字屬實，將是公開可用模型中參數量最大的存在。作為參照，GPT-4o 估計約有 2,000 億參數；Meta 的 Llama 4 Scout 在 4,000 億總參數的 MoE 架構中使用約 1,090 億活躍參數。6 兆參數的模型屬於完全不同量級的工程挑戰。

為何延誤

xAI 沒有公開說明推遲的原因，但熟悉公司技術運作的消息人士指出兩個相互關聯的因素：在前所未有的參數規模下維持訓練穩定性的挑戰，以及超算擴容工程的完工時間晚於計畫。

訓練 6 兆參數模型並不只是把較小模型的流程放大而已。工程挑戰隨規模非線性增長——損失值突刺（loss spikes）、檢查點不穩定、梯度流問題在模型需要數十萬 GPU 小時才能從頭重跑的情況下，診斷和修復的難度呈指數級上升。業界消息人士透露，xAI 在 1 月遭遇了至少一次嚴重的訓練不穩定事件，需要回滾並對 MoE 路由架構進行額外調優。

位於田納西州孟菲斯的 Colossus 2 超算是 Grok 5 訓練的物理基礎。馬斯克確認，這座設施正從最初的 1 GW（吉瓦）電力容量擴充至 1.5 GW——增幅 50%。新增算力的主要用途是支援 Grok 5 主訓練完成後的微調與大規模推理，而非加速訓練本身。這一排序意味著，xAI 更在意把 Grok 5 做對，而非做快。

參數規模的迷思

6 兆這個數字需要一些背景脈絡來理解。在混合專家架構中，並非所有參數都在每次推理時被啟用。MoE 模型將每個輸入 token 路由至一組「專家」子網路，通常每次只啟用約 10–15% 的總參數。這意味著 6 兆參數的 MoE 模型，實際活躍參數可能在 6,000 億至 9,000 億之間——依然龐大，但與原始數字所暗示的效能和成本樣貌截然不同。

MoE 架構也是 Grok 3 在 2026 年初展現競爭力的關鍵因素之一。Grok 3 在程式碼、數學和長上下文推理基準上的成績相當亮眼，分析人士認為這得益於 MoE 設計帶來的效率優勢。Grok 5 似乎將同樣的架構哲學推向極致——追求極高的原始參數密度，同時借助 MoE 路由將推理成本控制在合理範圍。

Colossus 2：基礎設施賭注

孟菲斯超算代表著 AI 史上最激進的資料中心建設之一。第一期於 2024 年底上線，搭載初始 10 萬張 Nvidia H100 GPU 和 200 MW 電力；後續擴容將其推至 1 GW，使其成為全球最大的 AI 專用算力設施之一。目前擴充至 1.5 GW 的工程完成後，它將進入全球僅有寥寥幾座的超大型超算行列。

對 xAI 而言，Colossus 2 不只是一個訓練設施，更是一份關於垂直整合的長期承諾。不同於向微軟 Azure 和 Google Cloud 租用算力的 Anthropic 和 OpenAI，xAI 自有其主要的訓練和推理基礎設施。這帶來了更嚴格的訓練過程掌控、規模化後更低的推理成本，以及不受雲端巨頭擺布的談判籌碼。但代價是：當 Colossus 2 出問題時——停電、硬體故障、訓練不穩定——沒有廠商支援可以升級，所有工程挑戰都必須內部消化。

擴充後的 1.5 GW 容量據報還將支撐 xAI 日益壯大的商業 API 業務。現任旗艦 Grok 4.20 Beta 2 已積累了相當數量的企業客戶，他們透過 xAI API 處理推理密集型任務。一旦 Grok 5 上線，xAI 需要同時支撐研究和商業負載的推理量能——這正是提前投入基礎設施的邏輯所在。

競爭態勢

Grok 5 的延誤給了競爭對手喘息空間。截至 2026 年第一季末，前沿模型格局如下：GPT-5.4（OpenAI）在智能體任務基準和百萬 token 上下文視窗上領先；Anthropic 的 Claude Mythos 正進行內部測試，傳聞能力實現「跨越式提升」；Google Gemini 3.1 Pro 在多模態任務上表現穩健；DeepSeek V4 預計數週內發布，可能再次顛覆定價基準。

Grok 5 的延誤意味著 xAI 在所有主要競爭對手都在積極發布或預覽下一代能力的當口，沒有任何新前沿模型可供展示。現任的 Grok 4.20 Beta 2 在部分基準上有競爭力，但從未被定位為能與 GPT-5 級別模型長期抗衡的產品。每多延誤一週，xAI 就面臨更高的企業 API 客戶流失風險。

預測市場目前給出 Grok 5 在 2026 年 6 月 30 日前發布的機率約為 33%，而就在兩個月前，這一數字還高達 70%。

xAI 的賭注

延誤以特定的方式考驗著 xAI 的品牌敘事。公司一直將自己定位為技術上最有野心的實驗室——那個敢於押注其他人認為操之過急的規模和架構的那個。6 兆參數是這種野心最直白的外化表達。如果 Grok 5 最終上線時兌現了傳聞中的能力——在硬科學和數學上的強勁表現、延展的推理鏈條、有競爭力的每 token 成本——這次延誤很快會被遺忘。如果在龐大硬體投資之後，它的到來伴隨著顯著低於預期的表現，這套敘事就會變得難以為繼。

目前，公司專注於把訓練做對。基礎設施還在擴張。現有模型仍然在支付用戶帳單。而馬斯克——罕見地——在公開場合對時程收起了慣常的豪言。這份克制，或許比任何官方聲明都更能說明 Colossus 2 裡真實發生著什麼。

資料來源

xAI Grok 5 Colossus 2 馬斯克大型語言模型混合專家架構 AI 基礎設施

Grok 5 錯過第一季發布，xAI 將 Colossus 2 超算擴容至 1.5 GW

為何延誤

參數規模的迷思

Colossus 2：基礎設施賭注

競爭態勢

xAI 的賭注

資料來源

相關報導

開源 LLM 大戰：Llama 4 vs Mistral Large vs Qwen 3 — 到底誰贏了？

Anthropic「Claude Mythos」外洩：史上最強 AI 模型，也是最嚴峻的資安威脅

DeepSeek V4 即將發布：1 兆參數、Apache 2.0、訓練成本僅 520 萬美元