OpenAI GPT-6「Spud」錯過 4 月 14 日視窗,預測市場給出 78% 機率於 5 月前上線
OpenAI 代號「Spud」的下一代旗艦模型(外界預期命名為 GPT-6)已於 3 月 24 日在德州艾比林的 Stargate 資料中心完成預訓練,但 4 月 14 日的廣傳發布日期悄悄過去,毫無動靜。預測市場目前給出 78% 的機率認為將在 4 月底前發布,傳聞性能較 GPT-5.4 提升 40%,並搭載 200 萬 token 上下文視窗。
4 月 14 日,AI 圈屏住呼吸——然後帶著些許失望緩緩吐氣。OpenAI 的下一代旗艦模型,代號「Spud」,外界普遍預期將以 GPT-6 之名公開亮相,卻在這個流傳數週的「預定發布日期」悄無聲息地過去:openai.com 沒有任何發布貼文,Sam Altman 的 X 帳號沒有任何宣告,API 存取沒有任何開放。日期就這樣過去了,等待仍在繼續。
但預訓練層面的基本事實並無爭議。多個可信 AI 研究追蹤機構確認,Spud 已於 2026 年 3 月 24 日在德州艾比林(Abilene)的 Stargate 資料中心完成訓練——這裡是 OpenAI、軟銀、Oracle 與 NVIDIA 聯合打造的兆美元級 Stargate 合資企業的實體核心。模型已經存在,據一切消息來源,它是 OpenAI 有史以來訓練出的最強語言模型。唯一的問題是:什麼時候上線?
截至 4 月 16 日,預測市場給出 78% 的機率認為 Spud/GPT-6 將在 4 月 30 日前發布,下注最集中的窗口是 4 月 21 日至 5 月 5 日。市場的定價反映的是短暫延誤——後處理工作如安全評估、紅隊測試、微調與基礎設施擴展——而非任何根本性的方向調整。
我們目前對 Spud 的認知
OpenAI 尚未公開任何架構論文、參數量、訓練資料說明、基準測試套件、定價表、發布日期,甚至連確認的正式名稱都沒有。AI 研究社群所拼湊出的,是一幅由洩露資訊、推理推算與預測市場活動組成的拼圖——每一片都應視為未經官方證實的資訊,直到 OpenAI 正式發布。
流傳最廣的性能說法是:在 OpenAI 內部 GDPval 基準測試上,Spud 較 GPT-5.4 提升 40%。GPT-5.4 於 2026 年 3 月發布時,以 83% 的成績創下知識工作任務的紀錄。若 40% 提升屬實,Spud 在 GDPval 上的得分約達 116%——若這個數字有意義,將代表模型能力的質變,而非漸進改善。
上下文視窗據傳達 200 萬 token,是 GPT-5.4 的 100 萬 token 視窗的兩倍。對於在大型程式碼庫、冗長文件語料庫或多階段 Agentic 工作流程中部署模型的企業用戶,這一擴展意義重大——200 萬 token 視窗可以輕鬆容納一個中型軟體專案的完整程式碼、一整本書,或數週的對話記錄,無需截斷。
在推理能力方面,多個分析來源指出 Spud 在多步驟推理任務上的架構改進顯著,在複雜鏈式推論挑戰上明顯強於 GPT-5.4。若獲確認,這將直接衝擊 Anthropic Claude Sonnet 4.6 目前在 GDPval-AA Elo 排行榜上的推理領先地位——這個位置自 2 月發布以來一直由 Anthropic 守住。
這一刻的戰略意涵
Spud 的發布時機,遠不只是基準測試競爭那麼簡單。OpenAI 正同時推進幾條平行線,而這次模型發布與每條線都有交集。
IPO 軌道。 OpenAI 2026 年第一季已超過 250 億美元年化營收,據報導正在為最早 2026 年底的上市計畫鋪路。在準備工作密集化前夕的一次重大模型發布,既是營收催化劑,也是投資人評估技術路線圖的有力論據。OpenAI 內部幾乎確定有一個將 Spud 發布時機與 IPO 準備日程連結的計畫決策。
模型競爭。 當前的前沿模型排行榜競爭激烈程度前所未有。Anthropic 的 Claude Opus 4.6 在多項複雜推理基準上領先;Google 的 Gemini 3.1 Pro 在視覺任務上的多模態能力媲美乃至超越 GPT-5.4;xAI 的 Grok 4.20 Beta 2 在即時資訊存取上佔據利基。Spud 需要讓 OpenAI 在多個維度上重返明確的前沿領先地位——這一地位從 2023 年初 GPT-4 發布到 GPT-5 世代一直屬於 OpenAI,但自此後競爭日趨白熱化。
超級應用建設。 OpenAI 正在重新聚焦策略,圍繞業內人士描述的「超級應用」——整合 ChatGPT、運營商 API、程式設計工具,最終納入環境計算的一體化平台。Spud 的發布預計將驅動這一平台的下一代,傳聞整合功能包括強化的電腦使用能力、具情感表達幅度的原生語音,以及跨 iOS 和 Windows 設備的更深度整合。
為何 4 月 14 日落空
AI 社群對這次「落空」提出了幾種理論。技術上最站得住腳的解釋是:後訓練工作——包括對齊、RLHF、安全評估與微調階段——花費的時間比外部追蹤者預估的更長。預訓練在 3 月 24 日完成、三週後訓練窗口指向 4 月 14 日;若需五週則指向 4 月底。
另一種帶有政治色彩的理論涉及馬斯克對 OpenAI 的訴訟。馬斯克 1340 億美元的訴訟——主張 OpenAI 轉型為營利結構違反了其原始的公益使命——正在法庭推進。部分分析人士猜測,OpenAI 法律團隊可能建議暫時延後,避免重大模型發布與庭審前特別敏感的階段重疊。這一理論未獲證實,可能只是時間點上的巧合解讀。
第三種可能純屬商業考量:OpenAI 可能在協調企業客戶的就緒時間,確保最大 API 客戶——包括在 Copilot 和 Azure 全線整合 OpenAI 模型的微軟——有充裕時間在公開發布(屆時流量將立即切換)前完成對新模型的測試。
值得關注的信號
在官方公告出現之前,幾個指標可能提示 Spud 發布進入倒數。獨立監控服務的 API 使用模式——追蹤數百萬次調用中的模型行為——歷史上在 OpenAI 重大發布前的 24–48 小時,都曾出現異常延遲與行為變化,因為公司在遷移內部基礎設施。LMSYS Chatbot Arena 等平台的模型基準排行榜,在新旗艦出現前也往往會出現短暫波動。
在技術信號之外,請密切關注 Sam Altman 在 X 上的發文頻率。Altman 有個規律:在重大公告前 24–48 小時進入靜默期,之後是一批為發布定調的密集貼文。若這個模式在 Spud 身上再次應驗,他的沉默將比任何洩露更有說服力。
即將出現的模型,將是繼 GPT-5 之後最具分量的 AI 發布——或許甚至自 GPT-4 以來最重要的一次。此刻,等待的時間以天計算。