Gemini 3.5 Pro 即將登場:谷歌旗艦模型主打200萬Token上下文與深度推理
谷歌執行長皮查伊在5月I/O大會上承諾「下個月見」的Gemini 3.5 Pro,預計最快數日內正式上線——目標是200萬Token上下文視窗、「深度思考」推理模式,以及可能低於Claude Opus 4.7與GPT-5.5的積極定價。更關鍵的是:Fable 5遭政府下架製造的市場空缺,讓谷歌迎來一個意外的絕佳入局時機。
5月19日,谷歌I/O大會上,桑達爾·皮查伊(Sundar Pichai)說了一句讓現場開發者集體皺眉的話:「再給我們一個月。」萬眾期待的前沿模型Gemini 3.5 Pro還沒準備好。四週過後,6月15日到來,「下個月」的期限幾乎走到了頭——所有跡象都指向:等待即將結束。
Gemini 3.5 Pro預計最快數日內正式開放,這將是2026年最受矚目的模型發布之一。視最終規格而定,它也可能成為谷歌有史以來在前沿AI領域推出的最具競爭力的產品。
目前已知的規格
谷歌公開的確認資訊依然刻意保持稀少。皮查伊在I/O演講中確認了兩項重點:200萬Token的上下文視窗,以及一個稱為「深度思考」(Deep Think)的推理模式。但在正式發布前,谷歌尚未公布跑分、定價或具體的模型代號。
200萬Token的上下文視窗,相當於5月份發布的Gemini 3.5 Flash(100萬Token)的兩倍。在這個規模下,Gemini 3.5 Pro可以在單次推論中處理約1,500篇密集學術論文,或一個大型企業程式碼庫的全部內容。這直接與Claude的長上下文能力形成對位,也是相較於GPT-5.5尚未公告同等長度上下文的真實差異化。
「深度思考」模式是谷歌對推論時間運算(inference-time compute)的回應——讓模型在給出答案前先進行內部推理,用額外的Token做深度思考再輸出結果。OpenAI以o1和o3率先開闢這條路,Anthropic在Fable 5中整合了類似的延伸思考能力,Gemini 3.5 Pro現在也要跟進。關鍵問題是:谷歌的實作品質能否真正達到與競爭對手媲美的推理水準,還是只是跟隨者的追趕之作。
Gemini 3.5 Flash 已經洩露了什麼訊息
5月份的Flash發布提供了有用的早期信號。Flash在開發者關鍵任務上的表現優於Gemini 3.1 Pro:Terminal-Bench提升5.9%,Finance Agent v2提升14.9%,顯示底層架構有實質性改進。然而,Flash在推理和長上下文檢索上出現明顯退步:Humanity’s Last Exam跑分下降4.2%,128k上下文召回率比3.1 Pro低7.6分。
這個退步模式,恰恰告訴你Gemini 3.5 Pro是為了什麼而生的。Pro的定位,顯然是在維持Flash展示的代理任務與程式設計能力進步的同時,把推理能力拉回前沿水準。如果谷歌成功了,Pro應該在所有任務類別上都大幅超越3.1 Pro,同時加入Flash刻意略去的上下文視窗和深度思考能力。
定價的算盤
追蹤Gemini 3.5系列的分析師預測,Pro的定價約在每百萬輸入Token 3美元、每百萬輸出Token 18美元的區間——相較於Claude Opus 4.7(5美元/25美元)和GPT-5.5(5美元/30美元),競爭力十足。在這個價位,Gemini 3.5 Pro將以競爭對手約60%的成本,提供相當甚至更好的性能。
Flash的定價是每百萬Token 1.5美元/9美元,比Gemini 3.1 Pro便宜40%——顯示谷歌正刻意壓縮整個模型系列的價格曲線。Pro定在3美元/18美元,符合同一邏輯:以設計來奪取Anthropic和OpenAI開發者市場份額的定價,提供旗艦推理能力。
這個定價策略反映了谷歌的結構性成本優勢。擁有業內規模最大的自有TPU叢集,谷歌運行推論的成本比依賴亞馬遜、xAI和雲端供應商的Anthropic,或在微軟Azure上運行的OpenAI都低。這個成本優勢轉化為API定價後,是谷歌在模型競賽中最有力的競爭工具之一。
沒人預料到的競爭機會
谷歌的發布時機意外收到了一份禮物。6月12日美國政府的出口管制命令讓Anthropic的Fable 5和Mythos 5全線下線,在前沿模型層頂端製造了突然的真空。在Fable 5上建立生產管線的企業團隊,現在正在四處尋找替代方案。「硬體主權」討論——開發者探索多廠商API策略和本地部署選項——急速加速。
Gemini 3.5 Pro的即將上線,正好填補這個空缺。谷歌的模型不受制於Anthropic所面臨的同等出口管制動態(Fable 5是美國原生模型,處於嚴格政府審查下;谷歌的Gemini透過Google Cloud以不同的法規姿態運營)。對於需要穩定且商業可用的前沿模型的企業團隊,Gemini 3.5 Pro在競爭對手下線時提供了延續性。
開源模型的維度同樣值得關注。Moonshot AI的Kimi K2.7 Code在Fable 5被召回後在開發者社群爆紅,正是因為開源權重模型不受政府關閉令影響。Gemini 3.5 Pro不是開源——但如果它以具競爭力的性能登場,將把谷歌定位為Anthropic事件所暴露的集中風險之外的穩定、多元化替代選項。
規格之外,這次發布的更深意義
Gemini 3.5系列代表了谷歌迄今為止最清晰的證據:它已解決內部AI協調問題。整個2023和2024年,谷歌的AI策略一直受困於Google Brain與DeepMind的分裂、隨後的組織合併,以及Bard和Gemini 1.0早期的多次失誤。Gemini 1.5 Pro在2024年初展示100萬Token上下文是真正的技術突破,卻被反覆的部署失敗和跑分爭議所削弱。
Flash在5月的表現——按時發布、有開發者可驗證的跑分、即時吸引企業關注的定價——暗示谷歌的執行能力已根本性改善。如果Pro按照皮查伊的承諾如期發布,且性能與Flash展示的架構改進相匹配,這將是谷歌已重建前沿競爭能力的最清晰信號。
谷歌(Gemini 3.5 Pro)、Anthropic(Fable 5,等待恢復上線時)、OpenAI(GPT-5.5及下一個尚未宣布的版本)三方之間的競賽,是2026年中AI的核心戲碼。谷歌即將落子。