DeepSeek V4 在華為晶片上全速運行,美國升級 AI 竊密指控
中國 DeepSeek 發布針對華為昇騰處理器優化的 1.6 兆參數 V4 模型,以遠低於西方競爭對手的價格提供接近前沿的性能。此次發布正值美國官員指控中國企業對美國 AI 智慧財產權發動「工業規模竊密行動」之際,北京方面則予以否認。
DeepSeek V4 在華為晶片上全速運行,美國升級 AI 竊密指控
杭州 AI 實驗室 DeepSeek——其背後是量化對沖基金幻方科技——發布了迄今最強大的模型:一個擁有 1.6 兆參數的混合專家架構,稱為 V4-Pro,完全在華為昇騰 910C 處理器上完成訓練,未使用任何輝達硬體。這款模型在四月下旬預覽版之後正式亮相,標誌著中國 AI 研發繞過美國半導體出口管制找到可信路徑的最重要示範。
時機絕非偶然。華盛頓同步加大施壓,高層官員正式指控 DeepSeek 等中國 AI 實驗室發動政府文件所稱的「工業規模行動」,透過系統性蒸餾及資料投毒攻擊竊取美國模型的智慧財產權。北京外交部則將這些指控斥為「毫無根據」。
模型實力究竟如何
V4-Pro 規模龐大——256 個專家共 1.6 兆總參數,推理時啟動約 370 億參數——在原始參數量上可與 GPT-5.4 及 Gemini 3.1 Pro 相提並論。DeepSeek 的技術報告坦承 V4「略遜於」這些前沿模型,估計發展落差約三至六個月。相較於早期版本與業界頂尖差距達 12 至 18 個月,這已是顯著的追趕。
較小的伴侶模型 V4-Flash 提供 2,840 億參數版本,成本大幅降低,目標是旗艦版不適合的延遲敏感應用場景。
100 萬 token 的情境視窗是另一亮點。在情境長度成為主要競爭維度的當下——Gemini 3.5 Pro 最近擴展至 200 萬 token,Anthropic 的 Mythos 系列也有相近的長視窗——V4 仍與西方頂尖替代方案保持競爭距離。
定價武器
DeepSeek 的顛覆性從來不只在於原始能力,而在於價格。V4-Pro 起步定價為每百萬輸出 token 3.48 美元;OpenAI 同級別收費 30 美元,Anthropic 收費 25 美元。兩者之間是約 8 至 10 倍的成本差距,而兩款模型的實際應用高度重疊。V4-Flash 更以每百萬 token 0.28 美元,甚至比西方最精簡的小模型還便宜。
「隨著華為下半年擴大昇騰 950 生產規模,定價還可能進一步下降,」公司在發布聲明中表示——暗示 DeepSeek 的競爭優勢是結構性的,而非短期促銷策略。
金融市場隨即作出反應。製造華為昇騰晶片的中芯國際(SMIC)股價當日跳漲 10%;中國 AI 同業 MiniMax 和知識地圖的股價則各跌逾 9%,投資人開始重新計算競爭格局。
華為矽晶片的故事
V4 在技術層面更具意義之處,在於晶片架構的突破。在此之前,在輝達 H100/H200/GB200 供應鏈之外訓練大型前沿模型,被普遍認為幾乎是理論上的可能。V4 似乎改變了這一判斷。
包含華為技術的研究團隊展示了以至少 1,000 片昇騰 910C 晶片完成 V4-Pro 完整參數後訓練——這在集群協調規模上本身就是重大工程成就。華為確認其完整昇騰超節點產品線「第零天相容」,包括目前進入有限量產的較新 950 系列處理器。
此一地緣政治意涵深遠:中國現在擁有至少一套本土模型訓練架構,能夠在無需任何輝達產品的情況下,生產處於前沿邊界的成果。而這,在 2022 年 10 月拜登政府實施首輪出口管制時,被普遍認為是遙不可及的。
與此同時,華為預計 2026 年 AI 晶片營收達 120 億美元,因為本土需求正在吸收原本歸輝達的訂單。自最近一輪出口管制收緊以來,美國公司在中國的市場占有率已實際歸零。
智慧財產權爭議
美方官員在模型發布消息的同時,也升級了 AI 智慧財產權竊密指控。具體指控的核心是模型蒸餾——透過 API 存取美國前沿模型,訓練學生模型模仿其輸出——美國政府文件指稱中國實驗室在出口限制關閉此途徑之前,已在「工業規模」上進行此類操作。
DeepSeek 早期的 V2、V3 版本引發了類似指控,尤其是分析人員在 V3 輸出中發現被部分研究者歸因於從 GPT-4 及 Claude 3 系列蒸餾的回應模式之後。DeepSeek 在所有情況下均予否認。
V4 對上述指控提出了部分答案:由於它在華為硬體上從頭訓練,未使用美國模型 API 的 RLHF 回饋,蒸餾攻擊面在同等程度上根本不存在。然而,美國政府是否因此滿意,仍是未知數——尤其是那些超越 API 蒸餾的更廣泛架構和資料竊取指控,尚未獲得解答。
對企業和開發者的影響
對於在美國出口管制體制之外運作的企業及開發者而言,V4 是真正具競爭力的替代方案。長情境視窗、具競爭力的基準性能,加上旗艦版不到 4 美元的定價,為文件分析、程式碼審查、RAG 管線等高吞吐量推理應用創造了引人注目的選擇——在這些場景中,西方前沿模型的成本在規模化時將變得難以承受。
V4 基於華為的原生架構確實帶來某些限制:依賴輝達優化工具鏈(CUDA 核心、TensorRT、大多數主流 MLOps 平台)的部署環境需要調適。DeepSeek 已發布昇騰專用文件及相容層,但開發者工具的成熟度仍不及輝達生態系。
對於在中國境內或受美國科技政策限制較小的市場運作的企業,這些摩擦點可能會隨著生態系發展而迅速消退。問題是,這套替代技術架構要多快才能滲透到全球企業採購決策之中。
地緣政治的轉折點
V4 發布的時間節點,正是美國晶片管制雙向緊繃的當口。川普政府於 2026 年 6 月進一步收緊限制,將禁令擴大至境外中資附屬企業。與此同時,V4 的發布清楚顯示,這些管制並未凍結中國 AI 能力——它們只是將其重新導向了本土硬體。
「我們不再生活在那個可以假設 AI 進步取決於輝達晶片存取的世界,」一位獲悉 V4 架構簡報的業界分析師說。「那個假設正是出口管制策略的基礎。」
V4 究竟代表持久的能力跨越,還是中國實驗室在缺乏持續西方研究輸入下難以維繫的高峰,目前仍存在真正的爭議。但已無爭議的是:華為昇騰平台是前沿規模模型的嚴肅訓練基底。
未來六個月——隨著昇騰 950 量產規模提升、V4 在企業客戶中逐步部署——將決定這一時刻是否代表全球 AI 版圖持久的策略性轉移,還是一次超越底層供應鏈維持能力的示範性突破。