DeepSeek V4 在華為晶片上全速運行，美國升級 AI 竊密指控

中國 DeepSeek 發布針對華為昇騰處理器優化的 1.6 兆參數 V4 模型，以遠低於西方競爭對手的價格提供接近前沿的性能。此次發布正值美國官員指控中國企業對美國 AI 智慧財產權發動「工業規模竊密行動」之際，北京方面則予以否認。

2026年6月21日 1 分鐘閱讀

DeepSeek V4 在華為晶片上全速運行，美國升級 AI 竊密指控

杭州 AI 實驗室 DeepSeek——其背後是量化對沖基金幻方科技——發布了迄今最強大的模型：一個擁有 1.6 兆參數的混合專家架構，稱為 V4-Pro，完全在華為昇騰 910C 處理器上完成訓練，未使用任何輝達硬體。這款模型在四月下旬預覽版之後正式亮相，標誌著中國 AI 研發繞過美國半導體出口管制找到可信路徑的最重要示範。

時機絕非偶然。華盛頓同步加大施壓，高層官員正式指控 DeepSeek 等中國 AI 實驗室發動政府文件所稱的「工業規模行動」，透過系統性蒸餾及資料投毒攻擊竊取美國模型的智慧財產權。北京外交部則將這些指控斥為「毫無根據」。

模型實力究竟如何

V4-Pro 規模龐大——256 個專家共 1.6 兆總參數，推理時啟動約 370 億參數——在原始參數量上可與 GPT-5.4 及 Gemini 3.1 Pro 相提並論。DeepSeek 的技術報告坦承 V4「略遜於」這些前沿模型，估計發展落差約三至六個月。相較於早期版本與業界頂尖差距達 12 至 18 個月，這已是顯著的追趕。

較小的伴侶模型 V4-Flash 提供 2,840 億參數版本，成本大幅降低，目標是旗艦版不適合的延遲敏感應用場景。

100 萬 token 的情境視窗是另一亮點。在情境長度成為主要競爭維度的當下——Gemini 3.5 Pro 最近擴展至 200 萬 token，Anthropic 的 Mythos 系列也有相近的長視窗——V4 仍與西方頂尖替代方案保持競爭距離。

定價武器

DeepSeek 的顛覆性從來不只在於原始能力，而在於價格。V4-Pro 起步定價為每百萬輸出 token 3.48 美元；OpenAI 同級別收費 30 美元，Anthropic 收費 25 美元。兩者之間是約 8 至 10 倍的成本差距，而兩款模型的實際應用高度重疊。V4-Flash 更以每百萬 token 0.28 美元，甚至比西方最精簡的小模型還便宜。

「隨著華為下半年擴大昇騰 950 生產規模，定價還可能進一步下降，」公司在發布聲明中表示——暗示 DeepSeek 的競爭優勢是結構性的，而非短期促銷策略。

金融市場隨即作出反應。製造華為昇騰晶片的中芯國際（SMIC）股價當日跳漲 10%；中國 AI 同業 MiniMax 和知識地圖的股價則各跌逾 9%，投資人開始重新計算競爭格局。

華為矽晶片的故事

V4 在技術層面更具意義之處，在於晶片架構的突破。在此之前，在輝達 H100/H200/GB200 供應鏈之外訓練大型前沿模型，被普遍認為幾乎是理論上的可能。V4 似乎改變了這一判斷。

包含華為技術的研究團隊展示了以至少 1,000 片昇騰 910C 晶片完成 V4-Pro 完整參數後訓練——這在集群協調規模上本身就是重大工程成就。華為確認其完整昇騰超節點產品線「第零天相容」，包括目前進入有限量產的較新 950 系列處理器。

此一地緣政治意涵深遠：中國現在擁有至少一套本土模型訓練架構，能夠在無需任何輝達產品的情況下，生產處於前沿邊界的成果。而這，在 2022 年 10 月拜登政府實施首輪出口管制時，被普遍認為是遙不可及的。

與此同時，華為預計 2026 年 AI 晶片營收達 120 億美元，因為本土需求正在吸收原本歸輝達的訂單。自最近一輪出口管制收緊以來，美國公司在中國的市場占有率已實際歸零。

智慧財產權爭議

美方官員在模型發布消息的同時，也升級了 AI 智慧財產權竊密指控。具體指控的核心是模型蒸餾——透過 API 存取美國前沿模型，訓練學生模型模仿其輸出——美國政府文件指稱中國實驗室在出口限制關閉此途徑之前，已在「工業規模」上進行此類操作。

DeepSeek 早期的 V2、V3 版本引發了類似指控，尤其是分析人員在 V3 輸出中發現被部分研究者歸因於從 GPT-4 及 Claude 3 系列蒸餾的回應模式之後。DeepSeek 在所有情況下均予否認。

V4 對上述指控提出了部分答案：由於它在華為硬體上從頭訓練，未使用美國模型 API 的 RLHF 回饋，蒸餾攻擊面在同等程度上根本不存在。然而，美國政府是否因此滿意，仍是未知數——尤其是那些超越 API 蒸餾的更廣泛架構和資料竊取指控，尚未獲得解答。

對企業和開發者的影響

對於在美國出口管制體制之外運作的企業及開發者而言，V4 是真正具競爭力的替代方案。長情境視窗、具競爭力的基準性能，加上旗艦版不到 4 美元的定價，為文件分析、程式碼審查、RAG 管線等高吞吐量推理應用創造了引人注目的選擇——在這些場景中，西方前沿模型的成本在規模化時將變得難以承受。

V4 基於華為的原生架構確實帶來某些限制：依賴輝達優化工具鏈（CUDA 核心、TensorRT、大多數主流 MLOps 平台）的部署環境需要調適。DeepSeek 已發布昇騰專用文件及相容層，但開發者工具的成熟度仍不及輝達生態系。

對於在中國境內或受美國科技政策限制較小的市場運作的企業，這些摩擦點可能會隨著生態系發展而迅速消退。問題是，這套替代技術架構要多快才能滲透到全球企業採購決策之中。

地緣政治的轉折點

V4 發布的時間節點，正是美國晶片管制雙向緊繃的當口。川普政府於 2026 年 6 月進一步收緊限制，將禁令擴大至境外中資附屬企業。與此同時，V4 的發布清楚顯示，這些管制並未凍結中國 AI 能力——它們只是將其重新導向了本土硬體。

「我們不再生活在那個可以假設 AI 進步取決於輝達晶片存取的世界，」一位獲悉 V4 架構簡報的業界分析師說。「那個假設正是出口管制策略的基礎。」

V4 究竟代表持久的能力跨越，還是中國實驗室在缺乏持續西方研究輸入下難以維繫的高峰，目前仍存在真正的爭議。但已無爭議的是：華為昇騰平台是前沿規模模型的嚴肅訓練基底。

未來六個月——隨著昇騰 950 量產規模提升、V4 在企業客戶中逐步部署——將決定這一時刻是否代表全球 AI 版圖持久的策略性轉移，還是一次超越底層供應鏈維持能力的示範性突破。

資料來源

deepseek huawei 中國AI 大型語言模型出口管制

DeepSeek V4 在華為晶片上全速運行，美國升級 AI 竊密指控

DeepSeek V4 在華為晶片上全速運行，美國升級 AI 竊密指控

模型實力究竟如何

定價武器

華為矽晶片的故事

智慧財產權爭議

對企業和開發者的影響

地緣政治的轉折點

資料來源

相關報導

美國封堵晶片出口漏洞：中資企業海外子公司同受出口管制限制

DeepSeek 完成史上首輪外部募資 74 億美元，估值逾 500 億