DeepSeek 首次對外募資 3 億美元,估值逾 100 億美元;V4 模型將全面採用華為晶片
中國 AI 明星公司 DeepSeek 首次尋求外部資金,目標募集 3 億美元、估值超過 100 億美元。與此同時,其下一代旗艦模型 V4 將完全運行於華為國產 Ascend 950PR 晶片之上,宣示中國半導體自主化的歷史性賭注。
過去兩年多,DeepSeek 做了一件幾乎沒有任何成功 AI 新創能做到的事:拒絕所有投資邀約。這家由量化對沖基金幻方科技(High-Flyer Capital)支持的中國頂尖 AI 研究機構,婉拒了來自中國頂級創投機構和科技巨頭的一切融資提案,選擇維持母公司資金來源與高度獨立性。
這個時代正在落幕。根據《The Information》2026 年 4 月 17 日發布的報導,DeepSeek 目前正積極洽談首輪外部融資,目標金額至少 3 億美元,估值逾 100 億美元。此舉是重大的戰略轉向——而且恰恰發生在 DeepSeek 準備推出有史以來最具野心模型的前夕:一個蓄意為中國國產硬體而生的新世代旗艦。
為何現在才募資?前沿 AI 的高昂代價
DeepSeek 選擇此時對外融資,並非財務困難所致,而是反映了訓練與大規模服務前沿 AI 模型的殘酷經濟邏輯。儘管 DeepSeek 早期模型(包括突破性的 R1 推理模型)以驚人的成本效益聞名,但下一代模型需要截然不同等級的基礎設施投資。
據知情人士透露,此輪資金主要用於擴充算力基礎設施、穩定因需求激增而屢屢超載的服務,以及加速商業化佈局。外界對 DeepSeek 估值的猜測從 10 億美元到 200 億美元以上不等,100 億美元的數字是一個折衷點,既反映了公司的營收潛力,也包含了投資人願意為持股中國最具國際知名度 AI 實驗室所付出的戰略溢價。
V4 模型:一個兆參數的宣示
融資時機與 V4 模型的即將發布密不可分。DeepSeek 創始人梁文鋒在 4 月初確認,V4 預計於 4 月下半推出,此前已兩度延期,反映了打造兆級參數模型的複雜度——尤其是在一個從未為此而設計的硬體上打造它的難度。
這個硬體,正是華為的 Ascend 950PR。路透社於 4 月 4 日確認,DeepSeek V4 將完全運行於華為昇騰晶片,使其成為第一個明確針對中國本土半導體架構開發的前沿 AI 模型。
所需的工程投入相當龐大。DeepSeek 的工程團隊必須重寫訓練與推理管道的核心模組,針對昇騰架構調整模型並行策略,並在與 CUDA 生態截然不同的晶片環境下驗證性能。更值得注意的是,華為和寒武紀(Cambricon)獲得了 V4 開發的早期訪問權限,而輝達(Nvidia)則被刻意排除在外——這是對過往慣例的直接顛覆。
半導體自主:從被迫到主動
DeepSeek 的 V4 架構不只是一項工程專案,更是一份政治聲明。自 2022 年底美國限制出口先進 Nvidia GPU 至中國以來,中國 AI 產業持續受到出口管制的陰影籠罩,企業被迫囤積舊版晶片、支付灰色市場溢價,或轉向國內替代品。
在 2024 年至 2025 年大部分時間裡,國內替代品的性能尚不足以訓練前沿模型。但情況已經改變。華為的 Ascend 950PR 於 2026 年 4 月開始量產,其 FP4 性能約為 Nvidia H20(目前被允許在中國銷售的最先進晶片)的 2.8 倍。字節跳動(ByteDance)已承諾 56 億美元的採購訂單,阿里巴巴、騰訊等科技巨頭也紛紛大量訂貨。
DeepSeek 選擇在 Ascend 950PR 上構建 V4,是對整個中國 AI 生態的概念驗證。如果完全在國產晶片上訓練的模型能媲美乃至超越在 Nvidia 頂級算力上訓練的模型,就等於驗證了中國科技公司被迫押注、如今 DeepSeek 主動選擇的那條路。
估值迷霧與融資格局
100 億美元的估值數字看似簡單,但 DeepSeek 的財務狀況幾乎完全不透明。公司不公開營收數字,主要變現管道——API 服務、企業授權以及整合至幻方科技量化交易系統——均未對外披露。
可以確定的是,DeepSeek 的模型在全球擁有龐大用戶群。2025 年 1 月,R1 模型的開源發布引發了金融市場的「DeepSeek 震撼」,輝達及其他 AI 基礎設施股票大幅下挫,市值蒸發數千億美元,迫使投資人重新評估前沿 AI 所需的資本密集程度。
這份全球知名度本身就足以吸引投資人,與具體營收數字關係不大。DeepSeek 在選擇投資方和設計融資結構上享有相當大的主動權——這家公司過去多次拒絕邀約,如今主動出手,意味著它正以充分掌握籌碼的姿態登場。
V4 必須證明什麼
V4 發布的賭注極高。DeepSeek 的聲譽建立在一系列反直覺的示範上:以極低的訓練成本,實現與 OpenAI 頂級模型競爭的性能。每一次發布都強化了同一個敘事——智能的擴展靠架構與資料品質,而非單純堆疊算力預算。
V4 必須在全新硬體上延續這個敘事。若該模型在完全依賴國產晶片的條件下,能達到乃至超越 Anthropic、OpenAI、Google 最新模型的水準——那些運行在最先進 Nvidia 集群上訓練的模型——這將是中國國產晶片能夠支撐前沿 AI 的第一個確鑿證明。這不僅是 DeepSeek 工程選擇的勝利,更是中國整體半導體戰略的驗證。
此次 3 億美元的融資,某種程度上是對「答案令人樂觀」的押注。DeepSeek 正在以 V4 將完成使命為前提,為下一個章節籌措資金——並期待這份成果能在後續輪次中解鎖更多資本、以更高的估值迎接更大的挑戰。