跳至主要內容
FAQ

Fireworks AI 洽談 150 億美元估值新融資,AI 推論服務市場競爭白熱化

專門為企業提供大型語言模型推論服務的新創公司 Fireworks AI,正在以約 150 億美元估值洽談新一輪融資,不到八個月估值翻近四倍。截至 2026 年 2 月,公司年化營收已達 3.15 億美元,本輪由 Index Ventures 共同領投,將成為今年 AI 基礎設施領域規模最大的融資案之一。

1 分鐘閱讀

在 AI 基礎設施投資依然火熱的市場中,專門為企業客戶提供高速、低成本開源模型推論服務的新創公司 Fireworks AI,正在洽談以約 150 億美元估值完成新一輪融資。這項消息由 Bloomberg 在週二率先披露,知情人士透露,先前已投資 Fireworks 的 Index Ventures 將共同領投本輪。

這個數字之所以引人矚目,不只是因為金額龐大,更因為它的速度之快令人咋舌。不到八個月前,Fireworks 在 2025 年 10 月剛以 40 億美元估值完成了 2.5 億美元的 C 輪融資。若本輪以接近傳聞的估值成交,公司估值將在短短一年內翻近四倍——成為本輪 AI 融資週期中估值躍升最為凌厲的案例之一。

Fireworks 與 Index Ventures 的發言人均婉拒置評,條件仍有可能變動。

推論即服務:一個被忽視的關鍵市場

Fireworks AI 佔據的,是 AI 經濟中一個特定卻愈發重要的利基位置:推論即服務(inference-as-a-service)。當外界目光總是聚焦在 GPT-5、Gemini 3、Claude 4 等前沿模型的訓練突破時,真正讓這些模型以生產規模服務終端用戶和應用程式的「最後一哩路」工程,既艱深又有利可圖。

所謂推論,就是讓已訓練完畢的模型對外部請求產生回應——補全文字、生成嵌入向量、執行函數呼叫。對於打造 AI 原生產品的公司來說,推論成本的高低攸關生死:規模一大,推論費用往往吃掉 30% 到 60% 的營收;延遲高低更直接決定產品體驗,而非只是工程問題。

Fireworks 在 AWS Bedrock、Google Vertex AI 等雲端巨頭與 Groq、Cerebras 等客製矽片新創之間找到了自己的定位。公司的核心優勢是速度與彈性:在商用 GPU 叢集上運行深度優化的服務基礎設施,以 token 計費,支援種類繁多的開源模型——Llama 4、Qwen 3、Mistral 等數十款——讓客戶不用被綁死在單一供應商。

公司自研的 FireAttention 推論引擎,據稱在每 GPU 每秒請求量(RPS/GPU)的第三方評測中屢居前列,吞吐量比標準實作高出 2 至 4 倍。

支撐高估值的真實業績

150 億美元的估值並非空中樓閣,背後有真實的業績做支撐。Fireworks 在 2026 年 2 月的年化重複性營收(ARR)達到 3.15 億美元,較前一年同期成長 416%,高於 C 輪融資時公告的 2.8 億美元。公司客戶數量從 B 輪時的約 1,000 家,擴張至 2025 年底的逾萬家。

客戶名單涵蓋當前成長最快的一批 AI 原生公司:Cursor、Perplexity、Notion、Sourcegraph、Uber、DoorDash、Shopify、Upwork。這些不是試玩性質的帳號,而是每天可能需要處理數百萬次 API 請求、對延遲和成本都極為敏感的生產級部署。

以 3.15 億美元 ARR 計算,150 億美元估值對應約 47 倍的本益比——以傳統軟體標準來看偏高,但在本輪 AI 基礎設施投資週期中並不罕見。今年 5 月剛在 Nasdaq 上市、估值逾 400 億美元的 Cerebras,以更薄的營收支撐著相近的倍數。

競爭激烈的推論服務市場

過去一年,推論基礎設施賽道迅速升溫。Groq 靠自研語言處理器(LPU)主打超低延遲,與多家超大規模雲端服務商簽署了多年期合約;已上市的 Cerebras 以晶圓級運算攻大型模型推論市場;SambaNova 以私有化部署瞄準企業客戶;Together AI 則提供類似定位的推論服務,估值超過 12 億美元。

最直接的競爭對標可能是 Baseten——這家公司在 2026 年 2 月以 50 億美元估值完成了 3 億美元的 E 輪融資,強調企業銷售與生產級容量承諾。

讓 Fireworks 有所區隔的,據熟悉該公司的投資人說,是模型支援的廣度、持續領先的推論引擎,以及不斷擴充的周邊產品線——包括微調基礎設施、專屬部署選項,以及多家頭部智慧代理(agentic)應用開發者已採用的函數呼叫 API。

基礎設施能否守住長期價值?

圍繞 Fireworks 的估值討論,其實折射出 AI 投資圈一個懸而未決的核心問題:基礎設施服務商能否長期積累可觀的護城河,還是終將在超大型雲端服務商的定價補貼下邊際壓縮?

悲觀論點在於:AWS、Google、Microsoft 都有自己的推論服務,擁有更強的企業銷售能力,且願意在推論費率上補貼以換取更大的雲端綁定。隨著 Llama 4 Maverick、Qwen 3-235B 等開源模型在 2026 年的能力逼近閉源前沿,企業更換服務商的轉換成本正在降低。

樂觀論點則是:在大規模情況下高速、高效地服務模型,是一項有深度護城河的工程能力,而超大型業者在開源模型的優化部署上行動遲緩。加上模型上下文長度持續擴張——從 128K、1M 到如今開始支援數百萬 token 的視窗——高效服務長上下文請求的能力,與標準吞吐量優化是截然不同的技術挑戰。

Fireworks 的成長曲線暗示,目前客戶正在以行動投票支持樂觀論點。

150 億融資的市場意義

若本輪交易以傳聞估值成交,Fireworks 將躋身 2026 年最大規模私人 AI 基礎設施融資之列,與 Anthropic 的 300 億美元超大輪、Runway 的 50 億美元融資、Modal Labs 的 3.55 億美元 C 輪,共同描繪出前沿 AI 應用底層基礎設施仍在持續吸引資本的圖景。

對整個 AI 推論服務市場而言,這筆融資所傳遞的訊號是:投資人相信,在雲端服務商的商品化完全壓縮利潤空間之前,專業推論平台仍有數年的機會視窗——而那些已建立可觀營收與客戶集中度的公司,值得以積極的估值支持。

Fireworks 的賭注,是要在推論服務層做到 Snowflake 當年在雲端資料倉儲做到的事。150 億美元的籌碼是否下得恰當,等本輪融資正式落地後才能見真章。

AI 推論 新創公司 融資 Fireworks AI Index Ventures
分享

相關報導

AI 定價戰不是炒作:Token 成本三年崩跌 99%——以及接下來會發生什麼

自 2023 年 GPT-4 推出以來,AI 智慧的價格已下跌逾 99%。前沿模型現已可以每百萬 Token 不到 3 美元的價格取得,預算級 API 甚至跌破 0.10 美元。DeepSeek 的激進定價迫使所有主要供應商重新定價,而最新一輪——GPT-5.5 的 2.25 美元、Gemini Flash-Lite 的 0.25 美元、GLM-4.7 的 0.11 美元——確認了這波崩跌是結構性的,而非週期性的。弔詭的是:企業的 AI 帳單仍在上漲。

2 分鐘閱讀

Cerebras 申請 400 億美元 Nasdaq IPO,背後是 OpenAI 百億運算大單

AI 晶片新創 Cerebras Systems 重新遞交 IPO 申請書,目標在 Nasdaq 以 400 億美元估值籌資 40 億美元。公司背後有 OpenAI 簽下的逾 100 億美元推理運算合約,2025 年營收達 5.1 億美元,訂單積壓高達 246 億美元,這將是美國史上規模最大的 AI 晶片上市案之一。

1 分鐘閱讀

Modal Labs 完成 3.55 億美元 C 輪融資,估值 46.5 億美元,無伺服器 GPU 算力需求爆發

提供無伺服器 GPU 基礎設施的新創公司 Modal Labs 完成由 Redpoint Ventures 和 General Catalyst 領投的 3.55 億美元 C 輪融資,估值達 46.5 億美元,是八個月前估值的逾四倍。公司年化營收在不到一年內從 6000 萬美元激增五倍至 3 億美元,客戶涵蓋 Anthropic、Meta、Cognition 等頂尖 AI 機構,已成為 AI 時代成長最快的基礎設施公司之一。

1 分鐘閱讀