ElevenLabs ARR 破 5 億美元、估値達 110 億:黑岩、輝達、好萊塢明星齊聚 5.5 億美元 D 輪
AI 語音新創 ElevenLabs 年度經常性收入突破 5 億美元,完成總額逾 5.5 億美元的 D 輪融資,新增投資方包括黑岩(BlackRock)、輝達(Nvidia)、Salesforce Ventures,以及影星 Jamie Foxx、Eva Longoria 與《鬷魚遊戲》創作者黃東赫。本輪估値達 110 億美元,鹉固了 ElevenLabs 作為 AI 語音基礎設施主導者的地位。
ElevenLabs,這家將 AI 語音合成從研究概念打造成全球內容基礎設施的波蘭裔美國新創,本週揭示了一組令人矚目的里程碑:年度經常性收入(ARR)突破 5 億美元、D 輪融資總額逾 5.5 億美元、投後估値達 110 億美元,而投資人名單如今已橫跨黑岩(BlackRock)、輝達(Nvidia),一路延伸至 Jamie Foxx、Eva Longoria 與《鬷魚遊戲》創作者黃東赫。
這些數字印證了該公司成長軌跡長期以來所隐含的一個判斷:ElevenLabs 早已不只是一個語音生成 API,而正在成為全球 AI 技術堆疊中重要的音訊基礎層。
單季 ARR 從 3.5 億躍升至 5 億
ElevenLabs 的 ARR 在 5 月初超越 5 億美元,相較 2025 年底的約 3.5 億美元,單季成長幅度達 43%。在九位數收入規模上維持這樣的增速,使 ElevenLabs 躍入史上成長最快的企業軟體公司之列。
執行長唗共同創辦人 Mati Staniszewski 確認了這一里程碑,指出增長加速的動力來自媒體、遊戲、遠距學習和對話式 AI 應用對 ElevenLabs 語音 API 的企業規模採用。該公司的技術為從主要播客網路到財星 500 大客服中心等各式公司提供語音介面支援。
5 億美元 ARR 在三年前幾乎不存在的 AI 語音市場中格外亮眼。ElevenLabs 在 2022 年底開始商業化,花了最初 18 個月驗證 AI 生成語音可以在規模化條件下與真人錄音難以區分。一度懷疑的企業市場此後做出了明確的選擇:出版商、製片廠和軟體開發者如今整合 ElevenLabs 語音的方式,就像整合支付處理 API 一樣理所當然。
D 輪融資的全貌
ElevenLabs 最初在 2026 年 2 月宣布由 Sequoia Capital 領投的 5 億美元 D 輪融資。公告當下已顰為軍目:Andreessen Horowitz 將持股規模翻了四倍,ICONIQ Capital 增持三倍,Lightspeed Venture Partners 等新機構投資人也一同加入。
然而,第二次交割後,這輪融資的規模和戰略深度都進一步泽大,總額突破 5.5 億美元,新增了幾個極具份量的名字。
黑岩(BlackRock)——全球最大資產管理公司,管理資產逾 11.6 兆美元——罕見地直接投資一家上市前 AI 基礎設施公司。這一行動與黑岩更廣泛的戰略相符:在 AI 普及規模全面反映於公開市場估値之前,提前布局 AI 價値鏈的核心環節。
**輝達(Nvidia)**以策略性投資人身份入股,意義重大——Nvidia 的企業創投部門已成為 AI 基礎設施層面最精準的市場判斷指標之一。此次投資預計將加速 ElevenLabs 推理堆疊在 Nvidia GPU 與 NIM 微服務上的硬體最佳化。
Salesforce Ventures 與**德國電信(Deutsche Telekom)**分別代表企業 CRM 和電信行業的策略性布局,映照出 ElevenLabs 在這兩個場景中日益凸顯的重要性。
好萊塢找到了它的語音投資
這輪融資中最具文化話題性的,是明星投資人的加入。Grammy 獎得主、演員 Jamie Foxx,演員 Eva Longoria,以及韓國編劇導演黃東赫——其 Netflix 劇集《鬷魚遊戲》成為串流史上最多人觀看的非英語內容——先後入股。
娛樂業人士投資一家 AI 語音公司,並非只是公關姿態。隨著 AI 生成音訊從文字轉語音的新奇技術演變為制作級內容基礎設施,創意產業既要正視其帶來的機遇,也不得不面對它對配音演員和音樂人的生存衝擊。
ElevenLabs 的應對策略是將自己定位為「基於授權的正版聲音克隆平台」,為創作者提供擁有和授權自己合成聲音的工具——這一立場在好萊塢圈子贏得了相當程度的認可,即便更廣泛的 AI 語音產業在演員工會中仍屬爭議。
ElevenMusic:進軍串流音訊市場
ARR 和融資消息的背後,是 ElevenMusic 的日益壯大——這是 ElevenLabs 直接與 Suno 競爭的音樂生成產品,於 2025 年底正式推出。用戶只需輸入文字提示,即可生成完整長度、可商業授權的音樂作品,語音合成品質大幅超越早期的生成音訊模型。
密切追蹤商業音樂產業的 Music Business Worldwide 指出,ElevenMusic 已吸引了希望規模化製作內容的獨立音樂人,以及希望降低視頻製作音樂授權成本的內容製片廠的高度興趣。
基礎設施層的投資邏輯
ElevenLabs D 輪的投資人組合,反映了 AI 投資圈正在形成的一個共識:語音不是一項功能,而是 AI 應用技術堆疊的基礎層,其戰略重要性相當於驅動大型語言模型的文字嵌入層。
論據直截了當:每一個對話式 AI 介面——從客服機器人、AI 家教到導航系統——最終都需要開口說話。每一個多語言 AI 產品都需要本地化其語音。每一段人類將以音訊形式消費的 AI 生成內容——播客、有聲書、視頻旁白、互動媒體——都需要一個合成引擎。
ElevenLabs 支援超過 32 種語言,聲音克隆的逃真度在大多數測試條件下接近真人水準,其 API 每天處理數億個字元的文字。在 5 億美元 ARR 下,它正在從真實的量產使用中產生真實的收入——而非來自試探性的企業概念驗證。
對於黑岩、輝達和本輪其他機構投資人而言,技術領先地位、收入犍引力與基礎設施定位的結合,支撑了 110 億美元的投資。現在的問題是:隨著 AI 語音市場走向成熟,Google、OpenAI 和 Microsoft 等資源更雄厚的競爭者也在建構或收購相關能力,ElevenLabs 能否守住這一優勢地位?
數字背後的含義
ElevenLabs 的增長軌跡,為更廣泛的 AI 基礎設施市場提供了一個罕見的參考座標:當一家 AI 公司真正達到逃逸速度時,它看起來是什麼樣子?
在 5 億美元 ARR 的量級上,ElevenLabs 與 OpenAI(240 億美元)或 Anthropic(300 億美元)並不屬於同一個話語體系。但它的百分比增速超越兩者,且起點僅在一年前還只是現在规模的一小部分。若公司能在未來 12 個月維持 2026 年第一季的增長率,到 2027 年初就可能逐近 10 億美元 ARR——這將使它成為有史以來最快達到該里程碑的基礎設施軟體公司之一。
在一個等待 AI 收入在 ChatGPT 訂閱費和企業試點之外真正落地已等了三年的產業裡,ElevenLabs 是貨幣化時刻已經到來的最清晰信號之一。