Aria Networks 獲 1.25 億美元融資,打造專為 AI 設計的資料中心網路基礎設施
帕羅奧圖新創公司 Aria Networks 宣布完成 1.25 億美元首輪融資,由 Snowflake 背後的 Sutter Hill Ventures 領投,目標是打造跨廠商、專為 AI 工作負載設計的資料中心網路基礎設施。此輪融資宣布之際,超大規模雲端業者 2026 年 AI 基礎設施投入已逾 4,700 億美元,而網路層正成為 AI 技術棧中最關鍵、也最未被充分建設的一環。
Sutter Hill Ventures 是企業科技圈最受關注的投資機構之一。這家公司在 Snowflake 還只是一個構想的階段就進場,歷經多年耐心陪伴成長,最終支持公司完成 2020 年的 IPO——當時是史上最大的軟體股上市。當 Sutter Hill 領投一家基礎設施新創的 1.25 億美元首輪,整個企業科技圈都會豎起耳朵。
這家公司叫 Aria Networks,總部位於帕羅奧圖,於 2026 年 4 月 7 日宣布成立,致力於打造專為 AI 工作負載設計的資料中心網路基礎設施。本輪融資同時包含 Atreides Management、Valor Equity Partners 和 Eclipse Ventures——一個橫跨深科技專家與成長期跨界基金的投資陣容。
Aria 要解決的問題
AI 資料中心工作負載,在本質上與現有網路基礎設施原本設計應對的工作負載根本不同。傳統資料中心網路是為網路服務、資料庫和企業應用打造的——這些工作負載的特點是:大量獨立節點之間突發性、相對較小的資料傳輸。驅動這些網路的協定、拓撲架構和硬體,經過數十年的精煉,非常適合這種模式。
AI 訓練和推理則在幾乎所有架構維度上都是另一回事。訓練一個大型模型,需要數千顆 GPU 同時進行大規模、同步的資料傳輸——這種通訊模式與網路流量毫無相似之處。分散式訓練所需的集合通訊操作(allreduce、allgather、broadcast)產生的流量特徵,是傳統網路交換機根本沒有針對性優化的。在 Web 服務叢集中只是小麻煩的壅塞事件,在 AI 訓練任務中可能是災難性的——因為所有節點必須完成每一輪通訊後,才能繼續往下走。
結果是:超大規模雲端業者在運行大型 AI 叢集時,已自行打造客製化網路解決方案——大規模部署 InfiniBand、搭配積極 ECN(顯式壅塞通知)調校的客製乙太網拓撲、Google 的 Jupiter 網路和 Meta 的 RDMA 基礎設施等專有架構。這些方案能用,但造價昂貴、需要深度專業知識才能維運,且與特定硬體選擇高度綁定。
Aria 的主張是:在物理硬體與 AI 工作負載之間,打造一個原生理解 AI 通訊模式的網路智能層——能夠針對 AI 訓練所需的集合通訊操作即時優化流量,且關鍵在於,可跨輝達、Google、AMD 或任何其他廠商的 GPU 晶片運作。資料中心運營商理論上可以更換加速器廠商,或混用不同廠商的硬體,而無需重建整套網路架構。
跨廠商為何重要
跨廠商的角度在商業上有著超越單純靈活性的重大意義。AI 加速器市場正處於快速多元化的時期。輝達依然主導,但 Google TPU 在 Alphabet 內部大規模部署,Amazon 的 Trainium 持續拓展外部客戶,AMD 的 MI300X 系列在企業端已完成部署,Cerebras、Groq、SambaNova 等一批 AI 晶片新創正競逐推理和訓練市場。
對於正在建設或擴建 AI 資料中心的企業、雲端業者和主權 AI 計畫而言,被硬體綁架是一個嚴肅的問題。每次換加速器廠商就得重新設計網路基礎設施,等於造成複合式綁架——運營商不只被 GPU 供應商綁住,還被整個圍繞該供應商通訊協定打造的網路生態系綁住。
一個能抽象化加速器特定通訊需求的跨廠商網路層,將改變這個算計。它讓硬體決策更可逆,給資料中心運營商在 GPU 採購談判中真正的議價籌碼,並可能為 AI 工作負載在異質叢集中如何通訊建立新的標準。
Sutter Hill 的投資邏輯與 Snowflake 的類比
Snowflake 的類比值得仔細審視。Snowflake 成功,是因為它識別出企業資料基礎設施中的一個結構性問題——儲存與運算的分離,以及現有資料倉儲無法彈性擴展——並在雲端基礎設施剛好成熟到足以支撐它的時機,打造了一個專門的解決方案。公司的成長,不是靠更強大的銷售人力擊敗既有玩家,而是因為它解決的問題已經真正痛苦,而現有解決方案已真正不夠用。
Sutter Hill 似乎在對 Aria 下類似的賭注。其論點是:AI 網路問題已跨越了一個門檻,從一個超大規模業者憑藉足夠多的工程師就能自行解決的問題,演變為需要專用基礎設施的問題——而這個專用基礎設施從「各家自建的內部項目」變成「一個可交付的市場」的時機,就是現在。
這個時機與資料中心建設者的結構性轉變吻合。2022 至 2023 年,大型 AI 叢集的主要建設者是擁有自建網路工程資源的超大規模業者。隨著 AI 基礎設施投資民主化——企業客戶、主權 AI 計畫、四大雲端之外的雲端業者——需要 AI 網路但無力自建的組織數量大幅增加。
「會思考的網路」實際上是什麼
Aria 的行銷語言——「會思考的網路」——暗示了一個 AI 嵌入網路控制面的願景:使用機器學習動態優化流量路由、預測並預先化解壅塞、根據正在訓練的特定模型架構調適通訊模式。這是一個技術上可行、且在網路管理自動化領域有實質先例的構想。
實際的初期實作可能更為保守:專為集合通訊操作原生設計的網路 ASIC 和交換機軟體,而非試圖把這些操作硬塞進通用交換機。「思考」層最初可能是自動化的策略管理——預設針對 AI 訓練拓撲優化的網路配置,而非要求運營商手動調校通用網路設備所暴露的數百個參數。
不論實作細節如何,Aria 進入的是一個思科、Arista、Juniper、Mellanox(現為輝達子公司)和博通都已嘗試切入的市場。Aria 劃出的差異在於:那些廠商是把既有通用網路改造用於 AI,而 Aria 是從頭為 AI 打造。這個架構差異在大規模部署下是否能帶來真正更好的結果——這正是 1.25 億美元首輪資金如今要驗證的問題。
沒有人談論的那個基礎設施層
AI 的媒體報導往往聚焦於模型能力、訓練算力和 GPU 軍備競賽。網路是連接所有 GPU、讓分散式訓練真正運作的那個不性感的層。在一個訓練前沿模型需要在毫秒內同步數萬顆加速器梯度更新的世界裡,網路不是邊緣問題,而是決定算力能被多有效利用的核心因素。
效率在規模下至關重要。一個 AI 叢集達到理論峰值算力 60% 的使用率,與另一個達到 80% 的相比,不是差了 20% 的能力——而是需要多出 33% 的硬體才能產出相同結果。以超大規模業者 2026 年承諾的資本支出水位計算,使用率提升 20 個百分點,每年可能等值數十億美元的節省。
這就是 Aria 在追逐的獎賞。背靠 Sutter Hill、握有 1.25 億美元,它有足夠的跑道來驗證:網路層,是否與 GPU 層一樣,是 AI 時代真正的關鍵基礎設施。