阿里巴巴發布鎮武M890晶片與Qwen 3.7-Max:中國迄今最完整的自主AI技術棧
阿里巴巴旗下半導體部門平頭哥於杭州雲棲大會發布鎮武M890 AI加速晶片,聲稱效能較前代提升三倍,直接挑戰英偉達H20在中國市場的地位。同步發布的Qwen 3.7-Max大模型在基準測試中連續自主運行35小時、調用超過1000種工具,標誌著中國AI企業首次在晶片與模型層面同步達到國際競爭水準。
5月19至20日,阿里巴巴在杭州年度雲棲大會上,揭開了旗下半導體部門平頭哥(T-Head)迄今最完整的硬體與軟體組合:鎮武M890 AI加速晶片,以及通義千問Qwen 3.7-Max大語言模型。兩項發布合在一起,清楚呈現了阿里巴巴追求端對端AI自主化的雄心——自行設計晶片、開發前沿模型,再以阿里雲的基礎設施一條龍運行,規模與整合度均屬中國科技企業目前之最。
鎮武M890:正面挑戰英偉達H20
鎮武M890採用平頭哥自研的PPU(並行處理單元)架構,內建專為AI計算設計的Transformer核心引擎,針對矩陣運算進行深度優化。技術規格方面,晶片搭載144GB HBM3顯示記憶體,較前代鎮武810E的96GB增加50%;晶片間互聯頻寬達800GB/秒,對於大規模分散式訓練的資料吞吐至關重要。
阿里巴巴聲稱M890的效能是鎮武810E的三倍,並將競爭對手直接鎖定為英偉達H20——後者是英偉達為符合美國出口管制法規、同時維持中國市場供應而特別設計的折衷版本。若3倍效能的主張在第三方測試中獲得驗證,M890將代表中國本土AI晶片在技術上的重大躍升。
在數值格式方面,M890支援FP32、FP16、FP8及FP4,兼顧訓練與推理多種工作負載的精度需求。新推出的盤九AL128伺服器可在單一機櫃中整合128顆M890,以極高的運算密度面向超大規模資料中心市場。
平頭哥也公布了未來的產品路線圖:預計2027年中發布的V900效能將達M890的三倍,2028年第三季則推出J900,為企業採購決策提供多年期的可預測性。
地緣政治下的戰略時機
這次發布的背景,與地緣政治形勢密不可分。自2022年起,美國連續多輪出口管制已逐步封鎖中國AI業者取得英偉達旗艦GPU的管道——A100、H100乃至H200均在禁止之列。英偉達雖推出A800、H20等合規變體,但其算力上限也面臨愈趨嚴格的法規審查。
這一局面為中國本土晶片廠商製造了結構性機遇,也帶來了發展的迫切性。華為昇騰910C被視為國內主要替代方案,但供應量一直無法滿足市場需求;寒武紀則在部分垂直領域獲得牽引力。鎮武M890以此進場,切入的正是供給吃緊、需求殷切的市場缺口。
阿里巴巴相較於純晶片廠商的差異化優勢,在於垂直整合:T-Head賣晶片給阿里雲,阿里雲再用這批晶片為數以千計的企業客戶提供服務。這種從矽晶到雲端的完整閉環,使阿里能夠跨層優化整個技術棧——晶片韌體、雲端調度與模型服務——是獨立晶片廠商難以企及的能力。外部客戶在部署M890前,阿里已在生產規模下完成實戰驗證。
平頭哥同時披露,截至目前已向20個行業的超過400家客戶交付56萬顆鎮武晶片,為新一代產品提供了實質的市場基礎。
Qwen 3.7-Max:為智能體時代而生
硬體消息之外,同步發布的Qwen 3.7-Max在軟體層面同樣意義重大。阿里巴巴將其定位為「智能體AI」(Agentic AI):能夠在低度人類監督下,自主執行複雜、多步驟任務的系統。
為佐證這一定位,阿里公布了一項令人矚目的基準測試:Qwen 3.7-Max在新計算平台上連續無間斷運行35小時,期間自主調用超過1,000種工具,最終完成一個優化版計算核心的撰寫——其運行速度比晶片製造商官方提供的程式碼快10倍。
這項基準若能重現,具有相當的技術意義。讓智能體系統在長時間任務中保持連貫狀態、有效適應工具輸出回饋、避免數千步操作中的錯誤累積,至今仍是應用AI領域最棘手的問題之一。35小時連貫自主運行並產出具體技術成果的宣稱,是目前各主要前沿實驗室尚未在這一維度公開匹配的指標。
在全球排行榜上,Qwen 3.7-Max的綜合文字能力排名全球第13,數學推理能力在Chatbot Arena排名第7,使阿里巴巴成為全球排名第六的AI實驗室。這與兩年前中國模型被普遍認為落後西方12到18個月的評價,相差已遠。
開源策略方面,阿里採取業界常見的雙軌模式:Qwen 3.7 Plus版開放權重,Qwen 3.7-Max則保持閉源商業化,透過阿里雲模型服務平台收費提供。藉此既可吸引開發者社群生態,又能透過旗艦版變現。
對全球AI硬體市場的啟示
M890在短期內不太可能動搖英偉達在西方市場的主導地位,但在中國——一個2025年AI基礎設施採購規模達數百億美元的市場——M890以具競爭力的規格切入供應受限且政治敏感的時間節點,具有實質商機。
更值得關注的,是這次聯合發布對阿里雲國際化策略的意涵。阿里雲近年正悄然擴張在東南亞、中東與歐洲的業務,這些地區不受美國出口管制約束,阿里理論上可以M890驅動的雲端服務向國際客戶行銷,分散其對美國基礎設施的依賴。盤九AL128機櫃級伺服器的設計,顯示阿里的野心不止於中國企業本地部署。
對更廣泛的AI生態而言,這次「晶片加模型」的聯合發布模式本身即值得深思。谷歌以TPU搭配Gemini、AWS以Trainium搭配Bedrock,都是這條路的先行者,但在中國科技企業中,以如此技術完整度與商業規模同步執行垂直整合,阿里尚屬首例。M890的效能聲明是否能通過獨立驗證,將是接下來最值得追蹤的里程碑。