開源 LLM 大戰:Llama 4 vs Mistral Large vs Qwen 3 — 到底誰贏了?
開源模型追上閉源的速度比所有人預期的都快。但「開源」對 Meta、Mistral 和阿里巴巴來說意義完全不同。
差距在以超乎預期的速度縮小
十八個月前,開源模型落後閉源整整一個世代。今天,最好的開源模型(Llama 4 405B、Mistral Large 2、Qwen 3 72B)在大多數跑分上能跟 GPT-4 競爭,在特定任務上偶爾還能贏。
這不是小事。這是目前 AI 界最重要的趨勢,正在重塑整個產業的經濟結構和權力動態。
三大選手
Meta 的 Llama 4(2026 年 2 月發布)
- 405B 參數版本在程式、推理和多語言任務上追平 GPT-4
- 真正開放:權重可下載、可微調、可商用
- Meta 的動機是策略性的 — 把模型層商品化,讓價值集中在應用層(Meta 競爭的地方)
- 弱點:訓練資料透明度仍然有限
Mistral Large 2(2026 年 3 月發布)
- 歐洲冠軍,為效率優化
- 123B 參數但表現超越體重級別,特別在推理和工具使用上
- 有限制的「開放」:營收超過 5000 萬美元的公司需要商業授權
- 強項:同級最佳的 function calling 和結構化輸出
- 部分由歐盟主權擔憂資助 — 歐洲不想依賴美國/中國的 AI
阿里巴巴的 Qwen 3(2026 年 1 月發布)
- 中國選手,版本從 7B 到 110B
- 在中文任務上稱霸,英文也有競爭力
- 「開放」但受控:以通義千問授權發布,有使用限制
- 強項:亞洲語言最佳的多語言模型,包括出色的繁體中文支援
- 地緣政治的變數:西方公司能信任阿里巴巴子公司的模型嗎?
「開源」到底是什麼意思
不太舒服的真相:這些模型都不是 Linux 或 PostgreSQL 意義上的「開源」。
| 面向 | Llama 4 | Mistral Large 2 | Qwen 3 |
|---|---|---|---|
| 權重可下載 | 是 | 是 | 是 |
| 商用 | 是 | 營收門檻 | 有限制 |
| 訓練資料揭露 | 否 | 否 | 否 |
| 訓練程式碼分享 | 否 | 部分 | 否 |
| 社群治理 | 否 | 否 | 否 |
它們是有專有訓練流程的「開放權重」模型。你可以用,但你無法重現。OSI(開源促進會)已經明確說這些不符合開源的定義。
在實務上重要嗎?對大多數使用者來說不重要 — 有權重就足以微調和部署。但對信任、可重現性和長期生態健康來說很重要。
為什麼這對產業很重要
開源 LLM 的崛起創造了三個地殼級的變化:
-
對 OpenAI 和 Anthropic 的商品化壓力:如果免費模型做到 GPT-5 的 90%,付 20-200 美元月費的意願就會大幅下降。閉源模型必須大幅領先,而不是微幅領先。
-
AI 主權變得可實現:國家和企業現在可以在不依賴美國雲端供應商的情況下運行有能力的 AI。法國、日本、印度和巴西都在用開源模型建國家 AI 基礎設施。
-
創新移到邊緣:當基礎模型免費時,價值轉移到微調、部署基礎設施和應用開發。這讓更廣泛的建造者生態受益。
觀察重點
- Llama 5(傳聞 2026 年底)— Meta 會繼續投資數十億在開源模型上嗎?
- Mistral 能不能用「開源核心」模式建立可持續的商業模式
- Qwen 在中國以外的採用 — 信任問題 vs 技術品質
- 新興的「開源模型 + 閉源後訓練」混合策略
AI 產業正在學軟體產業 25 年前學到的事:長期來看,開放打敗封閉。唯一的問題是這個「長期」有多長。