跳至主要內容
FAQ

月之暗面發布 Kimi K2.7 Code:千億參數開源程式碼代理模型

月之暗面於 6 月 12 日發布 Kimi K2.7 Code,這是一個擁有 1 兆總參數的混合專家架構編程模型,推理 token 用量較前代減少 30%,在 Kimi Code Bench v2 上取得 21.8% 提升。模型以 Modified MIT 授權在 Hugging Face 開放下載,是 K2 系列一年內第五個重大版本,也是開源編程代理市場的新競爭者。

1 分鐘閱讀

中國 AI 新創公司月之暗面(Moonshot AI)於 6 月 12 日發布 Kimi K2.7 Code,這是其開源編程系列的最新版本,也是 K2 家族在約十二個月內的第五個重大模型迭代。模型採用混合專家架構(Mixture-of-Experts, MoE),總參數量達 1 兆,每次推理激活 320 億個參數,搭載 256K token 上下文視窗——這套組合是為現代 AI 編程代理所需的長程、多步驟程式碼執行任務而量身打造的。

相較於 K2.6,本次最顯著的改進是推理 token 用量降低 30%。這個數字直接轉化為更低的推理成本與更快的回應速度。在 token 經濟學日益決定開發者是否整合某個模型的當下,這不是小幅優化。

數字背後的含義

月之暗面使用自家評測套件對 K2.7 Code 進行了三項測試。在 Kimi Code Bench v2 上,模型比 K2.6 提升 21.8%;Program Bench(評估結構化程式設計問題解決能力)提升 11%;MLS Bench Lite(測試 Python、Rust、Go 三種語言的多語言程式碼生成)則提升了 31.5%。

這些基準測試均來自月之暗面的內部評測,在獨立複測結果出爐前,與競品的強力比較宜謹慎看待。不過,MLS Bench 的數字特別值得關注:Rust 和 Go 是系統程式語言,嚴格的型別系統和記憶體管理要求對幻覺程式碼的容忍度遠低於 Python。這兩種語言上的顯著提升,暗示模型在低階程式碼生成的精準度上有實質改善,而非僅限於網頁腳本類任務。

模型的 256K token 上下文視窗對大多數現實的代理編程工作階段已足夠,可以同時容納多個大型原始碼檔案、詳細的錯誤日誌與多輪除錯紀錄。雖然不及部分競品(例如 Gemini 3.1 Pro 的 100 萬 token),但在編程任務上,超過約 12.8 萬 token 的上下文在實際使用中邊際效益遞減——大多數個別代碼庫都能輕鬆放進 256K 的窗口。

MoE 架構為何適合此規模的編程任務

1 兆總參數、320 億激活參數的設計體現了混合專家架構的標準取捨:推理時只有 320 億個參數是活躍的,計算成本與一個 320 億稠密模型相當。但由於 MoE 中不同「專家」可針對不同領域專業化,前向推理時整個 1 兆參數的容量都可透過路由機制調用。

對編程任務而言,這種架構在理論上具備明顯優勢。生成 Python 非同步函數、Rust 生命週期標注,以及 Kubernetes YAML 配置,需要的知識模式截然不同。MoE 模型能夠將每個 token 路由到最相關的專家,這也是為何自 GPT-4 規模化引入 MoE 以來,混合專家模型在程式碼基準測試上持續領先同尺寸稠密模型的原因之一。

月之暗面尚未公開完整架構文件,但已從 Hugging Face 權重中確認的資訊顯示,K2.7 Code 採用 384 個專家、每層每個 token 路由至 8 個專家的設計,與早先 K2 系列的架構描述一致。

開源定位的意義

Kimi K2.7 Code 採用 Modified MIT 授權,商業用途允許且要求署名。這是開源授權中較輕的限制,比許多同領域競品更友好。

開源對月之暗面的意義不只是形象工程。面對 DeepSeek、Qwen,以及 Mistral、Cohere 等國際競爭者,月之暗面需要爭奪開發者心占率。開放模型權重允許開發者在自家代碼庫上微調、在有數據隱私要求的環境中本地部署、以及在 CI/CD 管道中整合而無需依賴 API。這些使用情境對閉源 API 而言幾乎無法實現,卻佔據了企業開發者工具預算的相當大比例。

透過 Kimi API 調用的定價為每百萬輸入 token 0.95 美元、每百萬輸出 token 4 美元。這讓 K2.7 Code 在定價上低於 Claude claude-sonnet-4-6 的輸入成本,並與 GPT-4.5 同級的競品相當,同時為有足夠規模的團隊提供了完全消除 API 成本的本地部署替代方案。

市場競爭格局

月之暗面進入的是一個真正擁擠的市場。閉源端,Anthropic 的 Claude 系列和 OpenAI 的 GPT-5 家族已在專業開發者中建立強大的心智佔有率;開源端,DeepSeek 的編程導向模型和阿里巴巴的 Qwen-Coder 系列則已積累了龐大的社群。

K2.7 Code 差異化的核心在於明確聚焦代理(agentic)使用情境,而非自動補全或單次生成。月之暗面的定位是「AI 代理需要跨長序列規劃、執行與除錯的場景」,這不同於開發者每天使用的 Copilot 式內聯補全,而是 Claude Code、Devin 或 OpenAI Codex Cloud 所啟用的那類多步驟自主編程工作階段。

編程代理市場成長迅速。上個月發布的 GitHub 年度開發者調查顯示,23% 的專業開發者每週至少使用一次 AI 編程代理,較 2025 年的 9% 大幅提升。同一調查發現,可運行 20 至 30 分鐘、涉及無人介入的文件編輯、測試執行和錯誤修正的多步驟代理工作階段,是資深用戶成長最快的使用模式。

對開發者的建議

K2.7 Code 上架 Hugging Face 後,開發者社群的壓力測試將迅速展開。開源圈最受關注的基準是 SWE-bench(真實軟體工程任務完成度的標準評測),月之暗面目前尚未發布 K2.7 Code 的 SWE-bench 結果,獨立社群評測預計在一週內出爐。

30% 的 token 減少聲明也值得在生產環境中仔細驗證。推理鏈 token 數的減少有兩種截然不同的成因:一是真正的效率提升,二是推理縮短、思考深度下降——後者在基準測試上呈現為成本節省,但在真實困難任務上則表現為品質下降。現有評測設計尚不能完全區分這兩種情況。

對於正在建立編程代理管道的台灣開發者,K2.7 Code 尤其值得評估的場景是:Rust 或 Go 為主的後端服務(MLS Bench 的高提升最具說服力),以及需要長時間連續運行的代理工作階段(30% token 減少在累積效果上相當顯著)。考量到開源授權允許本地部署,對有數據安全考量的金融與醫療機構也是值得關注的選項。

月之暗面 Kimi 開源 程式碼代理 混合專家架構 Hugging Face 開發者工具
分享

相關報導

OpenCode 拿下 AI 程式助手排名第一,17.2 萬顆星取代 Cursor

開源終端機 AI 程式代理 OpenCode,在 LogRocket 2026 年六月 AI 開發工具排名中擠下 Cursor 奪得榜首。17.2 萬 GitHub 星、750 萬月活躍開發者、支援 75 家以上 LLM 供應商、並整合語言伺服器協定(LSP),OpenCode 讓業界重新思考:最好的程式 AI,不需要每月收費 20 美元、也不必綁定單一 AI 廠商。

1 分鐘閱讀