跳至主要內容
FAQ

Anthropic 推出 Opus 4.8:動態工作流程讓千個 AI 代理人在同一個對話中並行

Anthropic 於 5 月 28 日發布 Claude Opus 4.8,帶來「動態工作流程」研究預覽功能,可在單一對話中協調最多 1,000 個並行子代理人,同時搭載百萬 token 預設情境視窗、用戶可控的推理深度,以及比前代便宜三倍的快速模式。

1 分鐘閱讀

繼 Opus 4.7 發布僅 41 天後,Anthropic 於 5 月 28 日火速推出 Claude Opus 4.8——這樣快速的迭代週期,既反映了公司加速的開發節奏,也折射出來自 OpenAI Codex 和 Google Gemini Flash 系列日益激烈的競爭壓力。此次更新集多項重大改進於一身:一套名為「動態工作流程」的並行子代理人協調系統、百萬 token 的預設情境視窗、用戶可配置的推理深度,以及比前代快速模式便宜三倍的全新快速選項。模型定價與 Opus 4.7 持平,現有 API 客戶可直接無縫升級。

動態工作流程:讓 AI 寫程式來驅動 AI

Opus 4.8 發布的核心亮點是「動態工作流程」——目前透過 Claude Code 以研究預覽形式提供。這項功能讓 Opus 4.8 能夠在單一對話中,自主規劃並跨數百個並行子代理人執行大型複雜任務,例如企業級程式碼遷移、多維度研究綜合、全面性系統審計。

其架構設計相當有意思:當使用者描述一項複雜任務時,Opus 4.8 會編寫一段 JavaScript 協調腳本,定義工作應如何拆分和分配。接著由獨立的執行時環境在背景執行該腳本,最多同時啟動 16 個並行子代理人(每次執行的子代理人總數上限為 1,000 個)。關鍵在於,協調計畫存在腳本變數中,而非模型的情境視窗——只有最終的綜合答案才會回傳至使用者的對話,無論底層任務多複雜,主要情境都保持乾淨整潔。

這一設計解決了多代理人框架的核心限制之一:情境視窗污染問題。當協調者模型必須在自身情境中追蹤數十個子代理人的輸出時,品質會急遽下降。動態工作流程透過將協調狀態完全外部化,巧妙地繞開了這一瓶頸。

Anthropic 提供了一個具體的規模基準:系統可在單一對話中處理跨數十萬行程式碼的遷移任務,而這項工作此前要麼需要多個連續對話,要麼需要大量人工協調。

百萬 Token 情境:這究竟意味著什麼

Claude Opus 4.8 在 Claude API、Amazon Bedrock 和 Vertex AI 上預設提供百萬 token 的情境視窗,在 Microsoft Foundry 上為 20 萬 token,最大輸出長度也延伸至 128,000 個 token。

換個角度來理解這個數字:1 百萬 token 大約可容納 75 萬個英文單字,相當於約 10 部長篇小說,或包含文件說明的大型企業程式碼庫。對複雜的程式碼任務而言,這意味著 Opus 4.8 可以在單次推理呼叫中,同時讀入整個應用程式倉庫、測試套件、CI/CD 配置和部署基礎架構,並跨越所有內容進行推理。

對企業客戶而言,實際影響相當顯著:以前需要精心分割、摘要和情境管理的任務,現在可以完整地交給模型處理。代價是費用——百萬 token 的推理呼叫並不便宜——但 Anthropic 的快速模式(詳見下文)讓對延遲不敏感的工作流程在成本上更加可行。

推理深度控制:讓模型強度匹配任務複雜度

Opus 4.8 在 claude.ai 中引入了一個新的使用者控制項:推理深度選擇。使用者現在可以明確指定希望 Claude 對某項任務投入多少推理深度,從快速回應到深度延伸思考均可選擇。

這對進階使用者而言是重大的體驗提升。以往他們被迫在 Opus 級延伸思考的全額成本與延遲,以及更輕量模型的較低能力之間二選一。有了推理深度控制,使用者可以用快速模式讓 Opus 進行簡單任務的快速確認,無需支付延伸推理的費用,同時在問題確實需要時仍可呼叫最大深度。

推理深度控制也與新的快速模式整合:快速模式讓 Opus 4.8 以約 2.5 倍的正常速度運行,且費用比 Opus 4.7 的等效快速模式便宜三倍——這是一個可觀的成本降幅,讓高速 Opus 效能在經濟上變得可行,而此前只有更小、更快的模型才在財務上站得住腳。

更誠實、更準確的不確定性表達

除了基礎架構層面的改進外,Anthropic 也在 Opus 4.8 的認知校準方面投入大量心血。根據公司的內部測試,與前代相比,該模型「更有可能標記其工作中的不確定性,並且更不容易提出未經充分支持的主張」。

這一點比表面上看起來更為重要。在模型自主執行長達多步驟工作流程的代理人情境中,在不確定的中間步驟中仍自信地推進,往往會導致錯誤以幾何級數累積。一個主動標記「我不確定這個依賴版本是否正確——在我繼續之前你應該驗證一下」的模型,能夠防止連鎖失敗,而不是在一個有缺陷的基礎上生成數千行程式碼。

橋水基金(Bridgewater Associates)已將 Claude 廣泛部署於投資研究工作流程,該機構公開表示「Opus 4.8 主動標記輸入和輸出問題的傾向」是相較於競爭模型的重大進步——考慮到橋水對分析準確性的極高標準,這是一個罕見且具分量的企業背書。

通往 Mythos 之路

Anthropic 在 Opus 4.8 公告的最後,提到了一個將令 AI 社群高度關注的前瞻性訊息:公司更先進的 Mythos 模型——首次被提及時曾引發廣泛討論——「在完成必要的安全評估後,應在未來幾週內廣泛上線」。

Mythos 被定位為比 Opus 4.x 系列能力更強的系統,Anthropic 早期的溝通暗示,它代表的架構飛躍比 Opus 各版本之間的漸進式改進更為顯著。關於「必要安全措施」的說明,與 Anthropic 對其最強大系統進行分階段部署和大量紅隊測試的公開立場一致。

若 Mythos 如所暗示般在 2026 年 6 月或 7 月發布,時間點將直接與 OpenAI 的 GPT-5.6 形成競爭——預測市場 Polymarket 目前對後者 6 月 30 日發布的賠率達到 80–89%。Anthropic 似乎正在同時透過 Opus 4.8 和 Mythos 路線圖,確保無論 OpenAI 下一步推出什麼,它都能在企業級程式碼和代理人工作負載的頂級模型提供商競爭中保持地位。

Opus 4.8 對市場意味著什麼

41 天的發布週期表明,Anthropic 已走出早期的生產瓶頸,現在能以媲美超大規模雲端服務商競爭對手的速度進行迭代。結合 6 月 1 日宣布的秘密 IPO 申報,這家公司顯然正處於全力執行的高壓階段:一邊證明技術領導力,一邊為公開市場的審視做好準備。

對評估代理人工作負載 AI 供應商的企業客戶而言,Opus 4.8 提高了他們應有的期待標準。動態工作流程、百萬 token 情境、推理深度控制和改進的誠實性校準的組合,是一個針對大規模、多步驟、自主程式碼和分析任務——也就是真正企業價值所在——量身打造的完整解決方案。

Anthropic Claude Opus 4.8 AI 代理人 大型語言模型 動態工作流程
分享

相關報導

Anthropic 秘密遞交 IPO 申請,估值逼近一兆美元

Anthropic 於 6 月 1 日向美國證券交易委員會秘密遞交 S-1 申請書,此前剛完成 650 億美元 H 輪融資,估值達約 9,650 億美元。公司年化營收突破 470 億美元,同時獲得亞馬遜與 Google 雙巨頭加持,預計最快今年 10 月掛牌,有望成為科技史上規模最大的 IPO 之一。

1 分鐘閱讀