Anthropic 解密最強 AI：Claude Fable 5 正式對外公開

Anthropic 於 6 月 9 日正式向公眾開放 Claude Fable 5，這是該公司首次將 Mythos 等級的旗艦模型釋出給一般開發者與消費者。Fable 5 在 SWE-bench Verified 拿下 95% 的高分，並在高風險領域內建硬性安全護欄，定價為前代 Opus 4.8 的兩倍。更耐人尋味的是，這款模型的發布時間點恰在公司研究人員剛對外示警「AI 正變得過於危險」的數天之後。

13 小時前 1 分鐘閱讀

Anthropic 多年來始終堅持，最頂尖的模型能力強到難以安全地公開釋出。6 月 9 日，這道防線正式移動了。

這家舊金山 AI 安全公司宣布，將 Claude Fable 5——首個 Mythos 等級的旗艦模型——向消費者、開發者與企業全面開放。這批用戶過去只能望而興嘆，Mythos 的使用資格向來保留給一份嚴格審核的白名單。

發布時間點相當微妙。就在數天之前，Anthropic 研究人員才聯署一封公開信，警告前沿 AI 系統「正在變得過於危險」，呼籲業界採取空前的監管措施。批評者立刻指出這顯而易見的矛盾。Anthropic 的隱性回應是：Fable 5 搭載了該公司有史以來最嚴密的公開模型安全架構。

新一代效能基準

在 SWE-bench Verified 軟體工程基準上，Fable 5 拿下 95% 的成績——遠超 Claude Opus 4.8 的 88.6%，刷新目前所有可公開使用模型的紀錄。在第三方實際場景評測中，成果更令人印象深刻。

資料分析平台 Hex 表示，Fable 5 是「第一個在我們核心分析基準上突破 90% 的模型」。AI 搜尋與工作流平台 Genspark 的全面測試中，Fable 5「擊敗所有其他模型」，在 UI 設計生成與遊戲程式撰寫上尤其突出。應用開發平台 Base44 則特別讚揚其從自然語言生成複雜多元件應用程式的卓越能力。

Fable 5 的優勢集中在 Anthropic 一貫主打的三個領域：軟體工程、知識工作與視覺分析。對於企業 AI 程式設計助理來說，75% 和 95% 的任務成功率在商業上有著天壤之別。

伴隨 Fable 5 一同推出的還有 Claude Mythos 5——針對已獲得 Mythos 存取資格的組織更新的底層旗艦模型版本。

安全靠架構，不靠政策

Fable 5 的核心差異化設計在於硬性護欄系統。在四個高風險領域——資安攻擊、生物武器、化學武器、核子或放射性物質合成——Fable 5 的回應被設計層封鎖，系統自動退回 Opus 4.8 以標準安全訓練作答。

這種「雙層路由」架構與業界通行做法截然不同。大多數安全措施依賴微調讓模型「學會」拒絕危險請求，但這類方法屢屢被繞過。Anthropic 選擇在路由層直接切斷，讓 Fable 5 根本不參與高風險問題的作答——對用戶而言無縫透明。

測試結果看來相當紮實。Anthropic 執行了超過 1,000 小時的外部漏洞獎勵測試，未發現任何通用的越獄方式。早期部署數據顯示，約 95% 的對話完全由 Fable 5 作答，護欄觸發率低於 5%。

能力愈強，代價愈高

定價方面，Fable 5 設定為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元，恰好是 Opus 4.8 的兩倍。對於頻繁或大量呼叫 API 的應用，這意味著需要重新計算投資報酬率。

為緩衝轉換壓力，Anthropic 將 Fable 5 免費開放給 Pro、Max、Team 和企業方案的用戶使用至 6 月 22 日，之後改為使用點數計費，何時回歸標準方案尚未確定。Fable 5 同步上架 Amazon Bedrock，觸及大量習慣透過 AWS 管理 AI 工作負載的企業客戶。

引發爭議的資料保留政策

隨著發布公告一起悄悄出現的，是一項讓不少企業用戶感到不安的政策異動：所有 Fable 5 與 Mythos 5 的 API 流量，現在強制保留 30 天。

Anthropic 的 API 過去以「零保留」承諾為賣點——即請求與回應不會被留存。對於明確選擇 Anthropic 正是因為這項保障的開發者而言，這是合約精神上的重大改變。公司方面的理由是安全必要性：日誌是即時識別新型越獄攻擊、協調防禦的關鍵。

法務與合規團隊正在重新評估這份新增的資料風險。部分開發者社群已將此列為轉向其他供應商的潛在理由。

矛盾核心的解讀

Fable 5 的發布時機很難與背景脈絡分開來看。Anthropic 多年來以「安全優先」的旗幟自我定位，將 AI 競賽描繪為潛在的文明威脅。在剛聯署 AI 危險警告的數天後就釋出全球最強大的公開 AI 模型，至少在溝通層面是一道難題。

公司給出的答案是：唯有同時具備頂尖能力，安全架構才能真正受到市場考驗。只生產「足夠安全但性能平庸」的模型，無法引領業界標準。

這個邏輯在哲學層面連貫，在商業層面也清晰：隨著 OpenAI 準備 IPO、Google 將 Gemini 深植各平台，Anthropic 需要證明安全研究不是商業競爭力的天花板。Claude Fable 5，就是這場論證最直接的答案。

對在它上面蓋應用的開發者來說，最終的判斷將由接下來幾週的基準數字、帳單數字，以及那 5% 被護欄擋下的請求裡究竟藏著什麼，一一說明。

資料來源

Anthropic Claude Fable 5 大型語言模型 AI 安全基準測試