![]()
整理 | 蘇宓
出品 | CSDN(ID:CSDNnews)
6 月 10 日凌晨,Anthropic 重磅發布了兩款頂級大模型——Claude Fable 5 和 Claude Mythos 5。
作為 Anthropic 當前最強的「Mythos」模型成員,這兩款模型剛剛亮相,便迅速引爆全球開發者社區。短短幾個小時內,社交媒體和 AI 圈幾乎被同一個話題刷屏:Claude 又把大模型能力推到了什么程度?
Anthropic 官方給出的評價相當直接:Claude Fable 5 已經超越此前所有公開發布的 Claude 模型,在軟件工程、知識工作、視覺理解和科研任務等多個領域達到新的高度,并在絕大多數主流評測基準上躋身行業第一梯隊。
![]()
一天內完成 5000 萬行代碼庫的遷移
不過,比起冰冷的跑分數據,第一批體驗者的反饋反而更快吸引了開發者的注意。
Claude Code 之父 Boris Cherny稱:“Fable 5 是自去年 11 月 Opus 4.5 發布以來最大一次模型能力躍升。”
此前 Opus 4.5 發布后,Boris Cherny 意識到自己已經連續幾周 100% 在終端里完成所有編程工作,于是干脆把 IDE 都卸載了。
而到了 Fable 5,他的感受再次發生變化:Claude 不再只是一個“Coding Agent”,而更像是在產品構建過程中與你并肩工作的思考伙伴和設計伙伴。它擁有以往模型所缺乏的判斷力、審美能力以及多維度思考能力。
最令他印象深刻的是一次調試經歷:面對一個復雜 Bug,Fable 5 并沒有急于修改代碼,而是像資深工程師一樣先收集數據、添加日志、驗證假設,在確認問題真正解決后才宣布完成任務。
更重要的是,這種行為并非來自 Claude Code 的特殊提示詞設計,而更像是模型自身形成的一種能力和習慣。
「這完全是模型自身表現出來的一種特質,仿佛已經內化成了它的“性格”。它身上確實有一種我此前從未感受過的東西——一種典型的“超大模型氣息”」, Boris Cherny 說道。
![]()
如果說 Boris 的評價更多來自長期使用體驗,那么投資機構 Menlo Ventures 合伙人、Google Search 早期成員 Deedy Das 的感受則更加直接。
他表示,Claude Fable 5 絕對是自己見過“最離譜”的模型之一,并第一次真切地對軟件工程的未來感到擔憂。
隨后,他還整理了 Claude Fable 5 完成的 一些最不可思議的事情,例如:
在一天內完成對 Stripe 一個 5000 萬行代碼庫的遷移(人類團隊通常需要兩個月)。
繪制令人驚嘆的 3D 圖形,包括波音 747 客機、包含超過 5000 個對象的太空模擬場景、《Minecraft》過山車、完全照片級真實感的森林場景、紐約市天際線、暴風雨云層效果。
一次性通關《寶可夢 火紅版》(Pokémon FireRed)。
對一個真實世界的專有交互網求值器進行優化,性能提升 10 倍,遠超競品 GPT-5.5。
![]()
相較之下,剛剛加入 Anthropic 的 Andrej Karpathy,則把這次發布稱為一次“大版本升級”的飛躍式進步。
Karpathy 認為,隨著軟件生產成本不斷下降,一個新的時代正在到來——軟件正變得像自來水一樣觸手可得。人們將不再只是讓 AI 寫代碼,而是直接讓 AI 生成解釋工具、數據儀表盤、研究平臺、自動化系統乃至完整應用。
![]()
CSDN 6 月寵粉福利
200 小時 GPU 算力免費送
瑞幸咖啡/肯德基早餐/下午茶等能量套餐任選其一
入群還可每月定期抽取旗艦顯卡、AI PC 等極客神裝
![]()
![]()
Claude Fable 5 和 Mythos 5 到底是什么?
值得注意的是,Anthropic 這次在發布兩款模型時,并沒有將它們簡單區分為大模型與小模型。
Claude Fable 5 和 Claude Mythos 5 兩款模型底層架構完全一致,核心能力持平,最大差異集中在開放權限、安全限制、使用人群三大維度,也就是哪些用戶可以使用這兩個模型、用戶如何使用、以及模型允許輸出哪些內容。
簡單可以理解為「大眾安全版」和「專業無限制版」。
Claude Fable 5:面向多數人的主力旗艦
Claude Fable 5 面向多數人開放,是首款正式向普通用戶、開發者與企業提供的 Mythos 級模型,也是 Anthropic 目前對外公開的最強通用大模型。
相較 Claude Mythos 5,這一版本做出了一定限制。
為了規避高風險濫用,Fable 5 引入了全新的安全分類器,相當于為強能力加裝“安全閥門”:當用戶問題觸及網絡安全攻防、生物、化學等敏感領域時,模型會自動降級,切換到上一代成熟模型 Claude Opus 4.8 進行回復,從而避免釋放全部高風險能力。
Claude Mythos 5:受限開放的滿血旗艦
Claude Mythos 5 則算是“滿血版”的旗艦模型,能力與 Fable 5 完全一致,但移除了所有安全分類限制。
不過,該模型并不對外開放,而是通過 Anthropic 的 Project Glasswing 進行定向授權,僅面向少數經過嚴格審核的機構,例如網絡安全防御公司、關鍵基礎設施服務商以及合規的生物醫學科研團隊,主要用于漏洞挖掘與前沿科研等專業場景。
Anthropic 表示,Claude Mythos 5 現階段將依托“玻璃翼計劃”(Project Glasswing)落地,該項目由其與美國政府合作推進,也是此前 Mythos 預覽版的升級版本。
在實際使用中,這意味著 Mythos 5 在部分敏感領域(如網絡安全與生物研究)具備更強能力,因為它可以直接回答相關問題,而 Fable 5 會進行安全降級處理。
![]()
![]()
新模型到底強在哪?
本次迭代并非小修小補,相較舊版 Claude 模型,Claude Fable 5 和 Claude Mythos 5 能夠獨立完成更長周期的任務,在多項基準測試中幾乎都處于領先位置。
![]()
在軟件工程能力上,這是企業最關注的核心提升方向。Anthropic 表示,Fable 5 可以在更長時間內自主運行,并在更少人工干預下完成復雜任務,這正是 AI agent 從“代碼補全工具”走向“自主執行系統”的關鍵一步。
在 SWE-bench Pro(衡量模型解決復雜軟件工程問題能力的基準)上,Anthropic 稱 Fable 5 與 Mythos 5 達到了 80.3% 的成績,顯著高于 OpenAI 最新通用模型 GPT-5.5 的 58.6%。
在 Cognition 的 FrontierCode Diamond 基準測試中(用于評估高質量、可維護的 Agent 編程能力),兩者得分為 29.3%,而 Claude Opus 4.8 為 13.4%,GPT-5.5 為 5.7%。
![]()
Anthropic 還指出,Fable 5 即使在“中等推理強度”下,也能在 FrontierCode 上取得領先成績,這意味著它不一定依賴最大算力也能輸出更好的編程結果。
![]()
在落地案例中,支付公司 Stripe 提供了一個極具代表性的測試。
Stripe 在其約5000 萬行 Ruby 代碼庫中測試 Fable 5,模型在一天內完成了全庫級別遷移,而這一工作通常需要工程團隊兩個月以上。
此外,在知識能力方面,Fable 5 也被定位為企業知識工作的強力工具。
在 GDPval-AA 上,Fable 5 與 Mythos 5 的得分為 1932,高于 Claude Opus 4.8 的 1890、GPT-5.5 的 1769,以及 Gemini 3.1 Pro 的 1314。
在 GDPpdf(側重文檔視覺理解)測試中,兩者在無工具條件下達到 29.8%,明顯高于 Opus 4.8 的 22.5%、GPT-5.5 的 24.9% 和 Gemini 3.1 Pro 的 16.7%。
這些能力對企業尤為關鍵,因為現實業務中大量信息仍以非結構化形式存在:PDF、表格、圖表、報告、合同、財報、PPT 與截圖等。
Anthropic 表示,Fable 5 在文檔推理、圖表理解以及復雜問題解決方面都有明顯提升。
在視覺能力與界面理解維度,Anthropic 還強調,Fable 5 是其目前最強的視覺模型。它可以從專業科學圖表中提取精準數據,也能僅憑應用截圖還原整套網頁應用源代碼,完成各類高難度視覺任務。
Anthropic 稱,模型對輔助工具的依賴度也大幅降低:以往版本的 Claude 模型,即便搭配專屬輔助程序,也難以通關《寶可夢:火紅》;而 Fable 5 僅依靠純視覺識別,就順利打通了這款游戲。
![]()
定價
定價方面,Anthropic 為 Claude Fable 5 和 Mythos 5 設定的定價均為輸入 10 美元/百萬 tokens,輸出 50 美元/百萬 tokens。
這一價格相比此前 Mythos Preview 已下降一半,但仍處于全球主流大模型定價高位。
對開發者而言,Fable 5 已通過 Claude API 提供訪問,接口名稱為 claude-fable-5。Anthropic 表示,該模型今天起已在 API 以及按用量計費的企業套餐中全面開放。
不過對于訂閱用戶來說,這次上線的規則要更復雜一些。
Anthropic 表示,從今天起到 6 月 22 日,Fable 5 將免費包含在 Pro、Max、Team 以及按席位計費的企業套餐中,無需額外費用。
但從 6 月 23 日開始,公司計劃將其從這些訂閱套餐中移除,之后若要繼續使用,將需要消耗使用額度。
Anthropic 同時表示,他們的目標是盡快讓 Fable 5 重新回到標準訂閱套餐之中,作為長期可用功能提供。
![]()
與此同時,Anthropic 還為 Mythos 類模型引入了新的數據留存機制:Fable 5、Mythos 5 及未來同級模型,將在所有使用場景下實施 30 天數據保留要求。
Anthropic 稱,這些數據不會用于訓練新的 Claude 模型,也不會用于非安全目的,并將通過訪問日志記錄與到期刪除機制進行保護,大多數情況下會在 30 天后自動清除。
整體來看,這兩款模型確實代表了 Claude 當前的能力上限,性能提升非常明顯,但“靜默降級”的安全設計也引發了一定爭議。對于開發者與 AI 愛好者而言,趁免費窗口期實際體驗,或許是理解這一代“神話級模型”的最好方式。
參考:
https://x.com/karpathy/status/2064409694761054332
https://www.anthropic.com/news/claude-fable-5-mythos-5
開發者“神裝”補給站|極客頭條讀者專屬福利
200 小時 GPU 算力免費送
瑞幸咖啡/肯德基早餐/下午茶等能量套餐任選其一
入群還可每月定期抽取旗艦顯卡、AI PC 等極客神裝
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.