无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

5000萬行代碼遷移一天搞定!Anthropic重磅發布Claude Fable 5、Mythos 5

0
分享至


整理 | 蘇宓

出品 | CSDN(ID:CSDNnews)

6 月 10 日凌晨,Anthropic 重磅發布了兩款頂級大模型——Claude Fable 5 和 Claude Mythos 5。

作為 Anthropic 當前最強的「Mythos」模型成員,這兩款模型剛剛亮相,便迅速引爆全球開發者社區。短短幾個小時內,社交媒體和 AI 圈幾乎被同一個話題刷屏:Claude 又把大模型能力推到了什么程度?

Anthropic 官方給出的評價相當直接:Claude Fable 5 已經超越此前所有公開發布的 Claude 模型,在軟件工程、知識工作、視覺理解和科研任務等多個領域達到新的高度,并在絕大多數主流評測基準上躋身行業第一梯隊。


一天內完成 5000 萬行代碼庫的遷移

不過,比起冰冷的跑分數據,第一批體驗者的反饋反而更快吸引了開發者的注意。

Claude Code 之父 Boris Cherny稱:“Fable 5 是自去年 11 月 Opus 4.5 發布以來最大一次模型能力躍升。”

此前 Opus 4.5 發布后,Boris Cherny 意識到自己已經連續幾周 100% 在終端里完成所有編程工作,于是干脆把 IDE 都卸載了。

而到了 Fable 5,他的感受再次發生變化:Claude 不再只是一個“Coding Agent”,而更像是在產品構建過程中與你并肩工作的思考伙伴和設計伙伴。它擁有以往模型所缺乏的判斷力、審美能力以及多維度思考能力。

最令他印象深刻的是一次調試經歷:面對一個復雜 Bug,Fable 5 并沒有急于修改代碼,而是像資深工程師一樣先收集數據、添加日志、驗證假設,在確認問題真正解決后才宣布完成任務。

更重要的是,這種行為并非來自 Claude Code 的特殊提示詞設計,而更像是模型自身形成的一種能力和習慣。

「這完全是模型自身表現出來的一種特質,仿佛已經內化成了它的“性格”。它身上確實有一種我此前從未感受過的東西——一種典型的“超大模型氣息”」, Boris Cherny 說道。


如果說 Boris 的評價更多來自長期使用體驗,那么投資機構 Menlo Ventures 合伙人、Google Search 早期成員 Deedy Das 的感受則更加直接。

他表示,Claude Fable 5 絕對是自己見過“最離譜”的模型之一,并第一次真切地對軟件工程的未來感到擔憂。

隨后,他還整理了 Claude Fable 5 完成的 一些最不可思議的事情,例如:

  • 在一天內完成對 Stripe 一個 5000 萬行代碼庫的遷移(人類團隊通常需要兩個月)。

  • 繪制令人驚嘆的 3D 圖形,包括波音 747 客機、包含超過 5000 個對象的太空模擬場景、《Minecraft》過山車、完全照片級真實感的森林場景、紐約市天際線、暴風雨云層效果。

  • 一次性通關《寶可夢 火紅版》(Pokémon FireRed)。

  • 對一個真實世界的專有交互網求值器進行優化,性能提升 10 倍,遠超競品 GPT-5.5。


相較之下,剛剛加入 Anthropic 的 Andrej Karpathy,則把這次發布稱為一次“大版本升級”的飛躍式進步。

Karpathy 認為,隨著軟件生產成本不斷下降,一個新的時代正在到來——軟件正變得像自來水一樣觸手可得。人們將不再只是讓 AI 寫代碼,而是直接讓 AI 生成解釋工具、數據儀表盤、研究平臺、自動化系統乃至完整應用。


CSDN 6 月寵粉福利

200 小時 GPU 算力免費送

瑞幸咖啡/肯德基早餐/下午茶等能量套餐任選其一

入群還可每月定期抽取旗艦顯卡、AI PC 等極客神裝



Claude Fable 5 和 Mythos 5 到底是什么?

值得注意的是,Anthropic 這次在發布兩款模型時,并沒有將它們簡單區分為大模型與小模型。

Claude Fable 5 和 Claude Mythos 5 兩款模型底層架構完全一致,核心能力持平,最大差異集中在開放權限、安全限制、使用人群三大維度,也就是哪些用戶可以使用這兩個模型、用戶如何使用、以及模型允許輸出哪些內容。

簡單可以理解為「大眾安全版」和「專業無限制版」。

Claude Fable 5:面向多數人的主力旗艦

Claude Fable 5 面向多數人開放,是首款正式向普通用戶、開發者與企業提供的 Mythos 級模型,也是 Anthropic 目前對外公開的最強通用大模型。

相較 Claude Mythos 5,這一版本做出了一定限制。

為了規避高風險濫用,Fable 5 引入了全新的安全分類器,相當于為強能力加裝“安全閥門”:當用戶問題觸及網絡安全攻防、生物、化學等敏感領域時,模型會自動降級,切換到上一代成熟模型 Claude Opus 4.8 進行回復,從而避免釋放全部高風險能力。

Claude Mythos 5:受限開放的滿血旗艦

Claude Mythos 5 則算是“滿血版”的旗艦模型,能力與 Fable 5 完全一致,但移除了所有安全分類限制。

不過,該模型并不對外開放,而是通過 Anthropic 的 Project Glasswing 進行定向授權,僅面向少數經過嚴格審核的機構,例如網絡安全防御公司、關鍵基礎設施服務商以及合規的生物醫學科研團隊,主要用于漏洞挖掘與前沿科研等專業場景。

Anthropic 表示,Claude Mythos 5 現階段將依托“玻璃翼計劃”(Project Glasswing)落地,該項目由其與美國政府合作推進,也是此前 Mythos 預覽版的升級版本。

在實際使用中,這意味著 Mythos 5 在部分敏感領域(如網絡安全與生物研究)具備更強能力,因為它可以直接回答相關問題,而 Fable 5 會進行安全降級處理。



新模型到底強在哪?

本次迭代并非小修小補,相較舊版 Claude 模型,Claude Fable 5 和 Claude Mythos 5 能夠獨立完成更長周期的任務,在多項基準測試中幾乎都處于領先位置。


軟件工程能力上,這是企業最關注的核心提升方向。Anthropic 表示,Fable 5 可以在更長時間內自主運行,并在更少人工干預下完成復雜任務,這正是 AI agent 從“代碼補全工具”走向“自主執行系統”的關鍵一步。

在 SWE-bench Pro(衡量模型解決復雜軟件工程問題能力的基準)上,Anthropic 稱 Fable 5 與 Mythos 5 達到了 80.3% 的成績,顯著高于 OpenAI 最新通用模型 GPT-5.5 的 58.6%。

在 Cognition 的 FrontierCode Diamond 基準測試中(用于評估高質量、可維護的 Agent 編程能力),兩者得分為 29.3%,而 Claude Opus 4.8 為 13.4%,GPT-5.5 為 5.7%。


Anthropic 還指出,Fable 5 即使在“中等推理強度”下,也能在 FrontierCode 上取得領先成績,這意味著它不一定依賴最大算力也能輸出更好的編程結果。


在落地案例中,支付公司 Stripe 提供了一個極具代表性的測試。

Stripe 在其約5000 萬行 Ruby 代碼庫中測試 Fable 5模型在一天內完成了全庫級別遷移,而這一工作通常需要工程團隊兩個月以上。

此外,在知識能力方面,Fable 5 也被定位為企業知識工作的強力工具。

在 GDPval-AA 上,Fable 5 與 Mythos 5 的得分為 1932,高于 Claude Opus 4.8 的 1890、GPT-5.5 的 1769,以及 Gemini 3.1 Pro 的 1314。

在 GDPpdf(側重文檔視覺理解)測試中,兩者在無工具條件下達到 29.8%,明顯高于 Opus 4.8 的 22.5%、GPT-5.5 的 24.9% 和 Gemini 3.1 Pro 的 16.7%。

這些能力對企業尤為關鍵,因為現實業務中大量信息仍以非結構化形式存在:PDF、表格、圖表、報告、合同、財報、PPT 與截圖等。

Anthropic 表示,Fable 5 在文檔推理、圖表理解以及復雜問題解決方面都有明顯提升。

在視覺能力與界面理解維度,Anthropic 還強調,Fable 5 是其目前最強的視覺模型。它可以從專業科學圖表中提取精準數據,也能僅憑應用截圖還原整套網頁應用源代碼,完成各類高難度視覺任務。

Anthropic 稱,模型對輔助工具的依賴度也大幅降低:以往版本的 Claude 模型,即便搭配專屬輔助程序,也難以通關《寶可夢:火紅》;而 Fable 5 僅依靠純視覺識別,就順利打通了這款游戲。


定價

定價方面,Anthropic 為 Claude Fable 5 和 Mythos 5 設定的定價均為輸入 10 美元/百萬 tokens,輸出 50 美元/百萬 tokens。

這一價格相比此前 Mythos Preview 已下降一半,但仍處于全球主流大模型定價高位。

對開發者而言,Fable 5 已通過 Claude API 提供訪問,接口名稱為 claude-fable-5。Anthropic 表示,該模型今天起已在 API 以及按用量計費的企業套餐中全面開放。

不過對于訂閱用戶來說,這次上線的規則要更復雜一些。

Anthropic 表示,從今天起到 6 月 22 日,Fable 5 將免費包含在 Pro、Max、Team 以及按席位計費的企業套餐中,無需額外費用。

但從 6 月 23 日開始,公司計劃將其從這些訂閱套餐中移除,之后若要繼續使用,將需要消耗使用額度。

Anthropic 同時表示,他們的目標是盡快讓 Fable 5 重新回到標準訂閱套餐之中,作為長期可用功能提供。


與此同時,Anthropic 還為 Mythos 類模型引入了新的數據留存機制:Fable 5、Mythos 5 及未來同級模型,將在所有使用場景下實施 30 天數據保留要求。

Anthropic 稱,這些數據不會用于訓練新的 Claude 模型,也不會用于非安全目的,并將通過訪問日志記錄與到期刪除機制進行保護,大多數情況下會在 30 天后自動清除。

整體來看,這兩款模型確實代表了 Claude 當前的能力上限,性能提升非常明顯,但“靜默降級”的安全設計也引發了一定爭議。對于開發者與 AI 愛好者而言,趁免費窗口期實際體驗,或許是理解這一代“神話級模型”的最好方式。

參考:

https://x.com/karpathy/status/2064409694761054332

https://www.anthropic.com/news/claude-fable-5-mythos-5

開發者“神裝”補給站|極客頭條讀者專屬福利

200 小時 GPU 算力免費送

瑞幸咖啡/肯德基早餐/下午茶等能量套餐任選其一

入群還可每月定期抽取旗艦顯卡、AI PC 等極客神裝


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
世界杯還沒開始,伊朗隊就創造了一項前無古人的紀錄

世界杯還沒開始,伊朗隊就創造了一項前無古人的紀錄

張斌說
2026-06-13 23:02:09
卡塔爾VS瑞士,比賽精準分析,一場開賽以來最沒懸念的比賽?

卡塔爾VS瑞士,比賽精準分析,一場開賽以來最沒懸念的比賽?

云隱南山
2026-06-13 13:09:04
高校后勤女子出軌校外男:身材超好!雙方私密聊天不堪入目

高校后勤女子出軌校外男:身材超好!雙方私密聊天不堪入目

老貓觀點
2026-06-13 07:25:10
尷尬!技師給顧客把褲子拉上去,用毛巾蓋好,上海一足療店被差評

尷尬!技師給顧客把褲子拉上去,用毛巾蓋好,上海一足療店被差評

火山詩話
2026-06-13 06:24:48
澳網法網雙決賽不入,辛納成三十余年來球王第三人!

澳網法網雙決賽不入,辛納成三十余年來球王第三人!

網球之家
2026-06-13 22:27:10
范德比爾特曬出新車,東契奇評論:可以把車借我開嗎求求了

范德比爾特曬出新車,東契奇評論:可以把車借我開嗎求求了

懂球帝
2026-06-13 22:23:08
世界杯又見手撕球衣名場面!該球衣品牌曾被吐槽“但愿他們不產安全套”

世界杯又見手撕球衣名場面!該球衣品牌曾被吐槽“但愿他們不產安全套”

南方都市報
2026-06-13 13:32:55
全線轉跌,超12萬人爆倉

全線轉跌,超12萬人爆倉

每日經濟新聞
2026-06-12 00:18:19
阿媒:阿根廷9人將佩戴世界杯首秀徽章出戰

阿媒:阿根廷9人將佩戴世界杯首秀徽章出戰

懂球帝
2026-06-13 10:41:16
中方通告全球,菲律賓的回應來了,菲反對黨:拆除所有中方建筑

中方通告全球,菲律賓的回應來了,菲反對黨:拆除所有中方建筑

楠楠自語
2026-06-14 00:12:30
突發 | 山東一化工企業工廠突發火災,周邊居民聽到爆炸聲

突發 | 山東一化工企業工廠突發火災,周邊居民聽到爆炸聲

天津廣播
2026-06-13 23:43:59
醫生發現:吃一個西紅柿,就等于喝了一大口碳酸飲料,真的假的?

醫生發現:吃一個西紅柿,就等于喝了一大口碳酸飲料,真的假的?

路醫生健康科普
2026-06-13 15:45:43
世界杯太慘了!邀約4000人到場0人,央視疑似虧錢,評論區太現實

世界杯太慘了!邀約4000人到場0人,央視疑似虧錢,評論區太現實

譚談社會
2026-06-12 23:51:18
丹丹的餐廳在“四不”抵制下門可羅雀,印度丈夫要把全家帶到中國

丹丹的餐廳在“四不”抵制下門可羅雀,印度丈夫要把全家帶到中國

魔都姐姐雜談
2026-06-13 15:58:31
美國4-1巴拉圭!可怕的不是贏球,是美國主帥賽后這番話,很實在

美國4-1巴拉圭!可怕的不是贏球,是美國主帥賽后這番話,很實在

小青年淥淥
2026-06-13 15:03:53
太慘了!利物浦被挖空!剛免簽羅伯遜,熱刺又砸 6000 萬撿漏王牌

太慘了!利物浦被挖空!剛免簽羅伯遜,熱刺又砸 6000 萬撿漏王牌

奶蓋熊本熊
2026-06-14 04:40:08
1夜7大轉會!皇馬成功截胡B席,槍手兩筆清洗,拉什福德被退貨!

1夜7大轉會!皇馬成功截胡B席,槍手兩筆清洗,拉什福德被退貨!

田先生籃球
2026-06-13 06:53:45
英格蘭隊隊長凱恩只穿內褲照片被曝光,球迷調侃:被偷得只剩褲衩;該隊世界杯訓練裝備大部分已追回

英格蘭隊隊長凱恩只穿內褲照片被曝光,球迷調侃:被偷得只剩褲衩;該隊世界杯訓練裝備大部分已追回

極目新聞
2026-06-14 00:20:46
為什么家里不要隨便裝監控?很多人都不知道內情,看完漲知識了

為什么家里不要隨便裝監控?很多人都不知道內情,看完漲知識了

小俊分享
2026-06-02 12:07:15
成本13億,首日票房僅400多萬,世界第一導演新片被謝苗打懵了

成本13億,首日票房僅400多萬,世界第一導演新片被謝苗打懵了

影視高原說
2026-06-12 17:28:16
2026-06-14 05:12:50
CSDN incentive-icons
CSDN
成就一億技術人
26647文章數 242291關注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

特朗普:美伊協議計劃周日簽署 霍爾木茲海峽立即開放

頭條要聞

特朗普:美伊協議計劃周日簽署 霍爾木茲海峽立即開放

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

時尚
教育
旅游
親子
公開課

夏天穿衣要杜絕土氣感!試試精致的小香風,優雅與俏皮并存

教育要聞

基礎不好建議避開的超恐怖院校。

旅游要聞

夏天就該這樣過!大別山的夏天,從霍山大峽谷漂流的第一聲尖叫開始。

親子要聞

真正覺醒的家庭

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版