Anthropic 昨晚一口氣放出倆新模型,Fable 5 和 Mythos 5。
那個一直藏著掖著的“Mythos (神話)級別”能力,終于拿出來給普通人了。
但你能拿到的,是 Fable 5。Mythos 5 那個版本,還是只給少數人。這倆之間的關系,是這篇最該先講清楚的事。
01先搞懂這對“雙胞胎”
要聽懂這事,得先知復習一下 Claude 原來的模型系列。
過去兩年,Claude 的模型一直是三個檔,從低到高:Haiku 干粗活,Sonnet 是中間檔最常用,Opus 是最強旗艦。你以前能摸到的天花板,就是Opus。
今年 4 月,這個天花板被捅破了。
Anthropic 在 Opus 頭上又搭了一層閣樓,叫 Mythos,比 Opus 高一級,是個全新的檔位。這次的 Fable 5 和 Mythos 5,就住在這層閣樓里。
換句話說,它倆天生就比我們之前用過的任何 Claude 都高半頭。
回到這倆“雙胞胎”。Fable 5 和 Mythos 5,名字花里胡哨,你只要記住一句話:它倆是同一個大腦。
底層一模一樣,唯一的區別是,有沒有戴鐐銬。
打個比方。一個絕頂高手,武功蓋世。
Fable 5,是這高手戴著鐐銬上街,誰都能找他比劃,但有些狠招使不出來。這個版本,今天起你我都能用。
Mythos 5,是同一個高手把鐐銬解開,關進實驗室。只給信得過的人用,主要是搞網絡安全的政府機構和大公司,普通人摸不著。
連名字都藏了心思。Fable 是拉丁語“寓言”,Mythos 是希臘語“神話”,本來就是一個意思。同根同源,區別只在那副鐐銬。
02幾乎屠榜,只輸給自己
Fable 5 全面超越了 Anthropic 此前敢公開的任何一個模型。而且任務越長越復雜,它甩開別人越遠。
直接上官方那張對比表,同臺的有自家老二 Opus 4.8、OpenAI 的 GPT 5.5、谷歌的 Gemini 3.1 Pro,還有它自己的上一代特供版 Mythos Preview。
![]()
▲ 圖:官方跑分對比表,帶星號的是被安全機制影響的項目
我就不一一過了,挑幾個差距大到離譜的給大家說說。
寫代碼那項,它把 GPT 5.5 和 Gemini 甩開了 20 多分,不是贏一點,是不在一個段位。
最難的那項編程測試更夸張,它能做對將近三成,GPT 5.5 連一成不到。這已經不是領先了,是降維打擊。
法律那項最離譜。它分數本身不高,但看對手,GPT 勉強及格線都夠不著,Gemini 干脆交了白卷,零分。這個賽道,目前基本沒人能跟它站同一個臺子上。
一句話:你能想到的主流對手,在這張表上幾乎被它按在地上摩擦。
但有意思的是,它也有翻車的地方。
電腦操作那項,它居然輸了,輸給誰了?輸給它自己的上一代 Mythos Preview,差了零點幾分。
換句話說,這模型現在強到什么程度,全世界唯一還能跟它掰掰手腕的,只剩它自己的前一個版本了。
03具體強在哪,挨個說
跑分是抽象的,Anthropic 找了一堆真用過的公司現身說法。我按領域拆開講,你看看哪塊跟你有關。
第一塊,寫代碼。這是它的看家本領。
最出圈的是 Stripe。他們有個老到不行的龐大系統要做全面改造,這種活,一個工程師團隊正常得吭哧吭哧干兩個多月。
Fable 5 用了一天。
![]()
它牛的地方不只是快,而是能“放養”。掛在 Claude Code 這類工具里,它能連干好幾天不用人盯著,自己規劃步驟、自己寫測試驗證、干到一半還會回頭檢查有沒有跑偏。
GitHub 的人說,它能接那種以前只能交給人的、跨好幾天的復雜任務。
第二塊,知識工作。就是查資料、寫報告、做分析這些白領日常。
Notion 的說法很形象:那種你“一下午都磨不完”的活,把一堆亂七八糟的筆記丟給它,它能直接給你整理成一份能用的項目計劃。
簡單說,它不是幫你寫一段話,是幫你把整件事從頭辦到能交差。你只管驗收,不用盯著每一步。
第三塊,金融和法律。專業白領的硬骨頭。
一家叫 Balyasny 的資管公司說,這是他們測過的最強的金融模型。它能啃那種藏在長篇財報附件里的數字,做投資研究、算風險。
法律這邊,一家叫 Crosby 的律所說了句挺重的話:
“盲測里,我們律師發現它改的合同,每一次都追平甚至超過現用模型。”
每一次。這個詞從律師嘴里說出來,分量不輕。
第四塊,視覺。這是它這次升級最猛的地方之一。
它能看懂塞在文件和 PDF 里的圖表、表格,這對天天跟文檔打交道的金融、法律、分析崗特別有用。
更騷的是,它玩經典游戲寶可夢,全程只盯著游戲畫面截圖,沒地圖、沒攻略,就靠一雙“眼睛”裸眼通關。換以前的模型,得配一大堆輔助工具才勉強能玩。
還有一個能力,貫穿上面所有塊:自動化。
一家叫 Zapier 的公司有句話點得很到位:
換 Opus 會停下來問你,Fable 5 會自己接著找。自動化平臺 Zapier 的評價
這句話其實道破了這代模型的本質。它不再是個等你下指令的聊天框,而是個能自己往下推進、不撞墻不回頭的“干活的”。
它還順手干了件嚇人的事:自己設計藥物。
官方的蛋白質設計專家用它,把做藥的某個環節提速了大概十倍,一批靶點里有大半跑出了能往下做藥的候選方案。
它還自己搞了一周多的基因組研究,訓出來的小模型,效果干翻了之前發在頂級期刊《Science》上的模型,個頭只有人家的零頭。
看到這兒你大概有數了。官方自己的形容是:它干活越來越不像個聊天助手,越來越像個能獨當一面的資深同事。
04為什么給它戴鐐銬
因為太強了,真怕。
它能自己設計藥物蛋白,這本事用對方向是救命,用錯方向就是造毒。它在網絡攻擊上也強得離譜,能自己找漏洞、自己發起攻擊,這要落到壞人手里,等于給黑客直接開掛。
其實 Mythos 當初不敢公開,主要就是這個原因,挖漏洞的能力太嚇人,只能先偷偷給搞網絡安全的人用。
更擰巴的是,Anthropic 前腳剛公開警告“AI 正在變得太危險”,后腳就把這個最強的放出來了。一邊喊危險,一邊發最強,這操作本身就夠迷惑的。
他們的解法是加一道安檢。你要是問到網絡安全、生物化學這幾類敏感問題,這個最強模型并不會直接回答,而是自動把你的問題轉給稍弱的老模型 Opus 4.8,還會明明白白告訴你“這題我轉給同事了”。
為了證明這道鎖結實,他們專門請紅隊來砸,砸了一千多個小時,愣是沒找出一個能通用的破解辦法。
代價是,有時候好人正常提問也會被誤傷。官方也承認這道安檢調得偏嚴,寧可錯殺。不過他們說,真正觸發的對話不到二十分之一,絕大多數情況你根本碰不到,用的就是滿血版。
![]()
這副鐐銬的痕跡,你在那張跑分表里就能親眼看到。
帶星號的幾項,生物、網絡安全、健康,戴鐐銬的 Fable 和摘鐐銬的 Mythos 分數突然拉開。
因為 Fable 在這些領域會觸發攔截、甩鍋給 Opus,真實表現更貼近那個稍弱的 Opus。在最極端的攻擊型網絡安全測試里,開了攔截的 Fable,干脆就是零分。
換句話說,你能從一張冷冰冰的跑分表里,直接看出哪幾項被上了鎖。那個星號,就是鐐銬留下的印子。
05價格:全球最貴的那個
價格這事,得兩頭說。
它比上一代特供版砍了一半還多,聽著像撿了大便宜。但你先別急著高興,這個價,依然是全球主流模型里最貴的那一個,差不多是自家 Opus 4.8 的兩倍。
主流模型綜合價格對比(每百萬 token,美元) 小米 MiMo Flash $0.4 DeepSeek V4 Pro $1.3 Gemini 3.1 Pro $22 Claude Opus 4.8 $30 GPT 5.5 $35 Claude Fable 5 / Mythos 5 $60 全球最貴 注:綜合價 = 每百萬輸入 + 輸出 token 價格之和
▲ 圖:把主流模型按價格排隊,Fable 5 站在最貴那頭
所以這便宜,是跟它自己的前身比;貴,是跟全世界比。
怎么用,也透著一股扭捏。開發者今天起就能直接調用。
但訂閱用戶(Pro、Max、Team 這些)就復雜了:這兩周免費用,到 6 月 22 號截止;過了這天,Anthropic 就把它從套餐里撤下來,之后想用得自己掏額度;等以后服務器扛得住了,再考慮塞回套餐。
給的理由是需求太猛,扛不住。、
還有個容易踩的坑:這類模型的所有數據,Anthropic 要求強制保留 30 天,哪怕你之前簽的是“零留存”協議也得跟著改。
說是為了防新型攻擊,不拿去訓練。但對在意數據的人來說,這是個得留個心眼的變化。
也就是說,想白嫖史上最強,就 6 月 22 號之前這兩周,過期不候。
我看完最大的感受,不是這模型多牛,而是行業的畫風變了。
以前我們抱怨,是模型不夠強,答不上來、辦不成事。
現在反過來了,是模型強到廠商自己都得給它上鎖,前腳喊完“太危險”,后腳就一邊端出來一邊給它戴鐐銬。
至于那副鐐銬,到底是真為了安全,還是順手把最猛的能力留給了付費機構、把最貴的價簽掛給了所有人,這事我沒答案,你自己琢磨。
從“我盼著它更強”,變成了“我得琢磨怎么管住它”。這個轉折,挺微妙的
免費窗口就這兩周,你會去試試這個“史上最強”嗎?
覺得有用 → 點個??在看,下次它沒準能幫你把兩個月的活一天干完
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.