Claude 上新
今天凌晨,Anthropic 發布新模型 Fable 5,毫無疑問的,也是當下的最強模型
![]()
這時候,手機前、剛起床的彥祖可能會問:不是說發的是 Mythos 么?這個 Fable 是啥?其實啊,Mythos 和 Fable 底層是同一個模型,區別在于護欄:
原版的模型叫做 Mythos 5,只給政府和特定機構使用;定價:
$25/百萬 token輸入,$125/百萬 token輸出這個加上護欄的、開放給所有人使用的,叫做 Fable 5,定價是
$10/百萬 token輸入、$50/百萬 token輸出(剛好比 opus 4.8 貴一倍)
Pro、Max、Team 和按席位的 Enterprise 計劃,6 月 22 號之前免費包含 Fable 5(吃 Opus 兩倍額度),之后要花 usage credits,API 今天就完全可用,模型名稱叫做claude-fable-5
![]()
這里我也淺淺試了一下,體感上確實不錯
但是...注意,我說但是了,對于護欄的存在,很多的任務拒絕完成,然后強行退回 Opus 4.8
![]()
如果是 Claude Code,它則會回復說
Request was blocked
This request triggered safety guardrails. Rephrase your prompt or rewind to continue.
Anthropic 說觸發率不到 5%,我的實際感受遠高于這個數字,以至于到目前為止我還沒能完整地跑通一個「全程由 Fable 回答」的任務,同時,我發現自己并非唯一的幸運兒
比如下面這個,生物學家對 fable 5 說 hi,然后被拒絕...原因是記憶里面包含相關的生物信息,判定為風險...然后如果開啟了隱身模式,就能正常 say hi 了,這就尼瑪...
![]()
所以吧...真可能是我各種奇奇怪怪的事兒做多了,系統覺得「此子必不可留」,讓我獲得了足夠的「不配得感」,所以這篇文章里關于能力的部分,大部分來自官方數據和早期測試客戶的反饋,來自官方公告
官方公告:anthropic.com/news/claude-fable-5-mythos-5
![]()
http://anthropic.com/news/claude-fable-5-mythos-5
一套模型,兩個名字
前文提到:Mythos 和 Fable 背后是同一個模型,區別在于護欄
套護欄叫 Fable,沒限制的叫 Mythos
而至于名字,Mythos 是希臘語的「神話」;Fable 來自法語的 Fabula 也就是「被講述的東西」,意思也比較相近
Mythos 級是 Anthropic 在 Opus 之上新立的一個能力層級。今年四月,他們通過 Project Glasswing(玻璃翼計劃?這個也沒啥正式翻譯)放出了第一個 Mythos 級模型 Claude Mythos Preview,只給一小撮網絡安全防御者和關鍵軟件基建方
當時就說了,等護欄做好了,會把 Mythos 級開放給所有人,也就有了 Fable
至此,A 社的模型能力排行如下:
正版 Mythos > Fable > Opus > Sonnet > Haiku
斗宗強者
毫無疑問,根據「越新的頭部模型越強」的普遍原則,Fable 5 幾乎在所有測試基準上都是當前最強,任務越長越復雜,它甩開其他模型越遠
比如:Stripe 拿 Fable 5 跑了一個五千萬行的 Ruby 代碼庫的全庫遷移, 一天做完。同樣的活兒,一個團隊手工干要兩個多月。Fable 5 還比過去的 Claude 更省 token,同樣的難題花的錢更少。在 Cognition 的 FrontierCode 評測上,它在中等推理強度下就拿了前沿模型里的最高分
![]()
拿到早期權限的客戶各自跑了測試,挑幾句看看口徑。Cursor 的 Michael Truell 說它在 CursorBench 上是最強模型,打開了一類過去夠不著的長周期問題。GitHub 的 Mario Rodriguez 說它接復雜的長周期編碼任務,自主性和可靠性超過了之前的基準。Cognition 的 Scott Wu 說它是 FrontierBench 上得分最高的模型,開箱就能泛化到陌生工具。Replit 的 Michele Catasta 說它在自家的 vibe-coding 評測上幾乎跑滿
![]()
恐怖如斯
作為宗門的新一代天驕,Fable 5 它是通關了寶可夢的
過去的 Claude 玩寶可夢,是得搭一套輔助 harness,負責喂各種游戲狀態。Fable 5 只看原始截圖,就把《寶可夢 火紅》從頭打到尾通關了,竟與當時接受九年義務教育的我一樣強,不愧是宗門天驕
之前那套喂地圖喂狀態的 harness,不再必要了
它還能從科學圖表里摳出精確數字,看幾張截圖就把一個網頁應用的源碼重建出來
記憶和長上下文也上了一個臺階,比如讓它玩《殺戮尖塔》,給它一份持久存取的文件當記憶,成績提升是 Opus 4.8 的三倍,打到最終幕的次數也是三倍...這怎么玩的游戲和我一樣,不愧是和我一樣的斗宗強者
![]()
![]()
至于剩下的,Anthropic 放了四個 demo,我一個一個貼
第一個,它從物理第一性原理推導行星軌道運動,拿這個預測日食
日食模擬,從萬有引力開始算的
第二個,它自己玩《異星工廠》Factorio,自己規劃策略、自己把自動化流水線搭起來
很休閑的一款游戲,推薦大家試試
這個游戲好啊,益智、提神、醒腦,難怪 Fable 這么聰明
![]()
第三個,它在瀏覽器里的 CAD 編輯器里設計了一個完整的可 3D 打印模型。那個 CAD 編輯器也是它造的,包括里面的 AI copilot
編輯器是它造的,模型也是它設計的
第四個,它寫代碼做了一段流體模擬,流體的運動卡上一首古典 EDM remix 的節拍。那首 remix 也是它用代碼生成的,它從沒聽過音樂
從沒聽過音樂,用代碼作了首 EDM
知識工作方面,Hebbia 面向資深推理的金融評測里,Fable 5 拿了所有模型的最高分。IMC 說它的交易分析評測幾乎全項滿分
假設被實驗室證實
Mythos 5 在生物科研上做到的事,跑分表格裝不下了
先說藥物設計。Anthropic 內部的蛋白設計專家用 Mythos 5,把藥物設計過程的部分環節加速了約十倍。有一個例子,Mythos 5 拿著蛋白設計和生物信息學工具,在無人干涉下,做到了匹配甚至超過熟練的人類操作者,把項研究里的 14 個蛋白靶點,9 個產出了值得繼續做藥的強候選
![]()
免疫檢查點、神經退行、肌肉病這些靶點,9 個出了強候選
Mythos 5 是 Anthropic 第一個能穩定產出新穎且站得住腳的科學假設的模型。在盲測對比里,科學家有大約八成的時候更偏好 Mythos 的分子生物學假設而不是 Opus 級模型的。對于實驗假設,有些已經出成果了:比如一個關于大腸桿菌某蛋白的新機制,已被相關實驗室的研究證實了
基因組學那邊,Mythos 5 在超過一周的大體自主的工作里做了一項新研究。它把橫跨 138 個動物物種、數百萬個細胞的單細胞數據組裝起來,自己設計并訓練了一個機器學習模型,用來識別在親緣很遠的物種里執行相同功能的細胞
Mythos 訓出來的這個模型,超過了最近發表在 Science 上的一個模型,體積還小了 100 倍,結果計劃未來幾個月發表
護欄
可能我的記憶里的信息比較詭異,導致簡單的任務我能跑
![]()
復雜的請求就被退回
![]()
背后 Anthropic 給 Fable 5 套了一組分類器,單獨的 AI 系統,盯著每一輪對話,判斷你的請求有沒有碰到三個區域:網絡安全、生物化學、蒸餾。碰到了就把球扔給 Opus 4.8
Anthropic 說平均觸發率在 5% 以下,超過 95% 的會話完全不觸發。但這個數字是按會話數算的,發個「hi」也算一個會話。真拿它干活,尤其是長任務,體感完全是另一回事
任務一長,中間某一輪碰了分類器,整個對話就從 Fable 切到了 Opus,后面的回答都是 Opus 4.8 在給你穩穩接住
再比如我的歷史記憶比較復雜,可能就會莫名其妙的被視作宗門細作,退回的時候界面頂上會頂出一行「Switched to Opus 4.8」,右邊給你一個「Edit and retry with Fable 5」,讓你改改話術再撞一次護欄
就比如下面這個極為正常的工作:翻譯全文:https://www.anthropic.com/news/claude-fable-5-mythos-5
![]()
Edit and retry 這詞起得講究...
Claude Code 那邊也一樣,碰到護欄就直接彈 Request was blocked,讓你改問題或者回退
再說回 Fable 的三類拒絕回答
第一類是網絡安全。Mythos 級模型擅長找漏洞、利用漏洞,還會做 agentic hacking,把偵察、橫向移動這些環節自己串起來。護欄直接讓 Fable 在這類任務上做不出任何進展
![]()
Anthropic 做了大量紅隊測試,外部 bug bounty 跑了超過 1000 小時沒找到通用越獄,外部紅隊在長周期 agentic 任務上也沒找到,只有英國 AISI 在一個很短的初始窗口里有所進展
![]()
一家外部合作方測下來,Fable 5 在有害網絡請求上的護欄是所測全部模型里最硬的,比 Opus 4.8 和 4.7 都硬,對 30 種公開越獄技術零突破
第二類是生物和化學。過去只擋很窄的一撮生物武器問題,現在 Anthropic 覺得不夠了。他們測了 Mythos 5 預測一種病毒外殼組裝的能力(用的是 Dyno Therapeutics 未發表的候選),那是設計基因治療載體 AAV 的一步,同樣的本事換個人用就能拿去設計危險病毒
![]()
Mythos 級模型光靠生物推理就超過了專門做蛋白任務的蛋白語言模型。為了盡快安全發布,眼下 Fable 把大部分生物化學請求都退回給了 Opus 4.8,往后會慢慢收窄
第三類是蒸餾。Anthropic 此前發現過大規模的蒸餾企圖,而之后這些行為,會被分類器標記為蒸餾,然后退回 Opus 4.8
還有一處變化跟企業客戶直接相關。Mythos 級模型的所有流量,無論是 Anthropic 自家界面還是第三方,都要求 30 天數據保留
這些數據不拿去訓練、不做安全以外的用途,會記錄所有人類訪問,30 天后刪除
先免費,6 月 22 截止
打開網頁版會先彈一個框,告訴你 Fable 5 在 6 月 22 號之前算在套餐額度里,但它吃額度是 Opus 的兩倍。6 月 23 號起從訂閱計劃里撤掉,之后要用得花 usage credits
等容量夠了,再把它恢復成訂閱計劃的標準配置
![]()
吃 Opus 兩倍額度,6 月 23 號起這部分得自己掏 credits
網頁版的模型列表里能直接選到 Fable 5,旁邊標著「Included until June 22」。Claude Code 那邊,無論是 terminal 還是 Claude 應用,列表里默認看不到它,得手動敲 /model claude-fable-5 才能切過去
![]()
網頁里能選到,Claude Code 里得敲 /model claude-fable-5 才出來
平臺這邊,claude-fable-5 在 Claude API、AWS 上的 Claude Platform、Amazon Bedrock、Vertex AI、Microsoft Foundry 都能調
Mythos 5 則不公開,只給 Glasswing 的合作伙伴(拆了網絡安全護欄),以及不久后選定的一批生物研究者(拆了生物化學護欄)。Anthropic 說會跟美國政府一起,穩步擴大 Mythos 5 的可信訪問名單,還要開一個讓網絡安全機構系統化申請的通道,另開一個面向生物研究的通道
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.