无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Claude 新模型 Fable 5 全解析:Mythos 級別的怪物

Claude新模型Fable5有多強

0
分享至

Claude 上新

今天凌晨,Anthropic 發布新模型 Fable 5,毫無疑問的,也是當下的最強模型


這時候,手機前、剛起床的彥祖可能會問:不是說發的是 Mythos 么?這個 Fable 是啥?其實啊,Mythos 和 Fable 底層是同一個模型,區別在于護欄:

  • 原版的模型叫做 Mythos 5,只給政府和特定機構使用;定價:$25/百萬 token輸入,$125/百萬 token輸出

  • 這個加上護欄的、開放給所有人使用的,叫做 Fable 5,定價是 $10/百萬 token輸入、$50/百萬 token輸出(剛好比 opus 4.8 貴一倍)

Pro、Max、Team 和按席位的 Enterprise 計劃,6 月 22 號之前免費包含 Fable 5(吃 Opus 兩倍額度),之后要花 usage credits,API 今天就完全可用,模型名稱叫做claude-fable-5


這里我也淺淺試了一下,體感上確實不錯

但是...注意,我說但是了,對于護欄的存在,很多的任務拒絕完成,然后強行退回 Opus 4.8


如果是 Claude Code,它則會回復說

Request was blocked

This request triggered safety guardrails. Rephrase your prompt or rewind to continue.

Anthropic 說觸發率不到 5%,我的實際感受遠高于這個數字,以至于到目前為止我還沒能完整地跑通一個「全程由 Fable 回答」的任務,同時,我發現自己并非唯一的幸運兒

比如下面這個,生物學家對 fable 5 說 hi,然后被拒絕...原因是記憶里面包含相關的生物信息,判定為風險...然后如果開啟了隱身模式,就能正常 say hi 了,這就尼瑪...


所以吧...真可能是我各種奇奇怪怪的事兒做多了,系統覺得「此子必不可留」,讓我獲得了足夠的「不配得感」,所以這篇文章里關于能力的部分,大部分來自官方數據和早期測試客戶的反饋,來自官方公告

官方公告:anthropic.com/news/claude-fable-5-mythos-5


http://anthropic.com/news/claude-fable-5-mythos-5

一套模型,兩個名字

前文提到:Mythos 和 Fable 背后是同一個模型,區別在于護欄

套護欄叫 Fable,沒限制的叫 Mythos

而至于名字,Mythos 是希臘語的「神話」;Fable 來自法語的 Fabula 也就是「被講述的東西」,意思也比較相近

Mythos 級是 Anthropic 在 Opus 之上新立的一個能力層級。今年四月,他們通過 Project Glasswing(玻璃翼計劃?這個也沒啥正式翻譯)放出了第一個 Mythos 級模型 Claude Mythos Preview,只給一小撮網絡安全防御者和關鍵軟件基建方

當時就說了,等護欄做好了,會把 Mythos 級開放給所有人,也就有了 Fable

至此,A 社的模型能力排行如下:

正版 Mythos > Fable > Opus > Sonnet > Haiku

斗宗強者

毫無疑問,根據「越新的頭部模型越強」的普遍原則,Fable 5 幾乎在所有測試基準上都是當前最強,任務越長越復雜,它甩開其他模型越遠

比如:Stripe 拿 Fable 5 跑了一個五千萬行的 Ruby 代碼庫的全庫遷移, 一天做完。同樣的活兒,一個團隊手工干要兩個多月。Fable 5 還比過去的 Claude 更省 token,同樣的難題花的錢更少。在 Cognition 的 FrontierCode 評測上,它在中等推理強度下就拿了前沿模型里的最高分


拿到早期權限的客戶各自跑了測試,挑幾句看看口徑。Cursor 的 Michael Truell 說它在 CursorBench 上是最強模型,打開了一類過去夠不著的長周期問題。GitHub 的 Mario Rodriguez 說它接復雜的長周期編碼任務,自主性和可靠性超過了之前的基準。Cognition 的 Scott Wu 說它是 FrontierBench 上得分最高的模型,開箱就能泛化到陌生工具。Replit 的 Michele Catasta 說它在自家的 vibe-coding 評測上幾乎跑滿


恐怖如斯

作為宗門的新一代天驕,Fable 5 它是通關了寶可夢的

過去的 Claude 玩寶可夢,是得搭一套輔助 harness,負責喂各種游戲狀態。Fable 5 只看原始截圖,就把《寶可夢 火紅》從頭打到尾通關了,竟與當時接受九年義務教育的我一樣強,不愧是宗門天驕

之前那套喂地圖喂狀態的 harness,不再必要了

它還能從科學圖表里摳出精確數字,看幾張截圖就把一個網頁應用的源碼重建出來

記憶和長上下文也上了一個臺階,比如讓它玩《殺戮尖塔》,給它一份持久存取的文件當記憶,成績提升是 Opus 4.8 的三倍,打到最終幕的次數也是三倍...這怎么玩的游戲和我一樣,不愧是和我一樣的斗宗強者



至于剩下的,Anthropic 放了四個 demo,我一個一個貼

第一個,它從物理第一性原理推導行星軌道運動,拿這個預測日食

日食模擬,從萬有引力開始算的

第二個,它自己玩《異星工廠》Factorio,自己規劃策略、自己把自動化流水線搭起來

很休閑的一款游戲,推薦大家試試

這個游戲好啊,益智、提神、醒腦,難怪 Fable 這么聰明


第三個,它在瀏覽器里的 CAD 編輯器里設計了一個完整的可 3D 打印模型。那個 CAD 編輯器也是它造的,包括里面的 AI copilot

編輯器是它造的,模型也是它設計的

第四個,它寫代碼做了一段流體模擬,流體的運動卡上一首古典 EDM remix 的節拍。那首 remix 也是它用代碼生成的,它從沒聽過音樂

從沒聽過音樂,用代碼作了首 EDM

知識工作方面,Hebbia 面向資深推理的金融評測里,Fable 5 拿了所有模型的最高分。IMC 說它的交易分析評測幾乎全項滿分

假設被實驗室證實

Mythos 5 在生物科研上做到的事,跑分表格裝不下了

先說藥物設計。Anthropic 內部的蛋白設計專家用 Mythos 5,把藥物設計過程的部分環節加速了約十倍。有一個例子,Mythos 5 拿著蛋白設計和生物信息學工具,在無人干涉下,做到了匹配甚至超過熟練的人類操作者,把項研究里的 14 個蛋白靶點,9 個產出了值得繼續做藥的強候選


免疫檢查點、神經退行、肌肉病這些靶點,9 個出了強候選

Mythos 5 是 Anthropic 第一個能穩定產出新穎且站得住腳的科學假設的模型。在盲測對比里,科學家有大約八成的時候更偏好 Mythos 的分子生物學假設而不是 Opus 級模型的。對于實驗假設,有些已經出成果了:比如一個關于大腸桿菌某蛋白的新機制,已被相關實驗室的研究證實了

基因組學那邊,Mythos 5 在超過一周的大體自主的工作里做了一項新研究。它把橫跨 138 個動物物種、數百萬個細胞的單細胞數據組裝起來,自己設計并訓練了一個機器學習模型,用來識別在親緣很遠的物種里執行相同功能的細胞

Mythos 訓出來的這個模型,超過了最近發表在 Science 上的一個模型,體積還小了 100 倍,結果計劃未來幾個月發表

護欄

可能我的記憶里的信息比較詭異,導致簡單的任務我能跑


復雜的請求就被退回


背后 Anthropic 給 Fable 5 套了一組分類器,單獨的 AI 系統,盯著每一輪對話,判斷你的請求有沒有碰到三個區域:網絡安全、生物化學、蒸餾。碰到了就把球扔給 Opus 4.8

Anthropic 說平均觸發率在 5% 以下,超過 95% 的會話完全不觸發。但這個數字是按會話數算的,發個「hi」也算一個會話。真拿它干活,尤其是長任務,體感完全是另一回事

任務一長,中間某一輪碰了分類器,整個對話就從 Fable 切到了 Opus,后面的回答都是 Opus 4.8 在給你穩穩接住

再比如我的歷史記憶比較復雜,可能就會莫名其妙的被視作宗門細作,退回的時候界面頂上會頂出一行「Switched to Opus 4.8」,右邊給你一個「Edit and retry with Fable 5」,讓你改改話術再撞一次護欄

就比如下面這個極為正常的工作:翻譯全文:https://www.anthropic.com/news/claude-fable-5-mythos-5


Edit and retry 這詞起得講究...

Claude Code 那邊也一樣,碰到護欄就直接彈 Request was blocked,讓你改問題或者回退

再說回 Fable 的三類拒絕回答

第一類是網絡安全。Mythos 級模型擅長找漏洞、利用漏洞,還會做 agentic hacking,把偵察、橫向移動這些環節自己串起來。護欄直接讓 Fable 在這類任務上做不出任何進展


Anthropic 做了大量紅隊測試,外部 bug bounty 跑了超過 1000 小時沒找到通用越獄,外部紅隊在長周期 agentic 任務上也沒找到,只有英國 AISI 在一個很短的初始窗口里有所進展


一家外部合作方測下來,Fable 5 在有害網絡請求上的護欄是所測全部模型里最硬的,比 Opus 4.8 和 4.7 都硬,對 30 種公開越獄技術零突破

第二類是生物和化學。過去只擋很窄的一撮生物武器問題,現在 Anthropic 覺得不夠了。他們測了 Mythos 5 預測一種病毒外殼組裝的能力(用的是 Dyno Therapeutics 未發表的候選),那是設計基因治療載體 AAV 的一步,同樣的本事換個人用就能拿去設計危險病毒


Mythos 級模型光靠生物推理就超過了專門做蛋白任務的蛋白語言模型。為了盡快安全發布,眼下 Fable 把大部分生物化學請求都退回給了 Opus 4.8,往后會慢慢收窄

第三類是蒸餾。Anthropic 此前發現過大規模的蒸餾企圖,而之后這些行為,會被分類器標記為蒸餾,然后退回 Opus 4.8

還有一處變化跟企業客戶直接相關。Mythos 級模型的所有流量,無論是 Anthropic 自家界面還是第三方,都要求 30 天數據保留

這些數據不拿去訓練、不做安全以外的用途,會記錄所有人類訪問,30 天后刪除

先免費,6 月 22 截止

打開網頁版會先彈一個框,告訴你 Fable 5 在 6 月 22 號之前算在套餐額度里,但它吃額度是 Opus 的兩倍。6 月 23 號起從訂閱計劃里撤掉,之后要用得花 usage credits

等容量夠了,再把它恢復成訂閱計劃的標準配置


吃 Opus 兩倍額度,6 月 23 號起這部分得自己掏 credits

網頁版的模型列表里能直接選到 Fable 5,旁邊標著「Included until June 22」。Claude Code 那邊,無論是 terminal 還是 Claude 應用,列表里默認看不到它,得手動敲 /model claude-fable-5 才能切過去


網頁里能選到,Claude Code 里得敲 /model claude-fable-5 才出來

平臺這邊,claude-fable-5 在 Claude API、AWS 上的 Claude Platform、Amazon Bedrock、Vertex AI、Microsoft Foundry 都能調

Mythos 5 則不公開,只給 Glasswing 的合作伙伴(拆了網絡安全護欄),以及不久后選定的一批生物研究者(拆了生物化學護欄)。Anthropic 說會跟美國政府一起,穩步擴大 Mythos 5 的可信訪問名單,還要開一個讓網絡安全機構系統化申請的通道,另開一個面向生物研究的通道

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
女生長的太漂亮是什么體驗?網友:母以子貴,父以女榮

女生長的太漂亮是什么體驗?網友:母以子貴,父以女榮

另子維愛讀史
2026-03-10 22:56:08
13歲學生體檢誤診艾滋遭學校勸退!隨后多次復查為陰性,醫院致歉!

13歲學生體檢誤診艾滋遭學校勸退!隨后多次復查為陰性,醫院致歉!

閃電新聞
2026-06-12 20:47:48
CCTV5直播!世界杯13日賽程:2支東道主出戰,美國VS巴拉圭引關注

CCTV5直播!世界杯13日賽程:2支東道主出戰,美國VS巴拉圭引關注

何老師呀
2026-06-12 18:47:57
“你兒子專注力廢了”,小學男生每天聽故事,過來人點出真相

“你兒子專注力廢了”,小學男生每天聽故事,過來人點出真相

澤澤先生
2026-06-06 21:14:40
青島鬼樓奇案:德國富商蓋洋樓死于非命,20年后,解放軍查出真相

青島鬼樓奇案:德國富商蓋洋樓死于非命,20年后,解放軍查出真相

歷來都很現實
2025-02-23 02:50:42
穆帥考察居萊爾 將打造皇馬新陣

穆帥考察居萊爾 將打造皇馬新陣

體壇周報
2026-06-12 23:35:47
全線大漲,近10萬人爆倉!

全線大漲,近10萬人爆倉!

每日經濟新聞
2026-06-12 09:20:05
若金價暴跌81%至800美元:央行巨虧3.92萬億將引發多大全球沖擊?

若金價暴跌81%至800美元:央行巨虧3.92萬億將引發多大全球沖擊?

三農老歷
2026-06-12 01:32:43
中信建投:關注半導體前驅體量價齊升大趨勢

中信建投:關注半導體前驅體量價齊升大趨勢

界面新聞
2026-06-12 07:46:48
富家小姐的身子丫鬟的命?24歲女孩盛裝出嫁,簡陋小院配豪華婚服

富家小姐的身子丫鬟的命?24歲女孩盛裝出嫁,簡陋小院配豪華婚服

搗蛋窩
2026-05-11 21:35:50
被網友“掛抹布”的方式驚呆了!一個比一個機智,我怎么早沒發現

被網友“掛抹布”的方式驚呆了!一個比一個機智,我怎么早沒發現

家居設計師蘇哥
2026-06-12 13:21:19
四個號,一家親:國際足聯把飯喂到嘴邊,國足用四個“零蛋”證明

四個號,一家親:國際足聯把飯喂到嘴邊,國足用四個“零蛋”證明

民間胡扯老哥
2026-06-11 10:34:23
美國懵了,世界杯開始了,觀眾沒了?

美國懵了,世界杯開始了,觀眾沒了?

宋鴻兵
2026-06-12 20:02:47
長鑫科技,IPO注冊申請獲通過,上半年凈利潤預計同比增長2244.03%至2544.19%

長鑫科技,IPO注冊申請獲通過,上半年凈利潤預計同比增長2244.03%至2544.19%

每日經濟新聞
2026-06-12 19:41:05
伊朗議員:美再襲伊朗實為施壓,美須接受伊朗已不同往日

伊朗議員:美再襲伊朗實為施壓,美須接受伊朗已不同往日

澎湃新聞
2026-06-12 23:26:12
25歲女子確診紅斑狼瘡,堅持保胎后多器官衰竭進ICU,丈夫痛哭

25歲女子確診紅斑狼瘡,堅持保胎后多器官衰竭進ICU,丈夫痛哭

極目新聞
2026-06-12 17:30:53
曼聯推銷拉什福德,不向巴薩妥協!無法逐出更衣室否則其免費走人

曼聯推銷拉什福德,不向巴薩妥協!無法逐出更衣室否則其免費走人

羅米的曼聯博客
2026-06-12 10:11:30
羅馬諾實錘!阿森納遭截胡,拜仁 5000 萬目標已非常接近

羅馬諾實錘!阿森納遭截胡,拜仁 5000 萬目標已非常接近

一隅非生
2026-06-12 05:49:38
為什么今年沒人提“消費降級”了?

為什么今年沒人提“消費降級”了?

黯泉
2026-05-20 17:47:21
世界杯誰將奪冠?曼聯名宿給出答案,葡萄牙無望,一隊有望成黑馬

世界杯誰將奪冠?曼聯名宿給出答案,葡萄牙無望,一隊有望成黑馬

兵哥籃球故事
2026-06-12 14:29:27
2026-06-13 02:28:49
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
466文章數 53關注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

美加墨世界杯第二場比賽就現空座 英媒:尷尬

頭條要聞

美加墨世界杯第二場比賽就現空座 英媒:尷尬

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

本地
藝術
數碼
公開課
軍事航空

本地新聞

AK劉彰邂逅河北南大港濕地

藝術要聞

砸了640億,再賠160億!沙特“The Line”項目徹底涼了?

數碼要聞

英國監管機構警告:亞馬遜、eBay仍在售可能致命的假冒手機充電器

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗媒體:已故最高領袖葬禮推遲舉行

無障礙瀏覽 進入關懷版