无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

實測Claude史上最強模型Fable 5,普通人慎用

Claude新模型Fable5有多強

0
分享至

對普通人最壞的消息要來了。

就在剛剛,Anthropic 宣布推出 Claude Fable 5 和 Claude Mythos 5。

其中,Fable 5 是 Anthropic 首個面向公眾開放的 Mythos 級模型,Mythos 5 則主要面向少數網絡安全防御機構、關鍵基礎設施提供方以及后續進入可信訪問計劃的生物醫學研究者。


只是,鮮少有人注意的是,按照官方說明,Fable 5 從現在到 6 月 22 日,會包含在 Pro、Max、Team 和按席位計費的 Enterprise 計劃里,不額外收費。到了 6 月 23 日,Fable 5 將從這些訂閱計劃中移出,繼續使用就需要消耗 usage credits。

換句話說,過去那種一張「月卡」解鎖最強 AI 的模式,或許將一去不復返。對于用戶而言,未來需要考慮的可能不只是訂閱價格,還有每一次調用、每一次長任務執行背后真實消耗的 token 成本。

歡迎進入 Token 計費時代。

Claude Fable 5 封神登場,但它也是最狠的「Token 刺客」

Anthropic 對 Fable 和 Mythos 的命名也給出了解釋。Fable 源自拉丁語 fabula,意為「被講述的小故事」,含義上接近希臘語 Mythos。

兩個新名字看起來像兩款模型,實際更接近同一底層模型的兩個版本。Fable 5 目前面向公眾開放,帶有更嚴格的安全限制;

Mythos 5 目前 只通過 Project Glasswing 計劃提供給少數網絡安全防御機構和關鍵基礎設施合作方。

根據 Anthropic 官方博客的介紹,Fable 5 是該公司目前一般可用模型中能力最強的一款,在軟件工程、知識工作、視覺理解、科學研究等方向都有明顯提升。任務越長、越復雜,它相對此前 Claude 模型的優勢越大。

Fable 5 的意義在于,Mythos 級能力第一次大規模面向普通用戶開放。 基準測試跑分圖如下,主打一個遙遙領先。


不過,模型名字本身也引發了一些討論。原 OpenAI Codex 相關負責人 Tibo都發文調侃道,Anthropic 用了 OpenAI 想用但沒有用的 Fable 命名。


能力層面,軟件工程是官方最強調的方向之一。

Anthropic 提到,Stripe 在早期測試中讓 Fable 5 處理一個 5000 萬行 Ruby 代碼庫的遷移任務。這個工作如果交給一個工程團隊手動完成,原本需要兩個多月,Fable 5 在一天內完成。


Cognition 的 FrontierCode 測試也顯示,Fable 5 在復雜生產級代碼任務中表現領先。這個評測關注的不是普通代碼題,而是模型能否完成困難編程任務,并達到高質量生產代碼庫的要求。


Anthropic 還強調,Fable 5 比此前 Claude 模型更節省 token。當然,這話聽聽得了,以往每次 Claude 新模型的發布都有類似的表述,但幾乎都成了一個個 Token 刺客,為偌大的互聯網提供了相當多的笑話。

知識工作方面,Fable 5 在 Hebbia 的金融基準測試中拿到最高成績,提升集中在文檔推理、圖表理解和復雜問題分析。IMC 的交易分析評測也顯示,Fable 5 在事實檢索、概念推理、原因分析和期望值分析上都有較強表現。

視覺能力也是發布重點。Anthropic 稱,Fable 5 能從復雜科學圖表中提取精確數字,也能根據網頁截圖重建應用源碼。

官方還展示了一個更直觀的案例:Fable 5 只依靠游戲畫面完成《寶可夢火紅》,沒有使用額外地圖、導航工具或游戲狀態信息。此前的 Claude 模型做類似任務,還需要更復雜的輔助系統。


長上下文和記憶能力也有提升。Anthropic 在《殺戮尖塔》測試中發現,給模型提供持久化文件記憶后,Fable 5 的表現提升幅度達到 Opus 4.8 的三倍,進入最終章節的頻率也提升三倍。

生命科學方向更敏感。Anthropic 稱,內部蛋白質設計專家使用 Mythos 5,把部分藥物設計流程加速約 10 倍。


在一個案例里,Mythos 5 借助蛋白質設計和生物信息學工具,在沒有人工協助的情況下完成了科學家通常要處理的一整套流程,包括選擇結合位點、調用設計工具、處理失敗結果。14 個蛋白靶點中,有 9 個產生了值得繼續研究的候選方案。

生命科學和網絡安全能力的提升,也解釋了 Anthropic 為什么沒有把完整 Mythos 級能力直接放開。

Fable 5 面向公眾開放時,配套了一套新的安全分類器。只要用戶請求涉及網絡安全、生物、化學或模型蒸餾等高風險方向,系統就會自動改由 Claude Opus 4.8 響應,并告知用戶模型發生了變化。

Anthropic 表示,早期數據中,超過 95% 的 Fable 5 會話不會觸發這種變化。普通寫作、編程、分析、設計、數據處理等任務,大多數情況下仍能使用 Fable 5 本身。但只要進入高風險區域,模型能力就會受到限制。

網絡安全是限制最嚴的方向。Anthropic 承認,Mythos 級模型擅長發現和利用軟件漏洞,也具備較強的代理式攻擊能力,可能覆蓋偵察、發現、橫向移動等環節。為了避免這種能力被濫用,Fable 5 的網絡安全分類器覆蓋范圍很廣。


生物和化學方向也類似。Anthropic 認為,模型已經具備完成真實科學任務的能力,過去只屏蔽少數生物武器相關問題已經不夠。因此,Fable 5 暫時會在大多數生物和化學相關請求上回退到 Opus 4.8 處理。

值得一提的是,Anthropic 還為 Fable 5 加入了一層針對前沿大模型開發的隱藏保護。

它主要限制 Claude 協助構建預訓練流水線、分布式訓練基礎設施或 ML 加速器設計等任務,避免模型反過來加速其他機構訓練下一代前沿模型。


和觸發后會切換到 Opus 4.8 的安全限制不同,這類保護不會直接提示用戶,而是通過提示詞修改、steering vectors 或 PEFT 等方式,降低 Fable 5 在相關任務上的性能。目前也已經有受害者現身說法。


截至目前,Claude Fable 5 現已面向全球用戶開放。開發者可以通過 Claude API 調用 claude-fable-5。Claude API 和按需付費的 Enterprise 計劃從發布日起已經全面可用。

Fable 5 和 Mythos 5 的價格相同,均為每百萬輸入 token 10 美元,每百萬輸出 token 50 美元。按照 Anthropic 的說法,這已經低于 Claude Mythos Preview 的一半,但對于高強度長任務來說,價格仍然不低。


AI 終于數清了 6 根手指

比起官方博客,實測更能說明 Fable 5 到底變強在哪里。根據我的實測,Fable 5 已經能夠識別 6 根手指了。


恰逢高考結束,我們也拿了道全國高考一卷語文作文題,讓它練練手,怎么說呢?整體文風表達比較流暢,并不「普通」。


更具體的對比可以參考@ Hypergent 的實測,在小行星可視化任務中, Fable 5 不僅完成數據提取,還設計了包含軌道軌跡和懸停詳情的交互式展示,在保證性能的同時提升了信息表達能力。


在健身度假村規劃任務中,Fable 5 借助 GPT-Image-2 和 Nano Banana 生成更符合實際使用邏輯的場地方案,能夠考慮區域連接、功能分布和人流動線,而不僅是簡單擺放建筑。


Fable 5 能夠把天文現象與可視化表達結合起來,展示太陽耀斑對極光影響的模擬;而 Opus 4.8 甚至未能正常加載。


前特斯拉 AI 總監,OpenAI 聯創 Andrej Karpathy(現已加入 Anthropic)的評價更能說明開發者的感受。


不過,在設計審美上,人類目前仍然略占上風。


沃頓商學院教授 Ethan Mollick 的實測更能體現 Fable 5 的變化。他拿到早期訪問權限后,重點測試了游戲、地圖和研究工具等復雜任務。

其中最有代表性的是一個等時線地圖項目。Mollick 要求 Fable 5 構建一個基于真實交通數據的交互式地圖,展示不同城市在一定時間內的可達范圍。模型隨后調用多個 Agent 收集航班、鐵路和道路數據,同時完成代碼編寫和測試,并不斷根據反饋修正結果。


Mollick 還讓 Fable 5 開發了一款名為 Concord 的研究工具。模型先生成 19 頁設計文檔,又連續工作 9 個半小時,最終完成軟件開發,用于分析開放式研究數據并校準人類與 AI 的判斷結果。


實測也暴露出明顯問題。Mollick 認為,Fable 5 仍然會出現錯誤和遺漏,需要人工檢查和完善。同時,長任務帶來的 token 消耗非常高,而 Fable 5 的價格又明顯高于 Opus 4.8,真正投入生產環境后,成本可能成為最大的現實挑戰。

高強度長任務能力,最終都會反映到使用成本上。作為 20 美元套餐的 Pro 用戶,我甚至只是簡單跑了幾個任務,就用完了額度。

而 Claude 客戶端也顯示 Fable 5 「included until June 22」,如開頭所述,按照 Anthropic 的安排,免費包含窗口結束后,Fable 5 會從部分訂閱計劃中移出,繼續使用需要消耗 usage credits。


過去用戶付一筆不算貴的月費,就能在很大程度上享用世界上最強的一批智能。訂閱制模糊了真實成本,也讓普通個體在某些時刻和一些巨頭站上了同一條起跑線。

Token 計費降臨之后,一切都會發生變化。

AI 會從一種近似包月服務,變成一種按量消耗的生產資料。最強模型也正在變成一種更昂貴、更精細計價的生產工具。

有些人可以不太在乎成本,比如讓 Fable 5 執行 24 小時長鏈任務,重構 5000 萬行代碼,獨立開發一個完整應用,持續跑研究項目,反復測試和修改結果。

但更多普通用戶則會在每一次調用前下意識地掂量:這個問題值不值得花 token?這個任務值不值得交給最強模型?這次嘗試失敗后,還要不要繼續讓它重來一遍?


最糟糕的消息莫過于此。AI 沒有變弱。相反,它正以前所未有的速度變強,強到足以獨立完成越來越多原本屬于人類的腦力工作。

與此同時,獲得這種能力的門票正在不斷提高。普通人與先進生產力之間,剛剛被大模型拉近的信息差,可能會因為昂貴的 token 計費重新拉開。

Anthropic 如此,未來 OpenAI 等其它廠商也很難例外。前沿模型越強,訓練和推理成本越高,尤其是這兩家 AI 公司目前都在爭取上市,都需要向資本市場證明自己不只是能訓練更強模型,也能把模型能力變成持續收入。

因此,與其說 Fable 5 的發布是一次模型升級,倒不如說是一次徹底調整 AI 訂閱體系的預熱。如果 AI 的普惠窗口期開始進入倒計時,那這絕對不會是最好的消息。

我們正在招募伙伴

簡歷投遞郵箱 hr@ifanr.com

?? 郵件標題 「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
又一起吃他汀猝死!醫生再三勸告:夏季吃他汀的人,要警惕這5點

又一起吃他汀猝死!醫生再三勸告:夏季吃他汀的人,要警惕這5點

路醫生健康科普
2026-06-09 15:37:52
離婚真相曝光僅6個月,前妻高調曝光追求者,撕碎猴哥僅剩體面

離婚真相曝光僅6個月,前妻高調曝光追求者,撕碎猴哥僅剩體面

掛肚逍遙心
2026-06-08 08:17:28
東北林業大學副校長劉守新履新中南林業科技大學黨委副書記

東北林業大學副校長劉守新履新中南林業科技大學黨委副書記

澎湃新聞
2026-06-12 09:02:28
泰國47歲長公主去世,感染支原體細菌引發心肌炎昏迷多年,曾是外界最看好的王位繼承人選

泰國47歲長公主去世,感染支原體細菌引發心肌炎昏迷多年,曾是外界最看好的王位繼承人選

極目新聞
2026-06-12 10:26:17
公狗劇場男色生意經:一群180男人月入10萬,讓女人們瘋狂買單?

公狗劇場男色生意經:一群180男人月入10萬,讓女人們瘋狂買單?

金融八卦女
2026-06-10 13:46:40
品茶:從苦澀到回甘,是茶也是人生

品茶:從苦澀到回甘,是茶也是人生

疾跑的小蝸牛
2026-06-12 20:59:39
馬斯克:特斯拉推送最新版 FSD!

馬斯克:特斯拉推送最新版 FSD!

新浪財經
2026-06-12 13:29:14
剛剛!SpaceX上市,馬斯克財富飆至11710億美元,人類出發火星

剛剛!SpaceX上市,馬斯克財富飆至11710億美元,人類出發火星

雷科技
2026-06-13 01:00:05
美取消已簽波音大豆訂單,188家中企在列

美取消已簽波音大豆訂單,188家中企在列

老塕是個手藝人
2026-06-09 17:37:28
江大畢業生被“包圓”,蘇大學生苦投百份簡歷,專業壁壘碾壓區位紅利?

江大畢業生被“包圓”,蘇大學生苦投百份簡歷,專業壁壘碾壓區位紅利?

牛鍋巴小釩
2026-06-12 20:50:17
實錘!那個為找學位證真相舉報自己的人,證書實為違規取得

實錘!那個為找學位證真相舉報自己的人,證書實為違規取得

聽心堂
2026-06-12 21:26:57
固安房價從300萬跌到45萬,有人停貸,有人開始全款撿漏

固安房價從300萬跌到45萬,有人停貸,有人開始全款撿漏

科學發掘
2026-06-11 15:20:54
最新帶貨王出現了!世界杯同款拉布布銷量暴漲30倍:599元一個還限購

最新帶貨王出現了!世界杯同款拉布布銷量暴漲30倍:599元一個還限購

快科技
2026-06-12 18:02:46
身材沒料還敢脫,42歲謝苗這一身腱子肉,內娛假肌肉男都該學一學

身材沒料還敢脫,42歲謝苗這一身腱子肉,內娛假肌肉男都該學一學

八卦南風
2026-06-12 18:52:05
潘虹真敢穿71歲 還這么時髦這么健壯 和76歲斯琴高娃參加活動一幕

潘虹真敢穿71歲 還這么時髦這么健壯 和76歲斯琴高娃參加活動一幕

可樂談情感
2026-06-13 01:05:02
鬧心!奧迪純電SUV,提車三天“故障頻發”!上海車主7個月報修10次,結果更鬧心

鬧心!奧迪純電SUV,提車三天“故障頻發”!上海車主7個月報修10次,結果更鬧心

新民晚報
2026-06-12 19:26:49
高考剛結束,央視、人民日報接連“點名”張桂梅,句句戳人心窩!

高考剛結束,央視、人民日報接連“點名”張桂梅,句句戳人心窩!

夢醉為紅顏一笑
2026-06-11 16:03:06
碾壓托納利!曼聯 8500 萬鎖定頂級獸腰,曼城 1.2 億豪購被完爆

碾壓托納利!曼聯 8500 萬鎖定頂級獸腰,曼城 1.2 億豪購被完爆

瀾歸序
2026-06-13 06:51:26
強震過后,菲律賓不急救援,先對中國打出兩張牌,中方態度堅決

強震過后,菲律賓不急救援,先對中國打出兩張牌,中方態度堅決

莉莉和奶奶
2026-06-13 05:27:34
特朗普又退縮了,特朗普又贏了 | 京釀館

特朗普又退縮了,特朗普又贏了 | 京釀館

新京報評論
2026-06-12 13:56:47
2026-06-13 07:19:00
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
6479文章數 26848關注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

伊美諒解備忘錄草案部分內容披露 涉及撤軍、戰爭賠償等

頭條要聞

伊美諒解備忘錄草案部分內容披露 涉及撤軍、戰爭賠償等

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

數碼
房產
旅游
家居
軍事航空

數碼要聞

英國監管機構警告:亞馬遜、eBay仍在售可能致命的假冒手機充電器

房產要聞

海南最賺錢行業曝光!最快4年半,??谌钯I三房!

旅游要聞

印度有錢人真多酷暑辦理旅游簽證!不是有錢任性,是熱到活不下去

家居要聞

空間微調 移形換境

軍事要聞

伊朗媒體:已故最高領袖葬禮推遲舉行

無障礙瀏覽 進入關懷版