網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請入駐

Anthropic 發(fā)布 Claude Fable 5，大模型能力撞上“天花板”？

2026-06-10 10:45:50　來源: 侃故事的阿慶

福建舉報(bào)

分享至

今天 Anthropic 突然拋出Claude Fable 5和Mythos 5。

如果只按純粹的聊天體驗(yàn)去測試它，F(xiàn)able 5 甚至可能讓你覺得有些地方還不如 4.6。

它的本質(zhì)其實(shí)：Fable 5 并不是一個(gè)單純的孤立大模型，而是一個(gè)被“策略路由器”和“安全防火墻”重重包裹的工程化產(chǎn)品包。

底座是 Mythos-class，就是那個(gè)之前號(hào)稱能力逆天的大模型，外面套了 safeguards、fallback、審計(jì)、數(shù)據(jù)保留和可信訪問計(jì)劃。

這套邏輯簡單理解的話就是：你用 Claude 網(wǎng)頁端或 API 選擇 Fable 5 時(shí)，你的輸入會(huì)先過一個(gè)前置分類器（Classifier）

你問安全問題（如：古詩詞怎么寫、基礎(chǔ)前端代碼）：分類器放行，調(diào)用真正的 Fable 5 純血能力回答，體驗(yàn)拉滿。
你問敏感/高危問題（如：網(wǎng)絡(luò)安全滲透、生物化學(xué)合成、甚至涉及模型蒸餾的敏感提示詞）：分類器瞬間警覺，直接在后臺(tái)把模型無縫切換到次一級(jí)的 Opus 4.8 來回答你，或者直接在 API 層返回結(jié)構(gòu)化拒絕（Refusal）。

官方透露，這個(gè)安全分類器平均在不到 5% 的 Session 中會(huì)被觸發(fā)。這個(gè)數(shù)字聽起來不高，但在人群中的分布極不均勻：普通寫文章、文書分析的用戶可能一輩子碰不到；但如果你是搞安全研究、生物制藥、或者試圖“白嫖”Anthropic 邏輯來訓(xùn)練自己模型的開發(fā)者，你會(huì)頻繁“撞墻”。

也就是說，F(xiàn)able 5 的體驗(yàn)不是一個(gè)固定的點(diǎn)，而是一個(gè)概率分布。你以為你用的是同一個(gè)模型，其實(shí)你在不同風(fēng)險(xiǎn)區(qū)間摸到的是完全不同的能力面。

為什么 Anthropic 選擇在這個(gè)時(shí)間點(diǎn)發(fā)布？

因?yàn)?Anthropic 此時(shí)此刻正面臨三股同時(shí)上桌的巨大壓力：商業(yè)變現(xiàn)壓力、監(jiān)管合規(guī)壓力、能力展示（及 IPO 前期）的壓力。

對市場：它必須證明自己不只是一家只會(huì)講“AI 安全（Safety）”敘事的情懷公司，手里確實(shí)握著超越上一代的下一代大模型核武器；
對監(jiān)管：它絕對不敢把底座 Mythos 原汁原味地直接端上餐桌，否則其強(qiáng)大的網(wǎng)絡(luò)安全、生物化學(xué)、模型蒸餾（白嫖訓(xùn)練）等高危能力，會(huì)立刻變成監(jiān)管和輿論的集火靶心。

所以，Anthropic 這次玩了一手極高明的“金蟬脫殼”：它把高風(fēng)險(xiǎn)的頂級(jí)模型能力，拆成了一個(gè)可出售、可監(jiān)控、可降級(jí)、同時(shí)也能向監(jiān)管交代的產(chǎn)品包。

大模型行業(yè)正式跨入新階段。模型本身強(qiáng)不強(qiáng)只是第一層；強(qiáng)模型如何被部署、被切流、被限制、被審計(jì)，變成了同等重要的硬核技術(shù)。

模型定位，公開版 Mythos 不等于無約束 Mythos

官方把它定義為 Anthropic 迄今最強(qiáng)的廣泛發(fā)布模型，并明確說 Mythos-class 是高于 Opus class 的能力層級(jí)。

版本

定位

差異

Claude Fable 5

公開可用的 Mythos-class 模型

帶更強(qiáng)安全分類器，敏感請求可能 fallback

Claude Mythos 5

受限訪問版本

部分 safeguards 被移除，面向 Glasswing / 可信客戶

Claude Opus 4.8

次一級(jí)高能力模型

Fable 5 觸發(fā)某些分類器后的 fallback 目標(biāo)

過去模型發(fā)布通常會(huì)講模型 A 比模型 B 更強(qiáng)。Fable 5 這次更像同一個(gè)高能力底座，按風(fēng)險(xiǎn)場景露出不同的能力面。這和傳統(tǒng)軟件里的 feature flag、權(quán)限分層、策略路由很像，只不過這里被路由的對象從按鈕變成了模型能力本身。

Anthropic 官方說，F(xiàn)able 5 的 safeguards 平均在不到 5% 的 sessions 里觸發(fā)。這個(gè)數(shù)字聽起來不高，但它不是均勻分布的。普通寫作、文檔分析、代碼解釋可能很少碰到；安全研究、生物科研、模型訓(xùn)練和蒸餾相關(guān)工作，就更容易撞上。

也就是說，F(xiàn)able 5 的真實(shí)體驗(yàn)不是一個(gè)固定點(diǎn)，更像一個(gè)分布。用戶以為自己一直在用同一個(gè)模型，但實(shí)際在不同風(fēng)險(xiǎn)區(qū)間里，摸到的可能是不同的能力面。

這恰恰是它最值得研究的地方。

技術(shù)規(guī)格

官方已經(jīng)公開的產(chǎn)品級(jí)規(guī)格，大概是下面這些。

項(xiàng)目

Claude Fable 5

模型層級(jí)

Mythos-class 公共版

API ID

claude-fable-5

Mythos 5 API ID

claude-mythos-5

上下文窗口

1M tokens

最大輸出

128k tokens

API 價(jià)格

輸入 $10 / 百萬 tokens 輸出 $50 / 百萬 tokens

thinking 模式

Adaptive thinking 永遠(yuǎn)開啟

原始思維鏈

不返回 raw chain-of-thought

圖像輸入

支持

數(shù)據(jù)保留

30 天，不支持 zero data retention

公開形態(tài)

Fable 5 廣泛可用，Mythos 5 受限開放

至于硬件參數(shù)，Anthropic 沒有公開。

目前沒有看到官方披露參數(shù)量、訓(xùn)練 tokens、GPU/TPU 型號(hào)、訓(xùn)練集群規(guī)模、MoE 結(jié)構(gòu)、推理硬件、量化策略，也沒有看到長上下文底層實(shí)現(xiàn)細(xì)節(jié)。

這倒是不奇怪。Anthropic 改進(jìn)，確實(shí)徹頭徹尾是一個(gè)閉源公司，他們好像從頭到尾都沒有發(fā)布過任何開源內(nèi)容。

安全機(jī)制

Fable 5 這次最該單獨(dú)拆的，是安全機(jī)制。

很多人把安全策略理解成模型不回答。但 Fable 5 更有意思的地方是 fallback。它沒有簡單把敏感請求全堵死，而是在某些場景里把請求轉(zhuǎn)給 Claude Opus 4.8。

這就很有意思了，過去我們理解的模型安全，無非是模型吐出一句：“對不起，我無法回答這個(gè)問題。”

但 Fable 5 展現(xiàn)了極其成熟的工業(yè)級(jí)工程化思維。它引入了Capability Fallback（能力降級(jí)系統(tǒng)）。

優(yōu)雅的 API 拒答：當(dāng)觸發(fā)分類器時(shí)，API 不會(huì)粗暴地拋出 HTTP 錯(cuò)誤，而是成功返回 200 OK，但在返回值里攜帶 stop_reason: "refusal"，并明確告知是哪一個(gè)分類器攔截的。
計(jì)費(fèi)補(bǔ)償機(jī)制：如果請求在生成任何輸出前被攔截，完全不計(jì)費(fèi)；如果中途發(fā)生 Fallback 降級(jí)，前半段按 Fable 5 計(jì)費(fèi)，后半段按 Opus 4.8 計(jì)費(fèi)。
徹底取消 ZDR（零數(shù)據(jù)保留）：強(qiáng)行留存 30 天日志。官方直言不諱：很多濫用模式和高危意圖，從單一的一兩次對話是看不出來的，必須把 30 天的上下文連起來做全局審計(jì)。

這已經(jīng)完全脫離了“在 Prompt 里加兩句系統(tǒng)提示詞”的小打小鬧，而是把分類器、計(jì)費(fèi)、日志、降級(jí)模型、可信計(jì)劃全部熔煉進(jìn)了一套完整的服務(wù)流。

在伴隨發(fā)布的系統(tǒng)卡（System Card）里，Anthropic 對 Mythos 5 底座的幾個(gè)高危評(píng)估非常耐人尋味：

網(wǎng)絡(luò)安全：評(píng)為目前全球最強(qiáng)的 Cyber 模型，但仍判定為 Tier 1，未達(dá)到可自主執(zhí)行網(wǎng)絡(luò)攻擊的 Tier 2 閾值；
生物化學(xué)：具備 CB-1 能力（非新型武器合成），未跨過 CB-2 門檻（新型武器）。但官方承認(rèn)：它能顯著 Uplift（提升）那些資源充足的威脅行為者的破壞能力
AI 自動(dòng)化研發(fā)：尚不能完全替代人類頂尖研究團(tuán)隊(duì)。

說白了，Anthropic 的態(tài)度是：“我知道這怪物已經(jīng)具備明顯的雙重用途（Dual-use）危險(xiǎn)性了，但我通過這套精妙的降級(jí)路由系統(tǒng)把它裝進(jìn)了籠子里，所以我敢拿出來賣了。”

測試結(jié)果，別只看單點(diǎn)炫技，要看長任務(wù)

Anthropic 官方發(fā)布頁給了一張 benchmark 總表。

從官方 benchmark 總表看，F(xiàn)able 5 在代碼、數(shù)學(xué)推理、長上下文理解這幾個(gè)主要維度上確實(shí)領(lǐng)先于 Opus 4.8，部分項(xiàng)目也超過了同期競品。

分?jǐn)?shù)非常的好看。

但跑分這種排行榜早就被跑爛了。每個(gè)新發(fā)的模型基本上都在這個(gè)榜單上秒天秒地，所以不太具有代表性。

總結(jié)

過去大家比拼的是誰的底座參數(shù)大、誰更有“智商”；

而 Fable 5 證明，當(dāng)模型能力強(qiáng)到一定程度后，怎么給它套上合適的“籠子”，讓它既能安全合規(guī)地商業(yè)化，又不會(huì)因?yàn)椴鹊骄W(wǎng)絡(luò)安全或生化紅線被監(jiān)管一刀切，已經(jīng)變成了同樣重要的技術(shù)活。

別把它單純看作是一個(gè)“變聰明了的 Claude 4.5 或 5.0”。更準(zhǔn)確地說，它是 Anthropic 在面對商業(yè)、合規(guī)、技術(shù)三路夾擊時(shí)，交出的一套非常標(biāo)準(zhǔn)的“大模型工程化商業(yè)產(chǎn)品包”。接下來的大模型想要走IPO，大概率都要往這個(gè)方向走了。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.