今天 Anthropic 突然拋出Claude Fable 5和Mythos 5。
如果只按純粹的聊天體驗(yàn)去測試它,F(xiàn)able 5 甚至可能讓你覺得有些地方還不如 4.6。
它的本質(zhì)其實(shí):Fable 5 并不是一個(gè)單純的孤立大模型,而是一個(gè)被“策略路由器”和“安全防火墻”重重包裹的工程化產(chǎn)品包。
底座是 Mythos-class,就是那個(gè)之前號(hào)稱能力逆天的大模型,外面套了 safeguards、fallback、審計(jì)、數(shù)據(jù)保留和可信訪問計(jì)劃。
![]()
這套邏輯簡單理解的話就是:你用 Claude 網(wǎng)頁端或 API 選擇 Fable 5 時(shí),你的輸入會(huì)先過一個(gè)前置分類器(Classifier)
- 你問安全問題(如:古詩詞怎么寫、基礎(chǔ)前端代碼):分類器放行,調(diào)用真正的 Fable 5 純血能力回答,體驗(yàn)拉滿。
- 你問敏感/高危問題(如:網(wǎng)絡(luò)安全滲透、生物化學(xué)合成、甚至涉及模型蒸餾的敏感提示詞):分類器瞬間警覺,直接在后臺(tái)把模型無縫切換到次一級(jí)的 Opus 4.8 來回答你,或者直接在 API 層返回結(jié)構(gòu)化拒絕(Refusal)。
官方透露,這個(gè)安全分類器平均在不到 5% 的 Session 中會(huì)被觸發(fā)。這個(gè)數(shù)字聽起來不高,但在人群中的分布極不均勻:普通寫文章、文書分析的用戶可能一輩子碰不到;但如果你是搞安全研究、生物制藥、或者試圖“白嫖”Anthropic 邏輯來訓(xùn)練自己模型的開發(fā)者,你會(huì)頻繁“撞墻”。
也就是說,F(xiàn)able 5 的體驗(yàn)不是一個(gè)固定的點(diǎn),而是一個(gè)概率分布。你以為你用的是同一個(gè)模型,其實(shí)你在不同風(fēng)險(xiǎn)區(qū)間摸到的是完全不同的能力面。
為什么 Anthropic 選擇在這個(gè)時(shí)間點(diǎn)發(fā)布?
因?yàn)?Anthropic 此時(shí)此刻正面臨三股同時(shí)上桌的巨大壓力:商業(yè)變現(xiàn)壓力、監(jiān)管合規(guī)壓力、能力展示(及 IPO 前期)的壓力。
- 對市場: 它必須證明自己不只是一家只會(huì)講“AI 安全(Safety)”敘事的情懷公司,手里確實(shí)握著超越上一代的下一代大模型核武器;
- 對監(jiān)管: 它絕對不敢把底座 Mythos 原汁原味地直接端上餐桌,否則其強(qiáng)大的網(wǎng)絡(luò)安全、生物化學(xué)、模型蒸餾(白嫖訓(xùn)練)等高危能力,會(huì)立刻變成監(jiān)管和輿論的集火靶心。
所以,Anthropic 這次玩了一手極高明的“金蟬脫殼”:它把高風(fēng)險(xiǎn)的頂級(jí)模型能力,拆成了一個(gè)可出售、可監(jiān)控、可降級(jí)、同時(shí)也能向監(jiān)管交代的產(chǎn)品包。
大模型行業(yè)正式跨入新階段。模型本身強(qiáng)不強(qiáng)只是第一層;強(qiáng)模型如何被部署、被切流、被限制、被審計(jì),變成了同等重要的硬核技術(shù)。
模型定位,公開版 Mythos 不等于無約束 Mythos
官方把它定義為 Anthropic 迄今最強(qiáng)的廣泛發(fā)布模型,并明確說 Mythos-class 是高于 Opus class 的能力層級(jí)。
版本
定位
差異
Claude Fable 5
公開可用的 Mythos-class 模型
帶更強(qiáng)安全分類器,敏感請求可能 fallback
Claude Mythos 5
受限訪問版本
部分 safeguards 被移除,面向 Glasswing / 可信客戶
Claude Opus 4.8
次一級(jí)高能力模型
Fable 5 觸發(fā)某些分類器后的 fallback 目標(biāo)
過去模型發(fā)布通常會(huì)講模型 A 比模型 B 更強(qiáng)。Fable 5 這次更像同一個(gè)高能力底座,按風(fēng)險(xiǎn)場景露出不同的能力面。這和傳統(tǒng)軟件里的 feature flag、權(quán)限分層、策略路由很像,只不過這里被路由的對象從按鈕變成了模型能力本身。
Anthropic 官方說,F(xiàn)able 5 的 safeguards 平均在不到 5% 的 sessions 里觸發(fā)。這個(gè)數(shù)字聽起來不高,但它不是均勻分布的。普通寫作、文檔分析、代碼解釋可能很少碰到;安全研究、生物科研、模型訓(xùn)練和蒸餾相關(guān)工作,就更容易撞上。
也就是說,F(xiàn)able 5 的真實(shí)體驗(yàn)不是一個(gè)固定點(diǎn),更像一個(gè)分布。用戶以為自己一直在用同一個(gè)模型,但實(shí)際在不同風(fēng)險(xiǎn)區(qū)間里,摸到的可能是不同的能力面。
這恰恰是它最值得研究的地方。
技術(shù)規(guī)格
官方已經(jīng)公開的產(chǎn)品級(jí)規(guī)格,大概是下面這些。
項(xiàng)目
Claude Fable 5
模型層級(jí)
Mythos-class 公共版
API ID
claude-fable-5
Mythos 5 API ID
claude-mythos-5
上下文窗口
1M tokens
最大輸出
128k tokens
API 價(jià)格
輸入 $10 / 百萬 tokens 輸出 $50 / 百萬 tokens
thinking 模式
Adaptive thinking 永遠(yuǎn)開啟
原始思維鏈
不返回 raw chain-of-thought
圖像輸入
支持
數(shù)據(jù)保留
30 天,不支持 zero data retention
公開形態(tài)
Fable 5 廣泛可用,Mythos 5 受限開放
至于硬件參數(shù),Anthropic 沒有公開。
目前沒有看到官方披露參數(shù)量、訓(xùn)練 tokens、GPU/TPU 型號(hào)、訓(xùn)練集群規(guī)模、MoE 結(jié)構(gòu)、推理硬件、量化策略,也沒有看到長上下文底層實(shí)現(xiàn)細(xì)節(jié)。
這倒是不奇怪。Anthropic 改進(jìn),確實(shí)徹頭徹尾是一個(gè)閉源公司,他們好像從頭到尾都沒有發(fā)布過任何開源內(nèi)容。
安全機(jī)制
Fable 5 這次最該單獨(dú)拆的,是安全機(jī)制。
很多人把安全策略理解成模型不回答。但 Fable 5 更有意思的地方是 fallback。它沒有簡單把敏感請求全堵死,而是在某些場景里把請求轉(zhuǎn)給 Claude Opus 4.8。
這就很有意思了,過去我們理解的模型安全,無非是模型吐出一句:“對不起,我無法回答這個(gè)問題。”
但 Fable 5 展現(xiàn)了極其成熟的工業(yè)級(jí)工程化思維。它引入了Capability Fallback(能力降級(jí)系統(tǒng))。
- 優(yōu)雅的 API 拒答:當(dāng)觸發(fā)分類器時(shí),API 不會(huì)粗暴地拋出 HTTP 錯(cuò)誤,而是成功返回 200 OK,但在返回值里攜帶 stop_reason: "refusal",并明確告知是哪一個(gè)分類器攔截的。
- 計(jì)費(fèi)補(bǔ)償機(jī)制:如果請求在生成任何輸出前被攔截,完全不計(jì)費(fèi);如果中途發(fā)生 Fallback 降級(jí),前半段按 Fable 5 計(jì)費(fèi),后半段按 Opus 4.8 計(jì)費(fèi)。
- 徹底取消 ZDR(零數(shù)據(jù)保留):強(qiáng)行留存 30 天日志。官方直言不諱:很多濫用模式和高危意圖,從單一的一兩次對話是看不出來的,必須把 30 天的上下文連起來做全局審計(jì)。
這已經(jīng)完全脫離了“在 Prompt 里加兩句系統(tǒng)提示詞”的小打小鬧,而是把分類器、計(jì)費(fèi)、日志、降級(jí)模型、可信計(jì)劃全部熔煉進(jìn)了一套完整的服務(wù)流。
在伴隨發(fā)布的系統(tǒng)卡(System Card)里,Anthropic 對 Mythos 5 底座的幾個(gè)高危評(píng)估非常耐人尋味:
- 網(wǎng)絡(luò)安全:評(píng)為目前全球最強(qiáng)的 Cyber 模型,但仍判定為 Tier 1,未達(dá)到可自主執(zhí)行網(wǎng)絡(luò)攻擊的 Tier 2 閾值;
- 生物化學(xué):具備 CB-1 能力(非新型武器合成),未跨過 CB-2 門檻(新型武器)。但官方承認(rèn):它能顯著 Uplift(提升)那些資源充足的威脅行為者的破壞能力
- AI 自動(dòng)化研發(fā):尚不能完全替代人類頂尖研究團(tuán)隊(duì)。
說白了,Anthropic 的態(tài)度是:“我知道這怪物已經(jīng)具備明顯的雙重用途(Dual-use)危險(xiǎn)性了,但我通過這套精妙的降級(jí)路由系統(tǒng)把它裝進(jìn)了籠子里,所以我敢拿出來賣了。”
測試結(jié)果,別只看單點(diǎn)炫技,要看長任務(wù)
Anthropic 官方發(fā)布頁給了一張 benchmark 總表。
![]()
從官方 benchmark 總表看,F(xiàn)able 5 在代碼、數(shù)學(xué)推理、長上下文理解這幾個(gè)主要維度上確實(shí)領(lǐng)先于 Opus 4.8,部分項(xiàng)目也超過了同期競品。
分?jǐn)?shù)非常的好看。
但跑分這種排行榜早就被跑爛了。每個(gè)新發(fā)的模型基本上都在這個(gè)榜單上秒天秒地,所以不太具有代表性。
總結(jié)
過去大家比拼的是誰的底座參數(shù)大、誰更有“智商”;
![]()
而 Fable 5 證明,當(dāng)模型能力強(qiáng)到一定程度后,怎么給它套上合適的“籠子”,讓它既能安全合規(guī)地商業(yè)化,又不會(huì)因?yàn)椴鹊骄W(wǎng)絡(luò)安全或生化紅線被監(jiān)管一刀切,已經(jīng)變成了同樣重要的技術(shù)活。
別把它單純看作是一個(gè)“變聰明了的 Claude 4.5 或 5.0”。更準(zhǔn)確地說,它是 Anthropic 在面對商業(yè)、合規(guī)、技術(shù)三路夾擊時(shí),交出的一套非常標(biāo)準(zhǔn)的“大模型工程化商業(yè)產(chǎn)品包”。接下來的大模型想要走IPO,大概率都要往這個(gè)方向走了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.