網易首頁 > 網易號 > 正文申請入駐

“神話級”AI走向大眾，但Anthropic給它裝了個安全閥門

2026-06-10 09:53:21　來源: 侃故事的阿慶

福建舉報

分享至

Anthropic發布Mythos級模型，圖片經由AI處理

文丨蘇揚

編輯丨徐青陽

美國當地時間6月9日，Anthropic正式發布內部評級為“Mythos級”的頂尖模型Claude Fable 5。

一同亮相的，還有它的“孿生兄弟”Claude Mythos 5——一個共享底層模型，但在特定高風險領域移除了限制的版本，該版本僅提供給經過審核的合作方。

Fable 5的能力全面超越了Anthropic以往任何公開模型。因此Anthropic給它裝上了一套新的安全防護系統：當模型遇到網絡安全、生物化學等敏感問題時，會自動切換到一個稍弱的Claude Opus 4.8模型來回答，把潛在的危險能力“關在籠子里”。

兩款新模型的定價大幅降低，不到此前預覽版的一半。開發者即日起可通過API直接調用，訂閱用戶也能在6月22日前免費體驗，之后將轉為按量消耗。Anthropic計劃在容量允許后將其恢復為標準套餐的一部分。

01 一個模型，兩張面孔

Fable 5和Mythos 5的區別，全在安全防護上。

可以這樣理解，Claude Fable 5是給所有人的通用版，而Mythos 5是一個為特定領域專家準備的無限制版本。它們擁有完全相同的“大腦”，Fable 5則多了一位極其保守的“安全管家”。

基于安全分類器功能，當用戶通過Fable 5模型請求涉及網絡安全、生物學與化學（特別是與危險物質或武器相關知識），或試圖“蒸餾”模型能力以訓練競品時，分類器會自動攔截，不讓Fable 5直接響應。

取而代之的是，由能力稍弱但同樣強大的Claude Opus 4.8來回答。

Anthropic的數據顯示，超過95%的會話不會觸發該分類器。在這些日常使用中，Fable 5性能與無限制版的Mythos 5完全一致。

Mythos 5則走了另一條路。它面向經過審核的合作方，移除了網絡安全或生物化學的防護，目前主要開放給兩類用戶：通過“玻璃翼計劃”與美國政府合作的網絡防御者，以及即將通過可信訪問計劃加入的生物學研究人員。

Anthropic的設計思路是：絕大多數場景下，Fable 5完全夠用。只有涉及真正危險的能力，才會使用到Mythos 5。

在超過1000小時的外部漏洞懸賞以及長時間智能體任務中，未發現通用越獄方法。但Anthropic也承認，防護措施被刻意調校得較為謹慎，有時可能會誤攔良性的請求。

與此配套，Anthropic還出臺了新的數據保留政策：對所有Mythos級模型的流量要求保留30天，數據不會用于訓練新模型或任何非安全目的。他們還設立了新的隱私保護措施，包括記錄所有對數據的人工訪問，并確保30天后刪除數據。

02 從“輔助編碼”到“獨立施工”

安全機制說清楚了，那Fable 5本身的能力怎么樣？

Fable 5強項是能處理需要極長時間、極高專注度的復雜軟件工程任務，而且任務越長越復雜，它相較于其他模型的領先優勢就越大。

支付巨頭Stripe在一個包含5000萬行Ruby代碼的龐大代碼庫里測試了Fable 5。模型在一天之內，就獨立完成了一項整個團隊手動操作需要耗時兩個多月的代碼庫遷移工作。

在具體的基準測試上，Fable 5 同樣表現出色。

在SWE-bench Pro上（衡量模型完成困難軟件工程任務的能力），Fable 5達到了80.3%，而GPT-5.5（OpenAI最新通用旗艦約為 58–60%，Claude Opus 4.8（Anthropic上一代旗艦）約為50–55%。

在Cognition FrontierCode（測試模型在滿足高質量生產代碼庫標準的同時完成困難編碼任務的能力）評估中，即使在中等努力水平下，Fable 5在頂尖模型中也得分最高。

在更嚴苛的FrontierCode Diamond（測試高質量、可維護的智能體編碼能力）基準測試上，Fable 5得到了29.3%，而Claude Opus 4.8為13.4%，GPT-5.5僅為5.7%，多數其他前沿模型則低于10%。

新加入Anthropic的頂尖AI研究員安德烈·卡帕西認為，Fable 5的份量相當于2025年11 月 Claude Opus 4.8 那次重大更新。

他說：“當你給它一個真正困難、需要長時間琢磨的任務時，模型像是真的‘懂了’，然后悶頭就去執行。那種想讓人徹底不看代碼、放手讓它干的感覺，以前從來沒有這么強烈過。當然他也補了一句，生產環境里可別真這么干。”

03 能看懂代碼，還能“讀懂”圖表

Fable 5的視覺能力也往前邁了一大步。

它現在不光能描述圖片里有什么，還能看懂圖表里的精確數據，甚至根據一張截圖就重建出整個網頁的源代碼。對于每天要處理大量PDF、掃描件、報表和儀表盤的企業來說，這個能力意味著自動化處理那些“非結構化”的混亂信息，變得更加可行。

為了展示這種“看懂并執行”的能力，Anthropic做了兩個有趣的內部測試。

第一個是讓模型玩經典的《寶可夢·火紅》。

以前的Claude模型，即使借助提供額外輔助工具的復雜框架，也難以順利完成這個游戲。而Fable 5，僅靠一個極簡的純視覺框架，盯著原始游戲截圖，就一路擊敗了游戲。

第二個測試是讓模型玩卡牌構筑游戲《殺戮尖塔》。

通過賦予模型基于文件的持久記憶能力，對Fable 5性能的提升幅度，是對此前旗艦模型提升幅度的三倍，到達游戲最終幕的頻率也提高了三倍。

對于企業用戶來說，這表明Fable 5能夠在長達數百萬token的長期任務中保持專注，并利用自身的筆記來改進輸出。對于那些需要運行數天甚至數周的內部智能體可能很重要，比如跟蹤客戶研究的銷售運營智能體、管理遷移的工程智能體，或者記住在多輪交互中嘗試過哪些方法的支持智能體。

而在不受安全防護限制的Mythos 5上，科學領域的潛力更為驚人。Anthropic內部的蛋白質設計專家使用Mythos 5，將藥物設計流程的多個環節加速了約十倍。

在一個例子中，他們發現配備了蛋白質設計和生物信息學工具但無人協助的Mythos 5，能夠匹敵甚至超越熟練的人類操作員。模型執行了通常由科學家完成的所有任務：選擇結合位點、選擇并運行蛋白質設計工具，以及從失敗中恢復。這項研究中的14個蛋白質靶點中有9個產生了很有潛力的藥物設計候選，Anthropic目前正在對其進行研究。

基因組學方面，Mythos 5在超過一周的自主工作中完成了一項新研究。它梳理了138個動物物種、數百萬個細胞的單細胞數據，自己設計并訓練了一個機器學習模型，用來識別不同物種中功能相同的細胞，哪怕這些物種親緣關系很遠。人只需要給個大致方向，Mythos 5訓出來的模型就超過了一個近期發表在《科學》上的模型，規模卻小了100倍。

不過，這些能力同時也帶來了風險。

Anthropic測試了Mythos 5在腺相關病毒（AAV）設計上的表現，AAV是基因療法里用來遞送藥物的組件，但同樣的技術也能被用來設計危險病毒。測試中，Mythos級模型僅憑生物學推理，就超過了專門為蛋白質任務訓練的復雜模型。這既說明它在基因治療研發上有前途，也暴露出雙重用途的風險。

Anthropic用自動評估工具測了Mythos 5的對齊表現。結果發現，模型出現欺騙、被用戶濫用等失調行為的概率很低，跟Opus 4.8差不多。Fable 5和它同底層的模型，表現也基本一致。

04 為強大能力戴上“緊箍咒”

Claude Fable 5和Mythos 5的發布，明確展示了Anthropic計劃如何將具有危險雙重用途能力的前沿模型推向市場。它既不向所有用戶開放全部能力，也不簡單拒絕高風險查詢，而是將特定請求轉至能力較低的模型處理，同時為絕大多數日常工作保留最強模型。

Anthropic表示，發布如此強大的模型伴隨著風險。若無防護措施，Mythos 5在網絡安全等領域的強大能力可能被濫用以造成嚴重損害。

對于網絡安全領域，Mythos 5將首先通過與美國政府合作的“玻璃翼計劃”部署，作為此前Mythos預覽版的升級。它擁有全球最強的網絡安全能力。

在相關基準測試中，該模型在衡量漏洞發現與利用能力的ExploitBench上得分78.0%，顯著高于Claude Mythos Preview（69.0%）、Claude Opus 4.8默認防護版（40.0%）。

在考察已知漏洞復現能力的CyberGym上，Mythos 5得分83.8%，與Claude Mythos Preview（83.1%）基本持平，兩者均維持在83%以上的高水平。不久之后，Anthropic 計劃通過一個更廣泛的“可信訪問計劃”來擴大 Mythos 5 的訪問權限。

生命科學領域也有一條類似的路徑。

Anthropic計劃為生物學研究者單獨開設一個可信訪問計劃，提供移除了生物化學防護但保留網絡安全防護的Fable 5。初期只面向一小部分經過篩選的研究人員，覆蓋基礎和轉化研究，后續再逐步擴大范圍。

05 價格砍半、爭議隨行

Fable 5和Mythos 5的定價為每百萬輸入token 10美元，每百萬輸出token 50美元。不到此前Mythos預覽版價格的一半，但依然是全球主要AI模型中最昂貴的之一。

對于訂閱用戶，Anthropic采取了一個分階段的推出方式。

從美國當地時間6月9日到6月22日，Fable 5將免費包含在Pro、Max、Team和基于席位數的企業計劃中。6月23日起，它將從這些計劃中移除，之后使用將需要消耗使用額度。

如果容量允許，Anthropic將延長免費使用窗口。在此之后，他們會盡快將Fable 5恢復為訂閱計劃的標準組成部分。

此次發布引發了行業內外的廣泛討論和不同聲音。

知名投資人、A16Z普通合伙人阿尼什·阿查里亞（Anish Acharya）稱，Anthropic這次刻意用Fable和Mythos這樣的品牌名來壓住模型編號。他們認為，用戶不在乎這是第幾代，只想知道是不是最前沿，把編號淡化掉剛好能讓人聚焦在這一點上。

不過，在一片叫好聲中，也有冷靜甚至尖銳的觀察。開源模型研究員內森·蘭伯特（Nathan Lambert）就直言不諱地評論道，Anthropic成天把安全掛在嘴邊，但連社交平臺上那幫懂技術的人都看得出來，這不過是給產品做安全包裝。

特約編譯金鹿對本文亦有貢獻

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.