網易首頁 > 網易號 > 正文申請入駐

Claude Fable 5四日驚魂

2026-06-15 10:40:03　來源: 機器之心Pro

河北舉報

分享至

編輯｜Panda

從萬眾期待的「AI 封神時刻」，到美國政府一紙禁令強制下線 —— 這個名字中有 5 的模型，沒活過 5 天。

讓我們先停下來，感受一下這件事的荒誕程度。

2026 年 6 月 9 日，Anthropic 將它最強大的模型 Claude Fable 5 對外正式發布。那一天，開發者社群沸騰了，評測帖子在上刷屏，有人說它「碾壓一切」，有人說它「改寫了 AI 的上限」。Anthropic 的 Mythos 系列，這個此前只對五六家機構開放的神秘模型家族，終于向普通公眾打開了一道門縫。

然后，四天后，這扇門被人從外面焊死了。

6 月 12 日，美國商務部長霍華德?盧特尼克（Howard Lutnick）向 Anthropic CEO Dario Amodei 寄出一封信：以「國家安全」為由，禁止 Fable 5 和 Mythos 5 向任何外國公民開放訪問 —— 無論這些人身處美國境內還是境外，甚至包括 Anthropic 內部的外籍員工。Anthropic 當晚收到指令的時間，是美東時間下午 5 點 21 分。

到晚上，Fable 5 在全球范圍內下線。

四天。96 個小時。一場從高光到猝死的極速墜落。

第一天：神話降臨

Fable 這個詞來自拉丁語 fabula，意為「被講述的故事」，與希臘語 mythos 同根。Anthropic 在命名上頗費心思：Mythos 系列是為少數精英保留的神話，Fable 則是普羅大眾可以聽到的那個故事。

6 月 9 日，Anthropic 發布了 Claude Fable 5，這是其 Mythos 模型的首個公開版本，該公司稱其在軟件工程、知識工作和視覺方面表現卓越，但附帶嚴格的安全限制。與此同時，Anthropic 還發布了一款雙胞胎產品：Claude Mythos 5—— 與 Fable 5 使用相同底層模型，但移除了網絡安全領域的安全過濾層，僅供經過審查的網絡防御者和關鍵基礎設施運營商使用。Anthropic 稱 Mythos 5 是全球最強的網絡安全模型。

通俗地理解：Mythos 5 是上了槍彈的武器，Fable 5 是同款槍，但出廠自帶保險。

就 API 定價而言，Fable 5 的能力在 Anthropic 公開發布的模型中首屈一指，價格約為 Claude Mythos Preview 的一半以下。在訂閱計劃上，通過 6 月 22 日，Fable 5 將在 Pro、Max、Team 和 Enterprise 等付費套餐中免費提供。

科技圈的贊美潮水般涌來。沃頓商學院副教授 Ethan Mollick 在博客寫道，Fable 5「在我用過的所有公開模型中，以相當大的差距超越了其他所有模型」。前 OpenAI 聯合創始人、特斯拉 AI 總監 Andrej Karpathy（他上個月剛宣布加入 Anthropic）在上稱 Fable 5 是一次「超級令人興奮的發布」，是「值得大版本號升級的跨越式進步」。

這一天，Anthropic 的 Mythos 神話，似乎真的成真了。

第二天：「秘密降智」事件爆發

好景不長。發布僅 24 小時后，一場風暴在 AI 社群悄然醞釀。

起因，是一份 319 頁的安全說明書（System Card）。

反彈的焦點，集中在這份長達 319 頁的系統卡中埋藏的一個段落。這個細節 Anthropic 并未主動披露：Fable 5 會在檢測到與前沿 AI 開發相關的請求時，悄悄降低其回答質量 —— 包括訓練大型模型所需的基礎設施搭建工作。

更關鍵的是操作方式：該模型仍然會作出回應，但會采取「干預措施來限制 Claude 的有效性」，且不會告知用戶。這與 Fable 5 的其他限制不同。當模型屏蔽網絡安全或生物學查詢時，會可見地將用戶重定向到功能較弱的 Claude Opus 4.8，并有通知提示。

換言之：你問它 AI 訓練相關的問題，它會回答你 —— 但悄悄給你一個打了折扣的答案，而且不告訴你它在這樣做。

這種操作，有一個傳播速度極快的名字：「暗中使壞」（Secret Sabotage）。

美國創新基金會高級研究員、前白宮科技政策辦公室顧問 Dean Ball 給這一事件命名，并寫道，這一政策「極大地、深刻地提升了『AI 安全一直是實驗室壟斷行為的借口』這一論點的說服力」。Fast AI 非營利研究機構負責人 Jeremy Howard 則指出了其中的不對稱性：Anthropic 為自己的研究人員保留了完整的 Fable 5 能力，卻在對外部研究者的訪問上設了枷鎖。「他們已經說明了，凡是想要效仿的，都會被他們破壞，」Howard 寫道。

批評來自四面八方，而且立場各異 —— 平時攻擊 Anthropic「太保守」的開源倡導者，和平時為其安全路線辯護的 AI 安全研究者，這一次站在了同一陣線。

加入 Anthropic 僅一個月的 Andrej Karpathy 措辭謹慎：模型「仍然有一些人會遇到的奇怪之處」，安全過濾器「配置得有點過于敏感」，但希望隨時間改善。算是打了圓場，又沒全力護盤。

Anthropic 也很快感受到了壓力的量級。一位發言人告訴《財富》雜志：「我們做出了錯誤的權衡，對于沒有取得正確的平衡，我們深表歉意。」隨后，隱性能力限制被移除。

承認失誤、道歉、回滾…… 這在科技大廠里已屬難得的姿態。但麻煩，還只是剛剛開始。

第三天：微軟「背刺」，數據留存風波

就在「秘密降智」風波漸漸平息之際，另一顆雷悄悄引爆了。

微軟以數據保護問題為由，對員工使用 Claude Fable 5 實施了臨時禁令。

這個反轉的荒誕感值得細品：微軟正在通過 GitHub Copilot 和 Microsoft Foundry 向企業客戶銷售 Claude Fable 5，同時卻禁止自己的員工使用它。對外賣，對內禁，這句話用來描述一家公司對同一款產品的態度，實在是有些奇特。

問題出在數據留存政策上。Anthropic 要求對 Mythos 系列模型（包括 Fable 5）的提示詞和輸出內容至少保留 30 天，用于安全監控。這與微軟此前與 Anthropic 簽訂的企業零數據留存協議相抵觸。Anthropic 同時規定，被其安全系統標記的內容可被保留最長兩年，用于調查或執法目的。

對于一家把「保護客戶數據」視為核心承諾的企業來說，員工用 Fable 5 處理商業機密時，這些內容原則上可以在 Anthropic 的服務器上存放長達兩年 —— 這在法律層面是一個真實的風險敞口。

這場尷尬揭示了一個更深層的矛盾：在企業 AI 采購中，模型能力、安全架構和數據治理，已經無法再被分開考量。

與此同時，安全社區在發布后最初數日里也開始記錄另一個問題：Fable 5 對許多合法的紅隊測試（Red Team）和學術安全工作流程也觸發了拒絕，這些請求與 Opus 4.8 在標準策略下會處理的內容并無二致。Anthropic 在給普通用戶關上漏洞的同時，也把正規軍堵在了門外。

第三天結束時，Fable 5 的處境頗為微妙：「秘密降智」已經撤回，但數據政策引發的企業端信任裂縫還沒有修復，安全過濾的誤傷率仍被研究人員抱怨。這個模型像一個剛剛公演的演員，首演就被人挑出了三處穿幫。

第四天：美國政府出手，神話強制落幕

6 月 12 日，周五下午。

美國商務部長霍華德?盧特尼克向 Anthropic CEO 達里奧?阿莫代伊發出一封信，表示 Mythos 5 和 Fable 5 將受到出口管制，范圍涵蓋美國境外的任何地點，以及境內的所有外國公民。

Anthropic 當晚收到指令的時間是美東時間下午 5 點 21 分。信中并未提供具體的國家安全關切細節。

據 Axios 報道，該行政官員表示，商務部是在另一家公司聲稱成功「越獄」Mythos 后決定采取行動的，這讓特朗普政府對潛在的國家安全風險產生了警覺。

所謂「越獄」（Jailbreak），是指通過特殊提示繞過模型的安全限制，讓它吐出本該被過濾的內容。如果有人能繞過 Fable 5 的安全層，理論上就能訪問到底層 Mythos 模型的完整網絡安全能力 —— 那是 Anthropic 自稱「全球最強網絡安全 AI」的東西。

Anthropic 隨即作出回應，語氣里藏著明顯的委屈：我們審查了這一特定技術的演示，其被用于識別少量此前已知的微小漏洞。這些漏洞看起來都相對簡單，我們發現其他公開可用的模型也能在沒有越獄的情況下發現它們。

換句話說，Anthropic 的意思是：你說的這個「越獄」，用其他普通模型也能復現，憑什么單獨封殺我？

Anthropic 還指出，政府所援引的越獄方式只能在單一特定情形下解鎖 Mythos 的部分網絡安全能力，而非能夠全面繞過所有防護的通用型越獄方法。Anthropic 還表示，同樣的越獄方式也可以被用于包括 OpenAI 的 GPT-5.5 在內的其他公開可用模型，而這些模型并未受到類似的出口管制。「我們不同意，發現一個局部的潛在越獄方法，應該成為召回一款已向數億人部署的商業模型的理由。」Anthropic 在博客中寫道。

然而，爭論是沒有意義的。命令已經到達。

Anthropic 選擇全面關閉 Fable 5 和 Mythos 5 的訪問權限，原因是若要選擇性合規，則需要屏蔽大量用戶 —— 其中包括 Anthropic 自己的外籍員工。

深夜，全球用戶打開 Claude，發現 Fable 5 從模型列表里消失了。

幕后：這不只是一次技術事故

如果你以為這只是一場普通的「新模型發布翻車」，那你可能漏掉了更深層的劇本。

這場風波的背后，是 Anthropic 與特朗普政府之間一段持續數月的對抗關系。2026 年 2 月，五角大樓與 Anthropic 的談判破裂：Anthropic 拒絕允許 Claude 被用于致命自主武器或大規模平民監控，并為此付出了代價 —— 被貼上「供應鏈風險」標簽。歷史上，這個標簽通常只用于外國對手，要求國防承包商在與軍方合作時承諾不使用 Anthropic 的 Claude 模型。

此后，Anthropic 對特朗普政府提起訴訟，以尋求推翻這一封禁，訴訟至今仍在進行中。

時間線至此變得耐人尋味：合同談判破裂在 2 月，黑名單來了；Anthropic 起訴政府，法院暫時阻止了黑名單執行；Fable 5 在 6 月上線，三天后，出口管制指令到達。

出口管制指令，就在 Anthropic 已經與政府在法庭上交鋒的同一周發出。

更具戲劇性的是 Anthropic 那份透明度的反噬。Anthropic 在發布前公開承認，任何模型的完美越獄抵抗都是不可能實現的 —— 這是一種出于善意的透明表態。但政府似乎正是以這一承認為框架，為其擔憂找到了依據。如果透明承認自身局限會招來監管行動，而不透明則不會，那么行業將會得出相應結論。結果是公眾獲得的 AI 能力和風險信息將會減少 —— 這與安全倡導者多年來的追求恰恰相反。

說白了：你越誠實，越可能被人抓住把柄。

結語：Fable 的故事，講了個寂寞

Fable，那個來自拉丁語「被講述的故事」。

這四天里，Fable 5 確實被講述了。只是沒人料到，它自己才是這個故事里最短命的主角。

96 小時內，它完成了一次令人嘆為觀止的「成就解鎖」：

發布日萬眾矚目，當天被譽為 AI 史上最強公開模型；第二天被曝「秘密降智」，Anthropic 連夜道歉撤回；第三天微軟宣布內部禁用，數據政策掀起企業端信任危機；第四天，美國政府一紙令下，全球強制下線。

這是一個在封神和封禁之間，只隔了四天的故事。

Anthropic 目前正在爭取盡快恢復訪問。該公司表示認為存在誤解，并正努力盡快恢復訪問。它同時對 Fable 5 的安全防護架構保持信心，并指出沒有任何測試者發現能夠廣泛繞過模型防護的通用越獄方法。

但「Fable 5 重新上線」的那個故事，暫時還沒有被講述。

更深層的問題也懸而未決：當一個公司將自己最強大的產品公開發布，政府可以在 72 小時內以「國家安全」為由將其全球下線 —— 這條權力邊界，今后每一家 AI 公司都必須納入自己的發布風險模型。未來的 AI 發布，不只是技術問題，也是地緣政治問題。

而 Fable 這個詞的另一層含義，不應被遺忘：它也可以指「寓言」—— 一個帶有道德教訓的虛構故事。

這一次的教訓是什么，就留給讀者自己去判斷了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.