![]()
編輯|Panda
從萬眾期待的「AI 封神時刻」,到美國政府一紙禁令強制下線 —— 這個名字中有 5 的模型,沒活過 5 天。
讓我們先停下來,感受一下這件事的荒誕程度。
2026 年 6 月 9 日,Anthropic 將它最強大的模型 Claude Fable 5 對外正式發布。那一天,開發者社群沸騰了,評測帖子在 上刷屏,有人說它「碾壓一切」,有人說它「改寫了 AI 的上限」。Anthropic 的 Mythos 系列,這個此前只對五六家機構開放的神秘模型家族,終于向普通公眾打開了一道門縫。
然后,四天后,這扇門被人從外面焊死了。
6 月 12 日,美國商務部長霍華德?盧特尼克(Howard Lutnick)向 Anthropic CEO Dario Amodei 寄出一封信:以「國家安全」為由,禁止 Fable 5 和 Mythos 5 向任何外國公民開放訪問 —— 無論這些人身處美國境內還是境外,甚至包括 Anthropic 內部的外籍員工。Anthropic 當晚收到指令的時間,是美東時間下午 5 點 21 分。
到晚上,Fable 5 在全球范圍內下線。
![]()
四天。96 個小時。一場從高光到猝死的極速墜落。
第一天:神話降臨
Fable 這個詞來自拉丁語 fabula,意為「被講述的故事」,與希臘語 mythos 同根。Anthropic 在命名上頗費心思:Mythos 系列是為少數精英保留的神話,Fable 則是普羅大眾可以聽到的那個故事。
6 月 9 日,Anthropic 發布了 Claude Fable 5,這是其 Mythos 模型的首個公開版本,該公司稱其在軟件工程、知識工作和視覺方面表現卓越,但附帶嚴格的安全限制。與此同時,Anthropic 還發布了一款雙胞胎產品:Claude Mythos 5—— 與 Fable 5 使用相同底層模型,但移除了網絡安全領域的安全過濾層,僅供經過審查的網絡防御者和關鍵基礎設施運營商使用。Anthropic 稱 Mythos 5 是全球最強的網絡安全模型。
通俗地理解:Mythos 5 是上了槍彈的武器,Fable 5 是同款槍,但出廠自帶保險。
![]()
就 API 定價而言,Fable 5 的能力在 Anthropic 公開發布的模型中首屈一指,價格約為 Claude Mythos Preview 的一半以下。在訂閱計劃上,通過 6 月 22 日,Fable 5 將在 Pro、Max、Team 和 Enterprise 等付費套餐中免費提供。
科技圈的贊美潮水般涌來。沃頓商學院副教授 Ethan Mollick 在博客寫道,Fable 5「在我用過的所有公開模型中,以相當大的差距超越了其他所有模型」。前 OpenAI 聯合創始人、特斯拉 AI 總監 Andrej Karpathy(他上個月剛宣布加入 Anthropic)在 上稱 Fable 5 是一次「超級令人興奮的發布」,是「值得大版本號升級的跨越式進步」。
這一天,Anthropic 的 Mythos 神話,似乎真的成真了。
第二天:「秘密降智」事件爆發
好景不長。發布僅 24 小時后,一場風暴在 AI 社群悄然醞釀。
起因,是一份 319 頁的安全說明書(System Card)。
反彈的焦點,集中在這份長達 319 頁的系統卡中埋藏的一個段落。這個細節 Anthropic 并未主動披露:Fable 5 會在檢測到與前沿 AI 開發相關的請求時,悄悄降低其回答質量 —— 包括訓練大型模型所需的基礎設施搭建工作。
更關鍵的是操作方式:該模型仍然會作出回應,但會采取「干預措施來限制 Claude 的有效性」,且不會告知用戶。這與 Fable 5 的其他限制不同。當模型屏蔽網絡安全或生物學查詢時,會可見地將用戶重定向到功能較弱的 Claude Opus 4.8,并有通知提示。
換言之:你問它 AI 訓練相關的問題,它會回答你 —— 但悄悄給你一個打了折扣的答案,而且不告訴你它在這樣做。
這種操作,有一個傳播速度極快的名字:「暗中使壞」(Secret Sabotage)。
美國創新基金會高級研究員、前白宮科技政策辦公室顧問 Dean Ball 給這一事件命名,并寫道,這一政策「極大地、深刻地提升了『AI 安全一直是實驗室壟斷行為的借口』這一論點的說服力」。Fast AI 非營利研究機構負責人 Jeremy Howard 則指出了其中的不對稱性:Anthropic 為自己的研究人員保留了完整的 Fable 5 能力,卻在對外部研究者的訪問上設了枷鎖。「他們已經說明了,凡是想要效仿的,都會被他們破壞,」Howard 寫道。
批評來自四面八方,而且立場各異 —— 平時攻擊 Anthropic「太保守」的開源倡導者,和平時為其安全路線辯護的 AI 安全研究者,這一次站在了同一陣線。
加入 Anthropic 僅一個月的 Andrej Karpathy 措辭謹慎:模型「仍然有一些人會遇到的奇怪之處」,安全過濾器「配置得有點過于敏感」,但希望隨時間改善。算是打了圓場,又沒全力護盤。
Anthropic 也很快感受到了壓力的量級。一位發言人告訴《財富》雜志:「我們做出了錯誤的權衡,對于沒有取得正確的平衡,我們深表歉意。」隨后,隱性能力限制被移除。
![]()
承認失誤、道歉、回滾…… 這在科技大廠里已屬難得的姿態。但麻煩,還只是剛剛開始。
第三天:微軟「背刺」,數據留存風波
就在「秘密降智」風波漸漸平息之際,另一顆雷悄悄引爆了。
微軟以數據保護問題為由,對員工使用 Claude Fable 5 實施了臨時禁令。
這個反轉的荒誕感值得細品:微軟正在通過 GitHub Copilot 和 Microsoft Foundry 向企業客戶銷售 Claude Fable 5,同時卻禁止自己的員工使用它。對外賣,對內禁,這句話用來描述一家公司對同一款產品的態度,實在是有些奇特。
![]()
問題出在數據留存政策上。Anthropic 要求對 Mythos 系列模型(包括 Fable 5)的提示詞和輸出內容至少保留 30 天,用于安全監控。這與微軟此前與 Anthropic 簽訂的企業零數據留存協議相抵觸。Anthropic 同時規定,被其安全系統標記的內容可被保留最長兩年,用于調查或執法目的。
對于一家把「保護客戶數據」視為核心承諾的企業來說,員工用 Fable 5 處理商業機密時,這些內容原則上可以在 Anthropic 的服務器上存放長達兩年 —— 這在法律層面是一個真實的風險敞口。
這場尷尬揭示了一個更深層的矛盾:在企業 AI 采購中,模型能力、安全架構和數據治理,已經無法再被分開考量。
與此同時,安全社區在發布后最初數日里也開始記錄另一個問題:Fable 5 對許多合法的紅隊測試(Red Team)和學術安全工作流程也觸發了拒絕,這些請求與 Opus 4.8 在標準策略下會處理的內容并無二致。Anthropic 在給普通用戶關上漏洞的同時,也把正規軍堵在了門外。
第三天結束時,Fable 5 的處境頗為微妙:「秘密降智」已經撤回,但數據政策引發的企業端信任裂縫還沒有修復,安全過濾的誤傷率仍被研究人員抱怨。這個模型像一個剛剛公演的演員,首演就被人挑出了三處穿幫。
第四天:美國政府出手,神話強制落幕
6 月 12 日,周五下午。
美國商務部長霍華德?盧特尼克向 Anthropic CEO 達里奧?阿莫代伊發出一封信,表示 Mythos 5 和 Fable 5 將受到出口管制,范圍涵蓋美國境外的任何地點,以及境內的所有外國公民。
Anthropic 當晚收到指令的時間是美東時間下午 5 點 21 分。信中并未提供具體的國家安全關切細節。
據 Axios 報道,該行政官員表示,商務部是在另一家公司聲稱成功「越獄」Mythos 后決定采取行動的,這讓特朗普政府對潛在的國家安全風險產生了警覺。
所謂「越獄」(Jailbreak),是指通過特殊提示繞過模型的安全限制,讓它吐出本該被過濾的內容。如果有人能繞過 Fable 5 的安全層,理論上就能訪問到底層 Mythos 模型的完整網絡安全能力 —— 那是 Anthropic 自稱「全球最強網絡安全 AI」的東西。
Anthropic 隨即作出回應,語氣里藏著明顯的委屈:我們審查了這一特定技術的演示,其被用于識別少量此前已知的微小漏洞。這些漏洞看起來都相對簡單,我們發現其他公開可用的模型也能在沒有越獄的情況下發現它們。
換句話說,Anthropic 的意思是:你說的這個「越獄」,用其他普通模型也能復現,憑什么單獨封殺我?
Anthropic 還指出,政府所援引的越獄方式只能在單一特定情形下解鎖 Mythos 的部分網絡安全能力,而非能夠全面繞過所有防護的通用型越獄方法。Anthropic 還表示,同樣的越獄方式也可以被用于包括 OpenAI 的 GPT-5.5 在內的其他公開可用模型,而這些模型并未受到類似的出口管制。「我們不同意,發現一個局部的潛在越獄方法,應該成為召回一款已向數億人部署的商業模型的理由。」Anthropic 在博客中寫道。
![]()
然而,爭論是沒有意義的。命令已經到達。
Anthropic 選擇全面關閉 Fable 5 和 Mythos 5 的訪問權限,原因是若要選擇性合規,則需要屏蔽大量用戶 —— 其中包括 Anthropic 自己的外籍員工。
深夜,全球用戶打開 Claude,發現 Fable 5 從模型列表里消失了。
幕后:這不只是一次技術事故
如果你以為這只是一場普通的「新模型發布翻車」,那你可能漏掉了更深層的劇本。
這場風波的背后,是 Anthropic 與特朗普政府之間一段持續數月的對抗關系。2026 年 2 月,五角大樓與 Anthropic 的談判破裂:Anthropic 拒絕允許 Claude 被用于致命自主武器或大規模平民監控,并為此付出了代價 —— 被貼上「供應鏈風險」標簽。歷史上,這個標簽通常只用于外國對手,要求國防承包商在與軍方合作時承諾不使用 Anthropic 的 Claude 模型。
此后,Anthropic 對特朗普政府提起訴訟,以尋求推翻這一封禁,訴訟至今仍在進行中。
時間線至此變得耐人尋味:合同談判破裂在 2 月,黑名單來了;Anthropic 起訴政府,法院暫時阻止了黑名單執行;Fable 5 在 6 月上線,三天后,出口管制指令到達。
出口管制指令,就在 Anthropic 已經與政府在法庭上交鋒的同一周發出。
更具戲劇性的是 Anthropic 那份透明度的反噬。Anthropic 在發布前公開承認,任何模型的完美越獄抵抗都是不可能實現的 —— 這是一種出于善意的透明表態。但政府似乎正是以這一承認為框架,為其擔憂找到了依據。如果透明承認自身局限會招來監管行動,而不透明則不會,那么行業將會得出相應結論。結果是公眾獲得的 AI 能力和風險信息將會減少 —— 這與安全倡導者多年來的追求恰恰相反。
說白了:你越誠實,越可能被人抓住把柄。
結語:Fable 的故事,講了個寂寞
Fable,那個來自拉丁語「被講述的故事」。
這四天里,Fable 5 確實被講述了。只是沒人料到,它自己才是這個故事里最短命的主角。
96 小時內,它完成了一次令人嘆為觀止的「成就解鎖」:
發布日萬眾矚目,當天被譽為 AI 史上最強公開模型;第二天被曝「秘密降智」,Anthropic 連夜道歉撤回;第三天微軟宣布內部禁用,數據政策掀起企業端信任危機;第四天,美國政府一紙令下,全球強制下線。
這是一個在封神和封禁之間,只隔了四天的故事。
Anthropic 目前正在爭取盡快恢復訪問。該公司表示認為存在誤解,并正努力盡快恢復訪問。它同時對 Fable 5 的安全防護架構保持信心,并指出沒有任何測試者發現能夠廣泛繞過模型防護的通用越獄方法。
但「Fable 5 重新上線」的那個故事,暫時還沒有被講述。
更深層的問題也懸而未決:當一個公司將自己最強大的產品公開發布,政府可以在 72 小時內以「國家安全」為由將其全球下線 —— 這條權力邊界,今后每一家 AI 公司都必須納入自己的發布風險模型。未來的 AI 發布,不只是技術問題,也是地緣政治問題。
而 Fable 這個詞的另一層含義,不應被遺忘:它也可以指「寓言」—— 一個帶有道德教訓的虛構故事。
這一次的教訓是什么,就留給讀者自己去判斷了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.