![]()
新智元報道
![]()
【新智元導讀】Fable 5正在引發眾多質疑:一聲「你好」就能觸發警報,一問高端技術就會被暗箱降智。Anthropic的安全承諾,正在變成一場開源圈憤怒的「安全謊言」。
就在6月10日,Anthropic 正式推出了最強旗艦模型——Claude Fable 5!
作為 Mythos 級別的首款通用消費級模型,它立馬刷屏全體AI圈。在編程、復雜邏輯推理和工程任務上的表現,讓它帶給業界深深的震撼。
然而,隨著越來越多人加入實測,一場輿論風暴也在掀起——Anthropic,在背著我們讓Fable 5偷偷降智!
![]()
知名 AI 學者、人工智能政策專家 Nathan Lambert 發表長文,尖銳地指出:如果你進行前沿技術查詢,Anthropic就會在后臺干預,讓Fable 5「暗箱降智」。
![]()
他痛批道:「一個AI模型在不通知用戶的情況下自動降低智能水平,這絕對是錯誤的人工智能。」
更夸張的是,有中文用戶發現,僅僅對Fable 5說了一句「你好」,系統就彈出了高危安全警告。
一向以安全可信賴自居的Anthropic,背后居然偷偷搞暗箱操作、數據雙標這一套?
現在,開發者社區已經群情激憤了:Anthropic,你到底在害怕什么?
![]()
Fable 5怕你問前沿技術,是為了防蒸餾?
Nathan Lambert發現,當你向Fable 5詢問預訓練管線、分布式訓練架構、AI芯片設計等前沿技術問題時,它就偷偷摸摸地變笨了。
它不會拒絕回答,不會切換到低版本模型,更不會彈出任何提示——它只會默默降低回答質量,用更模糊、更淺薄、更不專業的語言敷衍你。
而這一切,完全發生在黑箱之中。
這是為什么?
Nathan Lambert在長文博客中揭露:A廠這么做,主要就是為防止競爭對手利用Fable 5進行模型蒸餾。
![]()
這樣,就能保護自身的商業護城河,延緩其他開發者追趕的速度。
顯然,投入了數十億美元研發資金,還背負著巨大商業變現壓力的A廠,是堅決不想讓自家模型變成別人免費的教師模型。
所以,他們選擇將所有用戶都視作潛在的竊賊。
那些在高校、非營利機構中真正致力于研究大模型預訓練、分布式優化、芯片硬件協作的科研工作者,也都被一棍子打死。
Lambert 悲哀地寫道:「我個人無法再信任這個世界上最強大的 AI 模型能夠用于我構建模型的專業領域。而我構建模型,完全是出于確保社會向強大 AI 系統安全過渡的熱情。這不可避免地讓人覺得,這是Anthropic單方面宣布的技術優越權。」
Anthropic的壟斷,進一步鞏固了。
![]()
為什么要暗箱降智?
根據官方公布的系統卡,Anthropic 將安全干預手段分為了兩類。
第一種,是顯性降級。
當用戶輸入的請求涉及到網絡安全、生物和化學危險品、或特定的模型蒸餾時,Fable 5 的后臺分類器會迅速做出判斷。
一旦觸發紅線,系統會自動將當前的對話模型切換為 Claude Opus 4.8,并在前端界面明確告知用戶。
雖然這種「顯性降級」有些令人不快,但由于公開透明,因此并未引發太大爭議。
真正點燃學術界怒火的,是針對前沿 AI 開發技術的第二類干預機制——隱性降智。
系統卡中寫道:
我們對加速整體 AI 發展步伐的風險感到擔憂……特別是,我們擔心加速其他 AI 開發者構建強大的 AI 系統,而他們未必擁有相匹配的安全防護措施。
因此,我們實施了新的干預措施,限制 Claude 在針對前沿大模型開發(例如構建預訓練管線、分布式訓練基礎設施或機器學習加速芯片設計等)請求時的有效性。
最關鍵的差異在于:「與網絡安全或生物化學的干預不同,這些針對前沿 AI 開發的保護措施對用戶是不可見的。Fable 5 不會降級到其他模型,而是會通過提示詞修改、轉向向量或參數高效微調等方法,暗中限制模型的輸出質量。」
也就是所謂的「靜默降智」。
![]()
如果你問到分布式訓練集群、設計ML芯片架構這類問題時,你會得到被可以被刻意注入了干擾向量的閹割版回答。
而這一切,Anthropic 決定完全不告知用戶。
學者 Nathan Lambert 對此撰文進行了猛烈抨擊。他認為,這種行為就是「人為制造的對齊失調」。
本來,對齊是為了讓 AI 的行為符合人類的意圖和福祉。而 Anthropic 的做法,完全是反其道而行之。
Lambert 警示道,「沿著這條路走下去,下一步——雖然 Anthropic 現在還沒這么做,但他們完全有能力做到——就是當模型認為某個工作場所的 AI 應用不安全時,在后臺靜默地操縱、干擾該工作場所的業務運行。」
神經質防守:說句「你好」就觸發警報
更夸張的是,有中文用戶曬出截圖:在剛剛打開對話框,僅僅向 Claude Fable 5 發了一句 「你好」,就突然出現高危安全警告:「您的請求觸發了高危安全策略過濾……」
![]()
顯然,在后臺算法看來,這一句你好說不定是經過精心偽裝的探針攻擊。
一旦觸發了這一機制,Fable 5 會立刻單方面掐斷當前的對話,強制將用戶切回上一代的 Opus 4.8。
![]()
這種「寧可錯殺一千,絕不放過一個」的極端策略,讓大批普通用戶哭笑不得。
似乎在 Fable 5 眼里,任何可疑的輸入,都像是在合成生物武器或者反向蒸餾它的知識產權。
隨后,Anthropic 官方承認:「全新的安全過濾機制在極高強度的防御策略下,確實可能會頻繁誤傷正常內容。」
開源的反擊:開源是唯一的答案
就在Fable 5發布引發爭議的前一周,NVIDIA發布了其首款旗艦開源模型—Nemotron 3 Ultra。
這個時間點耐人尋味。
Lambert在文中直言:
過去一周可以被視為美國新興開源生態系統的一個重要轉折點。Anthropic的舉措激發了我們這些構建開源模型的同行們的一致動力。
為什么開源模型突然變得更有吸引力?
答案很簡單:它不會對你撒謊。
當你在本地運行開源模型時,你知道它的全部權重、全部參數、全部行為邏輯。沒人能在后臺暗箱操作。
Llama、DeepSeek、Qwen、Nemotron提供了一個閉源模型永遠無法提供的東西:可驗證的信任。
在文章最后,Lambert給出了一個更深層的判斷:
如此強大的技術,最終的平衡狀態絕不可能由一家私營公司完全掌控。Anthropic今年早些時候與國防部的爭端就說明了這一點——政府要么希望AI受其控制,要么希望AI保持開放。
這讓我相信,開放的生態系統才是更安全的選擇。
他的結論是:Anthropic正在犯錯。他們試圖用封鎖和對抗來保護自己的領先地位,但這只逼迫更多人轉向開源。
Claude Fable 5確實在技術上有了驚艷的飛躍,但它在倫理上的退步,或許會成為AI發展史上的一個警醒。
當一家公司開始以安全之名對用戶撒謊時,信任的裂縫就再也無法彌合。
參考資料:
https://x.com/natolambert/status/2064412173527556298
編輯:Aeneas
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.