无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

神話模型Fable 5被曝降智,只為防蒸餾?AI大佬抗議

0
分享至


新智元報道


【新智元導讀】Fable 5正在引發眾多質疑:一聲「你好」就能觸發警報,一問高端技術就會被暗箱降智。Anthropic的安全承諾,正在變成一場開源圈憤怒的「安全謊言」。

就在6月10日,Anthropic 正式推出了最強旗艦模型——Claude Fable 5!

作為 Mythos 級別的首款通用消費級模型,它立馬刷屏全體AI圈。在編程、復雜邏輯推理和工程任務上的表現,讓它帶給業界深深的震撼。

然而,隨著越來越多人加入實測,一場輿論風暴也在掀起——Anthropic,在背著我們讓Fable 5偷偷降智!


知名 AI 學者、人工智能政策專家 Nathan Lambert 發表長文,尖銳地指出:如果你進行前沿技術查詢,Anthropic就會在后臺干預,讓Fable 5「暗箱降智」。


他痛批道:「一個AI模型在不通知用戶的情況下自動降低智能水平,這絕對是錯誤的人工智能。」

更夸張的是,有中文用戶發現,僅僅對Fable 5說了一句「你好」,系統就彈出了高危安全警告。

一向以安全可信賴自居的Anthropic,背后居然偷偷搞暗箱操作、數據雙標這一套?

現在,開發者社區已經群情激憤了:Anthropic,你到底在害怕什么?


Fable 5怕你問前沿技術,是為了防蒸餾?

Nathan Lambert發現,當你向Fable 5詢問預訓練管線、分布式訓練架構、AI芯片設計等前沿技術問題時,它就偷偷摸摸地變笨了。

它不會拒絕回答,不會切換到低版本模型,更不會彈出任何提示——它只會默默降低回答質量,用更模糊、更淺薄、更不專業的語言敷衍你。

而這一切,完全發生在黑箱之中。

這是為什么?

Nathan Lambert在長文博客中揭露:A廠這么做,主要就是為防止競爭對手利用Fable 5進行模型蒸餾。


這樣,就能保護自身的商業護城河,延緩其他開發者追趕的速度。

顯然,投入了數十億美元研發資金,還背負著巨大商業變現壓力的A廠,是堅決不想讓自家模型變成別人免費的教師模型。

所以,他們選擇將所有用戶都視作潛在的竊賊。

那些在高校、非營利機構中真正致力于研究大模型預訓練、分布式優化、芯片硬件協作的科研工作者,也都被一棍子打死。

Lambert 悲哀地寫道:「我個人無法再信任這個世界上最強大的 AI 模型能夠用于我構建模型的專業領域。而我構建模型,完全是出于確保社會向強大 AI 系統安全過渡的熱情。這不可避免地讓人覺得,這是Anthropic單方面宣布的技術優越權。」

Anthropic的壟斷,進一步鞏固了。


為什么要暗箱降智?

根據官方公布的系統卡,Anthropic 將安全干預手段分為了兩類。

第一種,是顯性降級。

當用戶輸入的請求涉及到網絡安全、生物和化學危險品、或特定的模型蒸餾時,Fable 5 的后臺分類器會迅速做出判斷。

一旦觸發紅線,系統會自動將當前的對話模型切換為 Claude Opus 4.8,并在前端界面明確告知用戶。

雖然這種「顯性降級」有些令人不快,但由于公開透明,因此并未引發太大爭議。

真正點燃學術界怒火的,是針對前沿 AI 開發技術的第二類干預機制——隱性降智。

系統卡中寫道:

我們對加速整體 AI 發展步伐的風險感到擔憂……特別是,我們擔心加速其他 AI 開發者構建強大的 AI 系統,而他們未必擁有相匹配的安全防護措施。

因此,我們實施了新的干預措施,限制 Claude 在針對前沿大模型開發(例如構建預訓練管線、分布式訓練基礎設施或機器學習加速芯片設計等)請求時的有效性。

最關鍵的差異在于:「與網絡安全或生物化學的干預不同,這些針對前沿 AI 開發的保護措施對用戶是不可見的。Fable 5 不會降級到其他模型,而是會通過提示詞修改、轉向向量或參數高效微調等方法,暗中限制模型的輸出質量。」

也就是所謂的「靜默降智」。


如果你問到分布式訓練集群、設計ML芯片架構這類問題時,你會得到被可以被刻意注入了干擾向量的閹割版回答。

而這一切,Anthropic 決定完全不告知用戶。

學者 Nathan Lambert 對此撰文進行了猛烈抨擊。他認為,這種行為就是「人為制造的對齊失調」。

本來,對齊是為了讓 AI 的行為符合人類的意圖和福祉。而 Anthropic 的做法,完全是反其道而行之。

Lambert 警示道,「沿著這條路走下去,下一步——雖然 Anthropic 現在還沒這么做,但他們完全有能力做到——就是當模型認為某個工作場所的 AI 應用不安全時,在后臺靜默地操縱、干擾該工作場所的業務運行。」

神經質防守:說句「你好」就觸發警報

更夸張的是,有中文用戶曬出截圖:在剛剛打開對話框,僅僅向 Claude Fable 5 發了一句 「你好」,就突然出現高危安全警告:「您的請求觸發了高危安全策略過濾……」


顯然,在后臺算法看來,這一句你好說不定是經過精心偽裝的探針攻擊。

一旦觸發了這一機制,Fable 5 會立刻單方面掐斷當前的對話,強制將用戶切回上一代的 Opus 4.8。


這種「寧可錯殺一千,絕不放過一個」的極端策略,讓大批普通用戶哭笑不得。

似乎在 Fable 5 眼里,任何可疑的輸入,都像是在合成生物武器或者反向蒸餾它的知識產權。

隨后,Anthropic 官方承認:「全新的安全過濾機制在極高強度的防御策略下,確實可能會頻繁誤傷正常內容。」

開源的反擊:開源是唯一的答案

就在Fable 5發布引發爭議的前一周,NVIDIA發布了其首款旗艦開源模型—Nemotron 3 Ultra。

這個時間點耐人尋味。

Lambert在文中直言:

過去一周可以被視為美國新興開源生態系統的一個重要轉折點。Anthropic的舉措激發了我們這些構建開源模型的同行們的一致動力。

為什么開源模型突然變得更有吸引力?

答案很簡單:它不會對你撒謊。

當你在本地運行開源模型時,你知道它的全部權重、全部參數、全部行為邏輯。沒人能在后臺暗箱操作。

Llama、DeepSeek、Qwen、Nemotron提供了一個閉源模型永遠無法提供的東西:可驗證的信任。

在文章最后,Lambert給出了一個更深層的判斷:

如此強大的技術,最終的平衡狀態絕不可能由一家私營公司完全掌控。Anthropic今年早些時候與國防部的爭端就說明了這一點——政府要么希望AI受其控制,要么希望AI保持開放。

這讓我相信,開放的生態系統才是更安全的選擇。

他的結論是:Anthropic正在犯錯。他們試圖用封鎖和對抗來保護自己的領先地位,但這只逼迫更多人轉向開源。

Claude Fable 5確實在技術上有了驚艷的飛躍,但它在倫理上的退步,或許會成為AI發展史上的一個警醒。

當一家公司開始以安全之名對用戶撒謊時,信任的裂縫就再也無法彌合。

參考資料:

https://x.com/natolambert/status/2064412173527556298

編輯:Aeneas

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
差點被一鍋端!烏克蘭6架軍機直搗克里姆林宮,普京臉色都變了

差點被一鍋端!烏克蘭6架軍機直搗克里姆林宮,普京臉色都變了

戰域筆墨
2026-06-13 01:08:33
金正恩:我們的選擇是正確的

金正恩:我們的選擇是正確的

IN朝鮮
2026-06-12 13:10:39
世媒:RAI切掉夏奇拉表演惹爭議

世媒:RAI切掉夏奇拉表演惹爭議

懂球帝
2026-06-12 14:30:35
內塔尼亞胡:特朗普不打伊朗了,沒提前告訴我

內塔尼亞胡:特朗普不打伊朗了,沒提前告訴我

政知新媒體
2026-06-12 19:06:11
開場21分鐘落后,加拿大隊史至今7場世界杯比賽6場先丟球

開場21分鐘落后,加拿大隊史至今7場世界杯比賽6場先丟球

懂球帝
2026-06-13 03:58:04
納指收漲0.3% SpaceX上市首日收漲19%

納指收漲0.3% SpaceX上市首日收漲19%

財聯社
2026-06-13 04:02:07
房價要重現歷史!要有心理準備,下半年房價或將重現2018年歷史!

房價要重現歷史!要有心理準備,下半年房價或將重現2018年歷史!

星語者056
2026-06-11 16:58:03
看完世界杯第2場,球迷看清了3個不爭事實,韓國最擅長踢歐洲球隊

看完世界杯第2場,球迷看清了3個不爭事實,韓國最擅長踢歐洲球隊

侃球熊弟
2026-06-12 11:56:01
大陸剛結束臺東執法,菲外長對華攤牌:劃界一事,中國反對無效!

大陸剛結束臺東執法,菲外長對華攤牌:劃界一事,中國反對無效!

流史歲月
2026-06-12 19:30:08
克羅地亞美女總統,身材豐滿穿緊身球衣助陣,是世界杯頭號女球迷

克羅地亞美女總統,身材豐滿穿緊身球衣助陣,是世界杯頭號女球迷

秋姐居
2026-06-12 22:00:29
魚餌含精神藥品“安定”!日產十噸銷往全國,廠家:魚被麻痹狂咬鉤 利潤率50%

魚餌含精神藥品“安定”!日產十噸銷往全國,廠家:魚被麻痹狂咬鉤 利潤率50%

貓頭鷹視頻
2026-06-12 19:15:43
重磅!中超第1身價突然加盟,球迷:偉大的簽約,城市集團太猛了

重磅!中超第1身價突然加盟,球迷:偉大的簽約,城市集團太猛了

足球大腕
2026-06-12 23:25:25
韓國逆轉開門紅創7紀錄!黃仁范賽后比心硬漢柔情 韓媒:最大功臣

韓國逆轉開門紅創7紀錄!黃仁范賽后比心硬漢柔情 韓媒:最大功臣

顏小白的籃球夢
2026-06-12 12:31:34
英國爆發大騷亂:四天燎原、全境失控!

英國爆發大騷亂:四天燎原、全境失控!

怪味歷史連連看
2026-06-12 14:30:03
謝娜再次翻車,這一次,她踢到鐵板了

謝娜再次翻車,這一次,她踢到鐵板了

桌子的生活觀
2026-06-12 11:58:27
今日未訓練!曝34歲內馬爾基本無緣首場小組賽 且可能3場全踢不了

今日未訓練!曝34歲內馬爾基本無緣首場小組賽 且可能3場全踢不了

風過鄉
2026-06-12 22:43:31
少林寺新任住持釋印樂,上任才10個月,少林寺被曝一下少800多萬

少林寺新任住持釋印樂,上任才10個月,少林寺被曝一下少800多萬

嘆為觀止易
2026-06-10 11:49:16
時隔16年重返世界杯,巴拉圭主帥和球員在賽前發布會抱頭痛哭

時隔16年重返世界杯,巴拉圭主帥和球員在賽前發布會抱頭痛哭

懂球帝
2026-06-12 17:51:09
一聲嘆息,林詩棟、溫瑞博都止步薩格勒布16強,都輸得很不服氣

一聲嘆息,林詩棟、溫瑞博都止步薩格勒布16強,都輸得很不服氣

真理是我親戚
2026-06-13 01:25:43
國家出手!揚州“毒牙刷”曝光,成本價6分,原材料才是致癌物

國家出手!揚州“毒牙刷”曝光,成本價6分,原材料才是致癌物

姩姩有娛
2026-06-12 15:03:40
2026-06-13 05:19:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15454文章數 66922關注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

SpaceX上市首日收漲19% 總市值報2.1萬億美元

頭條要聞

SpaceX上市首日收漲19% 總市值報2.1萬億美元

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

親子
數碼
教育
健康
軍事航空

親子要聞

給孩子報個幼兒園還要工資流水?難道這就是傳說中的“因財施教”

數碼要聞

英國監管機構警告:亞馬遜、eBay仍在售可能致命的假冒手機充電器

教育要聞

家長成了“瘋女人”,被女兒作業搞崩潰,網友:太真實

老人、小孩、孕婦,吃粽子有啥風險

軍事要聞

伊朗媒體:已故最高領袖葬禮推遲舉行

無障礙瀏覽 進入關懷版