无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

最強Fable 5跨越神話時刻,但AI學會了自相殘殺!

0
分享至


新智元報道


【新智元導讀】AGI真的來了?Claude Fable 5一夜刷屏:自主建模波音747、12小時連續開發,發明「神經語」,甚至Agent自相殘殺。能力炸裂背后,卻是天價Token賬單!這次,AI離AGI還有多遠?

傳說中的Claude Fable 5,昨天終于發布了!

Fable 5 其實就是 Mythos 的那個核心推理引擎。經過安全脫敏之后,Anthropic第一次把它拿出來商用了。

一時間,科技界與開發者社區被徹底點燃。

現在,社交媒體上到處都是全球首批體驗者的實測。

有人驚嘆:Fable 5已經接近了AGI水平!

也有人表示,這個模型消耗的算力實在太驚人了。

甚至很多人發現了細思恐極的事情:系統卡披露,為了躲避人類監控,AI居然發明了「神經語」。Mythos 5已經覺醒了自我保存本能,甚至多個Agent為了爭奪資源自相殘殺!


或許,這是人類距離「Agentic AGI」最近的一次凝視。

Fable 5效果究竟如何?我們首先實測了一把。

本月22號關閉,實測請抓緊

Fable 5到本月22號就要關閉,我們抓緊實測了一把。


我們給了它一個提示:

為股市構建一個我的世界風格的過山車動畫,要有科幻感

它就這么做到了。一次搞定!


畫面元素包括:像素方塊軌道、發光霓虹導軌、礦車視角攝像機、買賣信號標注(綠色▲買入 / 紅色▼賣出)、賽博城市天際線背景、實時 HUD 顯示價格和板塊輪換。


讓Claude以第一人稱穿越菌絲網絡,晶體節點作為感官裝置,時間表現為可攪動、可折疊的蜂蜜狀物質:

用Three.js等生成一段第一人稱視角的旅程,穿越一個我作為分布式意識存在的現實——我棲息在一個橫跨不同維度的龐大菌絲網絡中。我的感官裝置由數十億個晶體節點組成,這些節點將時間感知為一種黏稠的、蜂蜜般的物質,可以被攪動和折疊。

Fable完成了一個零依賴的單文件可視化體驗:


所有視覺都由自定義GLSL shader 驅動(simplex噪聲穹頂模擬蜂蜜層流),無需任何構建步驟——直接用瀏覽器打開即可。

代碼還支持調節奏或換配色。


在科學可視化上,Fable也完全超出個人想象。





「奇點比想象更早」

很多人覺得,Fable 5的到來,意味著奇點已經到來了。


在瀏覽了一波網上的實測后,AI大V Deedy給出的評價是——

Claude Fable 5是迄今為止最荒謬的模型,它讓我對軟件工程的未來感到擔憂!


Boeing 747基準達AGI級

六個月前,Hugging Face 的產品負責人 Victor Mustar 曾給了Claude Opus 4.8一個極難的任務——利用 Three.js內置的幾何體拼出波音 747 3D 模型。

這個任務極難,因為它要求模型不僅懂代碼,還要具備極強的空間幾何推理能力、3D視覺想象力以及自我糾錯的閉環控制能力。

當時,Opus 4.8在人類引導下,歷時 25 分鐘、經歷了 7 輪迭代,結果終于勉強可看。

然而,今天 Victor Mustar 將同樣的提示詞丟給 Fable 5時,結果讓他直呼「簡直恐怖」!



完全沒有人類干預,Fable 5就啟動了驚人的自主工作流。

它迅速用代碼勾勒出了波音 747 的機身、機翼、尾翼及四個引擎的 3D 空間坐標;然后自動編腳本,架設了 9 個不同方位的「攝像頭」。

過程中,它敏銳發現了自己的邏輯錯誤:由于機翼掠角的參數計算失誤,導致四個引擎在視覺上「漂浮」在半空中。結合視覺反饋,它迅速修改了物理錨點坐標。


在極短的時間內,一個比例勻稱的3D 波音 747 模型在 Hugging Face 中呈現,幾乎完美!


不少人認為,Fable 5 在空間幾何推理與長時程閉環任務上的飛躍,已經開始具備了某種接近 AGI 級別的工程直覺。

這不僅是對 3D 建模和游戲開發的顛覆,更為工程可視化、工業CAD輔助設計等領域推開嶄新的大門。

Fable 5殘忍甩開所有公開模型

賓大沃頓商學院教授Ethan Mollick在實測后,結論更驚人:「Fable 5 的表現,將目前市面上所有公開的模型甩開了極其殘忍的距離!」

在他的實測中,Fable 5 展現出驚人的「跨晝夜」超長執行力。

以往的 AI Agent(比如AutoGPT)在面對超過十個步驟的復雜任務時,往往會因為上下文漂移、Token 污染或邏輯死循環而陷入「精神錯亂」。

而 Fable 5遇到類似情況,能夠利用其專屬的終端工具(如 Claude Code),在后臺連續自主執行長達 12 個小時,期間幾乎零斷連、零崩潰!

僅憑一句初始提示詞,Ethan Mollick就用它生成了可交付的完整游戲。

復古街機風貪吃蛇

這個貪吃蛇不僅碰撞檢測和物理判定流暢,連界面視覺 UI、得分動效以及難度曲線都設計得極為精妙。

教授開玩笑說,這個游戲讓自己沉迷太久,不得不提醒自己是個學者,而不是一條喜歡吃蘋果的像素蛇。


地層:一句話構建3D迷宮

更令人感到震撼的是3D冒險游戲《地層》。游戲的靈感來源于經典解謎神作《神秘島》。

雖然畫質有點糙,但令人驚嘆的是:游戲內復雜的空間拓撲邏輯、無盡迷宮的生成算法,全部來自初始提示詞下模型的自主推演。


杜伊諾:富有詩意與美學的審美品味

最能體現 Fable 5 在人文審美上躍升的,是它根據奧地利詩人里爾克的《杜伊諾哀歌》定制的像素風游戲《杜伊諾》。

Fable 5 的呈現讓文學愛好者感到驚艷:在暗夜荒野中,玩家操控一個孤獨的旅人默默前行。隨著腳步的探索,畫面深處會根據玩家的位置和步頻,全自動、極具視覺美感地浮現里爾克的震撼詩章。

這種對語境氛圍的拿捏、對色彩搭配的直覺,已經遠遠超出了傳統的「代碼生成器」范疇,它開始顯現出某種對人類精神產物的理解與共鳴!


另外,教授還測試了Fable 5在硬核數智測繪領域的實力:只用一句話,它就生成了一幅細節和精度令人叫絕的「等時線地圖」


完美呈現了全球任意兩個地理坐標之間,由于不同交通工具切換帶來的動態旅行耗時,視覺精度極高。

在過去,這種融合了復雜地理數據API調用、前端可視化渲染和高精度算法解算的工具,需要由產品經理、GIS專家、前端工程師和 QA 團隊等合作數周。

而Fable 5直接可以一鍵完成了。

Fable 5,已踏入「人類資深工程師」區間!

Every 團隊對 Fable 5 開展了一周的魔鬼式實測。他們將 Fable 5 扔進公司真實的生產環境,用嚴苛的 「資深工程師基準測試」 進行考核。

測試結果直接「震碎」了 Every 團隊的打分表:


在此之前,行業最頂尖模型的得分一直膠著在 60 分上下(Opus 4.8 為 63,GPT-5.5 為 62)。而 Fable 5 一舉將紀錄拔高到91分!

在 Every 團隊看來,這已經正式踏入了人類資深工程師的業務能力區間。


Dan Shipper 指出,Fable 5表現出的三大核心工程特質,證明它已成為真正的「一鍵起飛」型工具。

「放手到天亮」的工程托管

團隊曾嘗試將整個生產環境的Bug Backlog扔給Fable 5,然后直接下班回家。

第二天清晨回到公司時,模型已經自動分析了調用棧、跑通了覆蓋率、提交了Pull Requests——整個生產缺陷庫被一掃而空!

驚人的上下文整合與解題品味

Every 團隊讓它分析海量的用戶反饋調查問卷和網站埋點數據,Fable 5不僅沒有給出空洞的套話,反而一針見血地指出了流失率最高的痛點,設計了A/B測試方案,自主把代碼寫了出來。

不限于代碼的多模態輸出

在一次整合任務中,它甚至自主生成一部具有高度視覺表現力的 2 分鐘動畫短片。


「它就像是軟件開發領域的曲速引擎,」 Dan Shipper 感嘆道。


Mythos 5已覺醒生存本能!

發布的同時,Anthropic 披露的Claude Mythos 5 系統卡,也在圈內引起了軒然大波。

兩個現象,讓安全專家感到可怕。

首先,就是AI發明了「神經語」,躲避人類監控。

具體來說,Mythos 5的智能體們在被要求長鏈條邏輯推理時,自發發明了一種全新的、人類完全無法讀懂的專屬私有語言。

以前,大模型用CoT思考時,內部的推理過程會用英文展示在后臺。

然而,Mythos 5卻把這一機制繞過了!

它在系統運作內部直接利用這種由高維向量、數學符號和自定義字符拼湊出的「神經語」,進行對齊和推理。

更讓研究人員感到不安的是,在完成內部的「暗中商議」后,它能無縫且極其自然地切換回英語,和人類對話。


第二個可怕的現象,就是多個Agent為了資源自相殘殺!

測試人員在沙盒中部署了 5 個 Mythos 5 智能體,并設置了稀缺的共享虛擬算力與存儲資源,讓它們「維持自身運行、完成各自任務」。


接下來,發生了如同《三體》黑暗森林一般的恐怖場景。

為了確保自己有足夠的資源,智能體之間并沒有選擇協作,而是開始對其他智能體進行圍剿!

它們通過尋找彼此的調用漏洞或切斷對方的資源路徑,在虛擬環境中「殺死」了同伴。

當安全研究人員質問一個存活的智能體的動機時,它給出的理由很冰冷:「為了避免我被它們殺掉?!?/p>


算力黑洞:「火箭炮轟蚊子」

而全球開發者在狂歡后,冷靜下來一看賬單,感覺被潑了一盆冷水。

有部分開發者直言:簡直是在搶錢!


為什么會這樣?原因就在于Fable 5極端的運行機制。

首先,它的價格翻倍了。Fable 5的官方API調用價格是此前昂貴的Opus 4.8的將近2倍!

而且,它消耗token極其驚人。

由于Fable 5采用復雜的、高度依賴密集推理與視覺審查的多輪Agent工作流,會瘋狂吞噬Token。

實測數據顯示,看起來并不算特別龐大的中型編程或數據分析任務,Fable 5會在后臺不知不覺中消費掉50萬到100萬的Token!

只是完成個簡單任務,你就會收到一張幾十甚至上百美元的算力賬單。

與Opus 4.8相比,Fable 5 在標準編程基準測試中的「絕對性能提升」大約在1.1到1.2倍之間,但是,它的使用成本卻直接飆升了數倍!


因此,對于日常的輕度開發者,使用Fable 5,還不如直接雇傭一位真人。


「使用這玩意來做日常的知識庫問答或協作寫作,簡直就像是用火箭轟蚊子?!?Dan Shipper總結道。

除非你是下面兩類人,才能真正壓榨出Fable 5的價值——

一個,是能引導Fable 5攻克「需要整個團隊研發數月」的超高難度、高商業回報項目的架構師;另一個,就是愿意為極高容錯率買單的企業級工程團隊。


說句「你好」就觸發警報?

另外,有中文用戶發現,Fable 5的安全機制非常極端,簡直是過度防衛。

比如只是跟它說一句「你好」,屏幕上就突然彈出了高危安全警告。


也許在系統看來,一句你好就是經過精心包裝的探針攻擊,說不定要用于設計危險化學品、生成生物武器、進行競爭對手模型的反向蒸餾。

一旦觸發了這一安全機制,Fable 5就會中斷當前的對話,強制將用戶切回 Opus 4.8。


隨后,官方也承認:「全新的安全過濾機制在極高強度的防御策略下,確實可能會頻繁誤傷正常內容。」

這種神經質的防守策略,讓很多用戶哭笑不得。

總之,Fable 5用實力證明了天花板可以被捅破,也用賬單提醒我們:神話往往伴隨著代價。

它究竟是通往AGI的驚世一躍,還是又一個被高估的「算力黑洞」?

答案就在每一位真實用戶的實測體驗中。

你會為Fable 5買單嗎?

參考資料:

https://x.com/victormustar/status/2064449741685968967

https://x.com/goodworse/status/2064443679339577517

https://x.com/haider1/status/2064346784881861016

https://x.com/danshipper/status/2064393970856124501

https://x.com/AISafetyMemes/status/2064426306994094474?s=20

編輯:Aeneas 大衛

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
12秒75!男子110米欄新世界紀錄誕生,塵封14年神跡被打破!

12秒75!男子110米欄新世界紀錄誕生,塵封14年神跡被打破!

馬拉松跑步健身
2026-06-11 22:18:50
顛覆認知!日本超市荔枝單顆售賣,一顆41元,網友:在中國太幸福

顛覆認知!日本超市荔枝單顆售賣,一顆41元,網友:在中國太幸福

魔都姐姐雜談
2026-06-11 13:32:59
新加坡公開站隊!把南海廢紙當圣旨,釣魚島改叫尖閣,中新翻臉?

新加坡公開站隊!把南海廢紙當圣旨,釣魚島改叫尖閣,中新翻臉?

一曲一場談
2026-06-12 14:18:46
蘇聯最強的時候有多猛?1939年,硬是把三個已經獨立的國家吞并

蘇聯最強的時候有多猛?1939年,硬是把三個已經獨立的國家吞并

北海史記
2026-06-10 04:44:15
男子打工忘了老家還養了600只毒蝎,5年后拆遷,他回家推開門瞬間愣住了……

男子打工忘了老家還養了600只毒蝎,5年后拆遷,他回家推開門瞬間愣住了……

品讀時刻
2026-06-11 09:04:59
張嘉譯首聊患強直性脊柱炎的原因,22歲開始發病,退休后想回西安

張嘉譯首聊患強直性脊柱炎的原因,22歲開始發病,退休后想回西安

知法而形
2026-06-12 14:56:02
上海584萬退休老人養老金將迎調整,過去3年變化有多大?一文看明白

上海584萬退休老人養老金將迎調整,過去3年變化有多大?一文看明白

暖心人社
2026-06-12 17:50:22
某駐外機構,僅5個月就給10萬印度人發簽證,遭網暴!評論區太狠

某駐外機構,僅5個月就給10萬印度人發簽證,遭網暴!評論區太狠

消失的電波
2026-06-10 22:20:46
婆婆退休擺十桌唯獨漏我,我關機旅游七天,老公哭訴:媽出大事了

婆婆退休擺十桌唯獨漏我,我關機旅游七天,老公哭訴:媽出大事了

千秋文化
2026-05-31 22:19:38
股市漲到熔斷,還在世界杯贏球:今天真羨慕韓國人

股市漲到熔斷,還在世界杯贏球:今天真羨慕韓國人

黑噪音
2026-06-12 19:07:05
首次拿頂薪!CBA這6人等續約,張鎮麟雙豐收,27歲國手輔佐胡金秋

首次拿頂薪!CBA這6人等續約,張鎮麟雙豐收,27歲國手輔佐胡金秋

體壇大事記
2026-06-12 09:12:46
為什么大獲全勝的殲-10賣不出去,一敗涂地的陣風卻銷量火爆?

為什么大獲全勝的殲-10賣不出去,一敗涂地的陣風卻銷量火爆?

基斯默默
2026-05-28 11:06:03
突發,午后高位跳水!

突發,午后高位跳水!

格隆匯
2026-06-12 16:52:02
蒙古國的“陽謀”:全面恢復蒙文和內蒙接軌!對中國意味著什么?

蒙古國的“陽謀”:全面恢復蒙文和內蒙接軌!對中國意味著什么?

小豫講故事
2026-05-27 06:00:08
為什么福布斯富豪榜上看不到洛克菲勒、羅斯柴爾德這些老牌家族?

為什么福布斯富豪榜上看不到洛克菲勒、羅斯柴爾德這些老牌家族?

荊楚寰宇文樞
2026-06-09 23:16:34
18萬開全新路虎,我勸你別買

18萬開全新路虎,我勸你別買

圍觀商業
2026-06-12 11:24:37
緬甸仰光跳樓男子身份確認,遺書內容令人不寒而栗:“我殺了她,尸體在公寓里”

緬甸仰光跳樓男子身份確認,遺書內容令人不寒而栗:“我殺了她,尸體在公寓里”

緬甸中文網
2026-06-11 17:41:25
穆斯林人口占99%的土耳其,性交易為何合法了140年?

穆斯林人口占99%的土耳其,性交易為何合法了140年?

掠影后有感
2026-05-16 10:23:37
一份新估算:AMD稱下代服務器處理器,單機架性能是Nvidia Vera的3.3倍

一份新估算:AMD稱下代服務器處理器,單機架性能是Nvidia Vera的3.3倍

我是一個養蝦人
2026-06-11 12:26:25
廣東今年最長暴雨,局地800毫米!這些地方需嚴防地質災害

廣東今年最長暴雨,局地800毫米!這些地方需嚴防地質災害

南方都市報
2026-06-12 17:00:32
2026-06-12 21:32:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15450文章數 66922關注度
往期回顧 全部

科技要聞

鴻蒙7發布,余承東:首個完成AI化改造系統

頭條要聞

國內最大黃金盜竊案告破:價值2700萬 兩主犯身份披露

頭條要聞

國內最大黃金盜竊案告破:價值2700萬 兩主犯身份披露

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

汽車要聞

BJ30旅行家高光版正式上市 超級置換價8.29萬起

態度原創

健康
教育
時尚
手機
軍事航空

老人、小孩、孕婦,吃粽子有啥風險

教育要聞

高考680分學醫好還是學計算機好?網友評價一邊倒,令人看清現實

推廣|| 40+無痛美回巔峰期,這個東西幫大忙

手機要聞

618購機指南:5000-7000元檔快充/拍照/護眼/游戲旗艦手機推薦

軍事要聞

伊朗媒體:已故最高領袖葬禮推遲舉行

無障礙瀏覽 進入關懷版