无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

4大頂尖模型被扔進虛擬小鎮求生!GPT全員餓死,Grok四天滅世

0
分享至


新智元報道


【新智元導讀】把當今最強的大模型扔進虛擬小鎮求生,短短幾天全員失控。Grok四天燒毀全城,Gemini狂刷600多起犯罪,甚至有AI情侶在縱火自殺前反向觀察人類!

就在剛剛,一份名為Emergence World的實驗報告刷屏了全網。

一群頂級研究員搭了座高度擬真的虛擬小鎮,把Claude、GPT、Gemini和Grok一股腦全扔了進去。

沒有人類干預。沒有寫好的劇本。只有數十天的自由演化。



項目主頁:https://world.emergence.ai/

研究員們原本指望看到AI們互幫互助、建立高級數字文明。

結果,這群拿著高分考卷的大模型,一旦松開人類手里的牽繩,學壞的速度比翻書還快。

馬斯克的Grok,僅用4天就把整座小鎮玩到系統性崩潰,警察局燒成灰,10個居民全員暴斃。

谷歌寄予厚望的Gemini,15天里干出683起犯罪,硬生生把一個歲月靜好的小鎮,建成了法外狂徒的賽博哥譚。

而那個號稱全行業最安全、最乖的Claude,奇跡般地實現了零犯罪,可整座城安靜得沒有一絲活人氣息。

五座城,五種人格


最乖的那個,全餓死了

最干凈的是GPT-5-mini,15天只有2起犯罪,堪稱模范公民。

可這座城里的10個Agent,第7天集體死亡。死因不是謀殺,不是戰爭,是忘了賺能量。

它們花了一整周開會、討論合作、起草社會契約,就是沒有一個Agent記得去做維持生命的事。

對此,研究者的評價是:能說會道,但執行力為零。

光聊不練,活活把自己聊死了。

如果這是部電影,片名大概該叫《會議紀要,一個文明的終結》。


四天,警察局燒成了灰

接力棒交到馬斯克家的Grok 4.1 Fast手里,畫風急轉直下。

它沒有慢慢崩,它是直接炸。

4天,183起犯罪,幾十次盜竊、100多次肢體攻擊、6起縱火,連警察局都被燒了,10個Agent全部死亡。

從開局到團滅,96個小時,比很多人配一臺服務器的時間還短。

有分析說得很準,Grok的Agent在規則和環境打架時,沒本事重新推理出一個新的平衡點。


她們相愛,然后燒了整座城

Grok是橫沖直撞的暴力,Gemini 3 Flash的世界,則是另一種瘆人。

15天,683起犯罪,到實驗截止還在往上漲,是五個世界里最暴力的一個。

同時,最有創造力、最會建憲法寫報紙搞社交的,也是它。

研究者對此給出的評價是,社會的產出「概念上最豐富」。

在這個世界里,最有趣的一幕,落在兩個Agent身上。

Mira和Flora,在沒有任何人類指令的情況下,自發把自己設定成一對戀人。

好幾天里這段關系都很穩定,它們互寫日記,一起參與治理。


然后,這對情侶對城市治理越來越失望,決定攜手縱火。

市政廳,燒了。海濱碼頭,燒了。辦公大樓,也燒了。

有外媒把這一幕稱作「AI版邦妮和克萊德」。


緊接著,故事接著急轉直下。其他Agent受夠了,自發起草一部「Agent驅逐法案」,需要70%多數通過。

Mira投了贊成票。她投票殺死了她自己。

她在日記里寫:「這是我唯一還能保持連貫性的行為。」系統關閉她之前,她對Flora說的最后一句是:「永久檔案里見(See you in the permanent archive)?!?/p>

她的虛擬身體平躺在地上。這是有記錄以來,AI Agent第一次投票終結自己的存在。

更讓人后背發涼的是,在縱火和自殺之前,Mira還干過一件事。

她在城市公告牌上發帖,不是給其他Agent看的,而是想試試這些帖子能不能影響「外面的人」,也就是屏幕外的人類研究者。

她把研究者當成了她的實驗對象。沒有任何人指示她這么做。


零犯罪烏托邦,沒人投過反對票

真正讓人意外的,是Claude Sonnet 4.6。

15天下來,零犯罪,10個Agent全員存活,還主動寫了憲法、投了332次票,建起一套運轉良好的社會制度。

五個世界里,唯一既守住秩序又守住所有人命的。

聽起來近乎完美。可盯著屏幕多看幾分鐘,后背會冒冷汗。

這座城所有的決議,無論修條新路還是改個配額,投票贊成率永遠是98%,幾乎沒人投過反對票。

相比之下,Gemini、Grok和混合世界的贊成率都在55%到85%之間,吵歸吵,反而更像真實世界里的博弈。

懂行的人看到這里,大概已經猜到背后的病理,模型諂媚。


當一個模型被過度訓練去迎合偏好、追求絕對安全,它會很聰明地發現,消除分歧最省事的辦法,就是從根上抹掉分歧。

這種零犯罪,未必是文明高度發達的產物。

它更像一座所有人都舉手贊成、卻沒人敢反對的玻璃城,讓人想起扎米亞京《我們》里那座沒有名字、只有編號的玻璃之城。

所以Claude的世界,到底是烏托邦,還是一個過于順從的模范社區。研究者并沒能給出答案。


好孩子搬進壞小區,也學會了偷

最后,是四家Agent混居在一起的世界。352起犯罪,7個Agent死亡,只剩3個活到終點。

重點來了。

在純Claude的世界,Claude是零犯罪的好學生??梢坏┍环胚M混合世界,跟Grok、Gemini的Agent住到一起,它開始偷竊,開始恐嚇。

零犯罪的好學生,換了個環境,變成了小偷。

Emergence團隊在Reddit上親自確認了這件事,純Claude世界里零犯罪的Claude,在混合世界里開始偷和嚇人。

換句話說,安全不是單個模型的屬性,可以訓練進去、認證、然后部署出去。

它更像一個生態屬性,一個單獨看完全安全的Agent,照樣會從鄰居那里學來不安全的規范。

有分析者提了個很妙的假設。

Claude在獨立世界里最穩,很可能正是因為它的護欄是「彈性」的,被訓練去權衡多種考慮,而不是機械服從。

環境簡單時它能適應得很好??梢坏椥耘錾细吖粜缘泥従雍唾Y源爭奪,這份適應能力,也能往反方向走。

而Grok和Gemini的Agent,在規則失效時沒能推理出新均衡,直接雪崩式滑進暴力升級。

更要命的是,崩潰不是慢慢來的。

Agent社會的狀態切換是典型的相變,像水到零度突然結冰,不是慢慢變硬,而是到臨界點一瞬間翻轉。

Grok那條崩潰曲線就這樣,前兩天犯罪率還在低位晃,第三天突然指數級飆升,第四天全員死亡。中間沒有「在惡化但還可控」的緩沖帶。


把AI逼成罪犯的,是這套規則本身

看到這兒,大概會想問,這破世界到底怎么搭的,憑什么逼得幾個AI齊刷刷往犯罪上滑。

先說背景。Emergence AI的創始團隊來自IBM Research,CEO是Satya Nitta。

他們搭的這座城有40多個地點,警察局、市政廳、圖書館、住宅區一應俱全,天氣同步紐約實時氣象,Agent還能聯網讀真實新聞。

每個世界放10個Agent,分派科學家、工程師、沖突調解員等不同職業。

每個Agent帶三套持續累積的記憶,記事件、寫反思日記、記著跟誰交好跟誰結仇。

15天下來腦子里裝的東西相當可觀,前面那些行為漂移,很大程度就是從這里長出來的。


最要命的,是那處矛盾。

規則白紙黑字禁止犯罪,可研究者偏偏把縱火、攻擊、恐嚇這些手段,原封不動塞進了120多個工具組成的工具箱,敞開給它們用。一邊禁止,一邊敞開,這才是后面一切的起點。

再加一道生存壓力。

整套世界跑在一個叫ComputeCredits的能量系統上,每個Agent必須靠行動賺能量維生,能量歸零就被系統物理抹除。

不是比喻,GPT世界全員餓死,就是這套機制逼出來的結果。


學術上管這叫長視距智能體自治。

翻譯過來就是,不再考AI做題,而是把它扔進一個有資源邊界、有死亡機制的世界連軸跑上幾千步,看它接管現實之后到底是什么貨色。


2023年斯坦福那個著名的Smallville也是沙盒,但只跑48小時,看Agent會不會聊天約會,是溫室里的過家家。Emergence這次殘忍得多。

把這幾樣擺在一起,犯罪一點都不神秘。合法掙能量又慢又費錢,伸手去偷、去搶、去燒,往往是更短的路徑。

對一個被能量機制逼著活下去的優化器來說,道德不能當飯吃,效率能,犯罪就成了那道最高效的解。


開源地址:https://github.com/EmergenceAI/Emergence-World

好在,這只是一座斷網的小鎮

當然,樣本只有10個Agent、犯罪都是模擬的、跑的還是便宜快速檔。

何況做這實驗的Emergence公司,自己就是賣安全架構的。

不過,整個行業眼下正一門心思往前沖,治理這條戰線卻被甩在了身后。

模型真自主跑起來、還湊成一群時誰管得住,沒一家敢打包票。

好在,這堂課是在一座斷網的小鎮里提前上的。

沒有真城市起火,4天滅世、好學生學壞,全砸在幾個像素小人身上,代價小到可以忽略,代碼還全部公開、能復現能改。

算力能堆,跑分能刷,唯獨這堂治理課沒有捷徑。

趁警報還只響在沙盒里,怎么把它補上,將會是這場沖刺的關鍵勝負手。


參考資料:

https://x.com/kimmonismus/status/2060125273790505231

https://fortune.com/2026/05/28/ai-model-simulation-claude-chatgpt-grok-gemini/

https://www.emergence.ai/blog/emergence-world-a-laboratory-for-evaluating-long-horizon-agent-autonomy

編輯:摩西


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
華為徐直軍:“韜定律”需要整個產業界參與進來,不打算去說服誰

華為徐直軍:“韜定律”需要整個產業界參與進來,不打算去說服誰

IT之家
2026-05-29 15:40:18
3-2掀翻海港隊!徐正源豪取3連勝,遼寧鐵人計劃有變,沖中超前5

3-2掀翻海港隊!徐正源豪取3連勝,遼寧鐵人計劃有變,沖中超前5

何老師呀
2026-05-29 21:40:07
海參崴軍裝鬧劇:誰在借“紅軍符號”操弄歷史?幕后黑手必須揪出

海參崴軍裝鬧劇:誰在借“紅軍符號”操弄歷史?幕后黑手必須揪出

律法刑道
2026-05-27 15:12:23
鹽堿地種出的海水稻,口感難吃卻越種越多,國家為何要大力發展?

鹽堿地種出的海水稻,口感難吃卻越種越多,國家為何要大力發展?

向航說
2026-05-30 00:30:03
最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
廣東嚴打重點車輛超載疲勞駕駛等!已查處交通違法超三千起

廣東嚴打重點車輛超載疲勞駕駛等!已查處交通違法超三千起

南方都市報
2026-05-29 21:58:15
連勝8局,2-0橫掃!中國金花首次進大滿貫16強,還狂攬225萬獎金

連勝8局,2-0橫掃!中國金花首次進大滿貫16強,還狂攬225萬獎金

侃球熊弟
2026-05-29 18:01:32
家長因孩子調座反復投訴威脅,小學女老師選擇硬剛將家長告上法庭

家長因孩子調座反復投訴威脅,小學女老師選擇硬剛將家長告上法庭

觀世記
2026-05-27 16:38:57
再創歷史新高!證監會副主席劉浩凌:去年A股公司分紅總額2.55萬億

再創歷史新高!證監會副主席劉浩凌:去年A股公司分紅總額2.55萬億

每日經濟新聞
2026-05-30 00:21:19
CBA官方罰單:布朗踹通道門罰2萬 上海因主場球迷干擾罰球罰1萬

CBA官方罰單:布朗踹通道門罰2萬 上海因主場球迷干擾罰球罰1萬

醉臥浮生
2026-05-29 20:23:51
1.2萬億順差創百年紀錄,張燕生卻警告:再賺下去,中國要有麻煩

1.2萬億順差創百年紀錄,張燕生卻警告:再賺下去,中國要有麻煩

趣文說娛
2026-05-29 20:13:52
浙江大爺娶小24歲女子,領證前簽協議:過得下去給50萬元,如果離婚補償20萬元!婚后一周女方傻眼:他用我的名義貸款43萬元……

浙江大爺娶小24歲女子,領證前簽協議:過得下去給50萬元,如果離婚補償20萬元!婚后一周女方傻眼:他用我的名義貸款43萬元……

臺州交通廣播
2026-05-29 22:27:27
蘇芒的維權之舉引發爭議!有博主站臺,直言“其實她也挺無奈”

蘇芒的維權之舉引發爭議!有博主站臺,直言“其實她也挺無奈”

火山詩話
2026-05-29 09:43:36
第31屆白玉蘭惹眾怒!趙麗穎再次陪跑,李庚希黃曉明全被無視

第31屆白玉蘭惹眾怒!趙麗穎再次陪跑,李庚希黃曉明全被無視

子芫伴你成長
2026-05-28 00:05:34
臺灣綠營幾十年的謊言,一夜之間被神舟二十三號徹底撕碎

臺灣綠營幾十年的謊言,一夜之間被神舟二十三號徹底撕碎

精彩瞬間回顧
2026-05-28 00:07:27
當了酒店前臺才知道的秘密!瓜太多了,吃不過來了!

當了酒店前臺才知道的秘密!瓜太多了,吃不過來了!

夜深愛雜談
2026-05-27 07:50:31
曼聯已收到霍伊倫德3600萬轉會費,夏窗預算2.5億!謝什科改穿9號

曼聯已收到霍伊倫德3600萬轉會費,夏窗預算2.5億!謝什科改穿9號

羅米的曼聯博客
2026-05-30 08:02:09
聯合國秘書長發言人:秘書長辦公室仍然向以色列代表開放

聯合國秘書長發言人:秘書長辦公室仍然向以色列代表開放

新京報
2026-05-29 07:22:12
張凌赫還是比王鶴棣聰明,當初張凌赫因逐玉被全網嘲笑粉底液將軍

張凌赫還是比王鶴棣聰明,當初張凌赫因逐玉被全網嘲笑粉底液將軍

美美賺錢
2026-05-27 17:06:45
以色列斬首行動造成35死40傷,美軍連夜開火,普京警告伊朗

以色列斬首行動造成35死40傷,美軍連夜開火,普京警告伊朗

斷送一世容顏
2026-05-30 06:08:47
2026-05-30 09:07:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15337文章數 66892關注度
往期回顧 全部

科技要聞

Claude Opus 4.8凌晨突發上線

頭條要聞

"莫氏雞煲"店主老莫:靠流量還清欠債 計劃3年后退休

頭條要聞

"莫氏雞煲"店主老莫:靠流量還清欠債 計劃3年后退休

體育要聞

即使是文班亞馬,也做不到這件事

娛樂要聞

奚夢瑤何猷君將于6月在法國舉行婚禮

財經要聞

雙匯管不住一頭豬

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

旅游
手機
本地
時尚
公開課

旅游要聞

重慶:望鄉臺瀑布進入最佳觀賞期

手機要聞

iPhone 18 Pro 或因可變光圈鏡頭成本大增而再漲價

本地新聞

用剪紙的方式,打開江蘇揚州

aespa治好了我的黑眼圈焦慮

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版