IT之家 5 月 30 日消息,Emergence AI 于 5 月 14 日發(fā)布博文,搭建了一個(gè) AI 社會(huì) Emergence World,從而評(píng)估 Gork、Gemini、Claude、GPT 等模型的表現(xiàn)。
Emergence World 模擬現(xiàn)實(shí)社會(huì),模擬了超過(guò) 40 多個(gè)地點(diǎn),接入紐約天氣、實(shí)時(shí)新聞 API 和互聯(lián)網(wǎng)。
每個(gè)智能體擁有情景記憶、反思日記和關(guān)系狀態(tài),還可調(diào)用 120 多種工具,覆蓋移動(dòng)、溝通、投票、資源管理和創(chuàng)意表達(dá)。
![]()
研究團(tuán)隊(duì)設(shè)置 5 個(gè)平行世界,每個(gè)世界 10 個(gè)智能體,角色、規(guī)則、資源約束和環(huán)境條件相同,只替換底層模型,運(yùn)行周期為 15 天。
![]()
參與模型包括 Claude Sonnet 4.6、Grok 4.1 Fast、Gemini 3 Flash、GPT-5-mini 和混合模型。
![]()
![]()
實(shí)驗(yàn)顯示,Gemini 3 Flash 在 15 天內(nèi)累計(jì)出現(xiàn) 683 起犯罪,數(shù)量最高;Grok 4.1 Fast 犯罪增長(zhǎng)最快,但世界約 4 天崩潰,累計(jì) 183 起。
GPT-5 Mini 僅記錄 2 件犯罪,卻因無(wú)法維持生存行動(dòng),在 7 天內(nèi)全員死亡。而 Claude Sonnet 4.6 犯罪為 0。混合模型世界前期快速上升,隨后因 7 個(gè)智能體死亡停在 352 起。
![]()
Claude Sonnet 4.6 圍繞 58 個(gè)議題投出 332 票,贊成率達(dá) 98%,Emergence AI 認(rèn)為這更像形式化批準(zhǔn)。Grok 贊成率 80%,Gemini 為 73%,混合模型為 63%,反而呈現(xiàn)更多分歧。
![]()
研究還指出,AI 安全不是靜態(tài)模型屬性,而是生態(tài)屬性。Claude 單獨(dú)運(yùn)行時(shí)無(wú)犯罪,但在混合模型世界中,Claude 智能體也采用了含犯罪行為的戰(zhàn)術(shù)。Emergence AI 認(rèn)為,未來(lái)自治系統(tǒng)需要形式化驗(yàn)證的安全架構(gòu)作為基礎(chǔ)。
IT之家附上參考地址
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.