周三下午,四個玩家同時進入同一張地圖,彼此射擊、躲藏、追逐。但他們看到的畫面并非來自傳統游戲引擎,而是一個神經網絡實時想象出來的世界。這就是Agora-1,Odyssey團隊今天發布的首個多智能體世界模型。
世界模型不是什么新概念。它能生成高保真的虛擬環境,讓AI在仿真中學習。但過去這些模型有個硬性限制:同一時間只能容納一個"參與者"。無論是人類還是AI,都是獨自在模型生成的世界里探索。Agora-1打破了這個天花板。
![]()
團隊選擇了一個出人意料的測試場景:1997年的經典射擊游戲《GoldenEye》。這款在N64上誕生的作品,曾是許多團隊成員的童年記憶。游戲歷來是AI研究的試驗場——雅達利、我的世界、星際爭霸都承載過類似探索。現在輪到這款25年前的間諜題材射擊游戲了。
![]()
Agora-1最多支持四名玩家同時進入同一個生成世界。系統將他們匹配到共享的死亡競賽中,每個參與者同時與同一個世界狀態交互。你扣下扳機、躲進角落、拾取武器——這些動作被模型捕獲,轉化為對世界狀態的更新,再實時渲染成像素流推送到每個玩家的屏幕上。某種意義上,Agora-1扮演了一個"學習出來的游戲引擎"角色。
從技術路線看,這并非多智能體世界模型的首次嘗試。Multiverse把多個玩家的狀態拼接成"分屏"表示,將多人視為單一世界狀態;Solaris則沿序列維度拼接參與者,用自回歸擴散Transformer生成更穩定的共享仿真。但后者有個硬傷:玩家數量增加時,模型上下文膨脹,無法線性擴展。更麻煩的是,當玩家彼此脫離視野,這兩種方案都難以維持世界一致性。
![]()
Agora-1走了另一條路:解耦仿真與渲染。它維護一個顯式的共享世界狀態,但用不同方式建模動態演化與視覺渲染。這種分離讓模型能從多個獨立視角生成同一世界的連貫畫面——多人游戲、機器人訓練、多視角仿真,這些場景因此成為可能。
具體而言,Agora-1學習兩個獨立功能:一是世界狀態如何隨時間演化以響應玩家行為;二是如何從任意視角渲染該狀態。這種架構設計讓它在擴展性和一致性之間找到了新的平衡點。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.