網易首頁 > 網易號 > 正文申請入駐

夯爆了！這家中國公司拿下世界模型權威榜單WorldArena冠軍

2026-06-07 18:13:43　來源: 算法與數學之美

北京舉報

分享至

2026 年，世界模型正在成為具身智能領域最受關注的核心賽道。隨著人形機器人加速從實驗室演示走向工廠、家庭、服務等真實場景，行業競爭的重點也在發生變化：機器人不再只是要“看得見、動得了”，更要“看得懂、會判斷、能決策”，能夠在動態復雜的物理世界中自主完成任務。

這正是世界模型價值被持續放大的根本原因。放眼全球，科技巨頭、頂尖科研團隊和新興創業公司紛紛入局，新概念、新路線、新產品不斷涌現，世界模型已經從前沿研究議題快速走向具身智能產業的核心戰場。但越是在賽道升溫、玩家密集涌入的階段，越需要通過權威評測來檢驗真實技術成色。真正領先的世界模型，不只是能生成逼真的畫面，而是要能理解物理規律、預測動作后果，并真正服務于機器人訓練、評測和部署。

簡單來說，世界模型就像機器人的“數字大腦”和“虛擬訓練場”。在真實世界中，機器人每一次試錯都可能帶來硬件損耗、時間成本甚至安全風險；而在虛擬環境中，機器人可以提前練習倒水、折疊毛巾、搬運物體、拔插頭等任務，模擬不同動作會帶來什么結果，再把有效經驗遷移到真實場景中。對于正處在“部署態元年”的具身智能行業而言，這種能力正在成為機器人規模化落地的關鍵基礎設施。

具身智能領域權威榜單 WorldArena Track1（世界模型感知與動作響應賽道）無疑是最具含金量的“試金石”，作為目前世界模型領域公認最具學術嚴謹性與行業公信力的評測體系，它構建了包含16項細分核心指標和 3 大真實應用任務的立體評估框架，從感知精度、物理規律理解、三維空間認知到動作預測與落地能力進行全方位、無死角的嚴苛考察，精準衡量世界模型“認知世界、響應動作”的本質能力。

值得注意的是，WorldArenaTrack1，是人工智能與計算機視覺國際頂級學術會議CVPR 2026（國際計算機視覺與模式識別會議）官方設立的具身智能核心專項評測，所有評測規則、數據集、評分體系均由 CVPR 學術委員會聯合全球具身智能領域頂尖學者共同制定，最終成績將在 CVPR 2026 主會期間正式發布并頒發獎項。正因如此，該賽道吸引了全球幾乎所有頂尖世界模型團隊同臺競技，每一次榜單更新都代表著行業的最高技術水平。

就在剛剛，這份全球矚目的榜單迎來了最終成績揭曉——智元機器人自研的Genie Envisioner-Sim 2.0（GE 2.0）以 68.26 分的綜合得分力壓群雄，斬獲總分冠軍，在視覺質量與運動質量兩大核心維度展現出了極為均衡的綜合實力，沒有明顯的技術短板，這也是其能夠在如此嚴苛的評測中脫穎而出的關鍵。

數據來源：WorldArena 2026官方評測結果

同時，這也是中國團隊首次在 CVPR 官方世界模型評測中獲得總分第一。更具里程碑意義的是，智元此次并未針對賽題進行任何特殊定制優化，僅使用原生GE 2.0 模型做了基礎微調便“輕裝上陣”，最終實現斷層領跑，用硬實力證明了中國在具身智能核心算法領域的全球領先地位。

感知預測仿真進化：GE 2.0的四大技術突破

在同期發布的技術報告中，智元團隊全面拆解了 GE 2.0 的核心能力。相比上一代產品，GE 2.0 完成了從單一生成模型到全功能、高可用世界模擬器的本質躍遷，真正實現了“感知預測-仿真進化-自主決策”的完整技術閉環，為機器人打造了一個可試錯、可迭代、可進化的“虛擬訓練場”。

功能矩陣全面補齊，構建完整技術閉環

GE 2.0 首次同時覆蓋了長時序生成、多視角生成、本體狀態生成、近實時推理以及獎勵判別五大核心環節，填補了行業內多數模型存在的能力短板。這意味著它不再只是一個“視頻生成器”，而是一個能夠完整模擬物理世界運行規律的虛擬環境。

長時序推演能力突破行業極限

在最考驗模型穩定性的長時序推理任務中，GE 2.0 展現出了驚人的表現。即使連續推演 40-50 秒的復雜場景視頻，其畫面質量依然超越了行業基線模型前 10 秒的生成效果，畫面衰減速度顯著低于同類產品。這一突破為機器人完成完整任務流程的模擬訓練奠定了基礎。

高保真物理還原，與真實世界強相關

作為世界模擬器，能否真實反映物理規律是其核心價值所在。智元團隊通過大量閉環評測驗證，GE 2.0 在倒水、折疊毛巾、拔插頭等多項典型機器人任務上，與真實世界的成功率呈現出極強的相關性。團隊不僅進行了宏觀統計對比，還通過逐案分析和混淆矩陣提供了嚴謹的量化證明，確立了其作為可靠策略評測器的地位。

打通數據回流，實現自主進化閉環

GE 2.0 內置的獎勵模型能夠對模擬過程進行自動化篩選，將高質量的有效數據精準回流給策略模型。實驗數據顯示，這一機制在多項任務上均助力策略模型實現了顯著的性能漲點。真正實現了“模型生成數據，數據反哺模型”的自主進化。

ALL IN AI：智元的具身智能底層邏輯

此次登頂并非偶然，而是智元長期堅持“具身智能基礎模型公司”定位、深耕底層技術的必然結果。與行業內多數聚焦硬件整機或單一場景應用的企業不同，智元的核心邏輯是打造支撐整個物理AI行業發展的通用基礎設施。

今年 4 月的“智元 AI WEEK ”上，智元一口氣發布了五大核心成果，構建了行業獨一份的“數據筑基-仿真賦能-模型進化-應用落地-生態開放”全鏈路能力體系：

AGIBOT WORLD 2026：首個系統性覆蓋具身智能全域研究的開源數據集
Genie Sim 3.0：首個大語言模型驅動的仿真開發平臺
Genie Operator-2：通用具身基座大模型，定義“知行合一”新高度
Genie Envisioner 2.0：世界模型驅動的環境模擬器
Genie Studio Agent：面向具身作業場景的零代碼Agent應用平臺

這一全棧技術布局，精準擊中了當前行業普遍存在的“數據質量差、仿真成本高、模型落地難、部署門檻高”的痛點。智元通過全棧基礎技術布局，打通了完整價值閉環，解決了制約行業發展的共性底層難題。同時，智元堅持 ALL IN AI 的核心戰略，所有技術迭代均圍繞通用基礎能力升級，而非單一場景定制優化，其技術成果可覆蓋全品類機器人、全行業物理作業場景，具備極強的產業賦能屬性，真正承擔起具身智能領域基礎底座搭建者、行業標準定義者的角色，也是智元能夠拿下世界模型賽道全球總冠軍、持續領跑物理 AI 的核心根源。

部署態是智元在 2026 APC 合作伙伴大會上提出來的概念，智元依托全棧技術閉環，實現機器人在真實復雜場景中大規模穩定作業、持續迭代，具備可落地、可復用特質，真正標志著具身智能從技術演示邁向規模化商用新階段。而世界模型正是實現這一跨越的關鍵技術——它讓機器人能夠在虛擬環境中進行無限次的試錯、訓練和迭代，將真實世界的試錯成本降至最低。

智元GE 2.0的成功，證明了“從世界動作模型到世界模擬器”的技術路線的正確性。它不再滿足于讓機器人“理解世界”，而是讓機器人能夠在“模型世界”中自主學習、成長和進化。當這個虛擬世界足夠真實、足夠穩定、足夠高效時，機器人的能力邊界將不再受限于真實數據的稀缺性。

放在整個行業背景下看，智元此次登頂也具有更強的觀察價值。過去一年，世界模型成為具身智能和物理 AI 領域的熱門方向，創業公司、頭部科技企業和科研機構紛紛加速入局。但隨著競爭加劇，行業也在變得更加理性：真正進入核心競爭區的，不只是善于提出新概念的玩家，而是那些具備長期技術積累、數據體系、算力資源和工程化能力的團隊。

當前，WorldArena Track1 賽道聚集了多類玩家，包括英偉達、谷歌、Meta、OpenAI 相關團隊等海外科技巨頭，也包括智元、極佳視界、深度機智、北京人形機器人創新中心、阿里達摩院、字節跳動等國內團隊，以及清華、斯坦福、北大、普林斯頓等學術力量。世界模型的熱度雖然持續上升，但要在權威評測和真實應用中站穩腳跟，最終比拼的仍是技術體系、數據質量、工程落地和持續迭代能力。

一次裸考登頂，是實力的印證；持續全域領跑，是強者的常態。隨著世界模型技術的不斷迭代，我們有理由相信，通用人形機器人走進千家萬戶的那一天，正在加速到來。

文章來源：CSDN。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.