![]()
機(jī)器之心發(fā)布
WorldArena 世界模型賽道從來(lái)都是競(jìng)爭(zhēng)異常激烈,在經(jīng)歷了前幾次比賽過(guò)程中的放榜之后,CVPR 2026 WorldArena 世界模型賽道鎖定總成績(jī),智元自研的世界模型 Genie Envisioner-Sim 2.0(以下簡(jiǎn)稱(chēng) GE 2.0)拿下了最終的冠軍,成為了 “強(qiáng)者中的強(qiáng)者”。
![]()
WorldArena 是目前世界模型賽道最權(quán)威的榜單,擁有最嚴(yán)苛的評(píng)測(cè)基準(zhǔn),構(gòu)建了包含 16 項(xiàng)細(xì)分核心指標(biāo)和 3 大真實(shí)應(yīng)用任務(wù)的立體評(píng)估體系,旨在對(duì)具身世界模型的感知精度、物理規(guī)律理解、三維空間認(rèn)知以及動(dòng)作預(yù)測(cè)與落地能力進(jìn)行最嚴(yán)苛的考察。由于其極高的學(xué)術(shù)嚴(yán)謹(jǐn)性與行業(yè)公信力,WorldArena 吸引了全球幾乎所有頭部世界模型團(tuán)隊(duì)同臺(tái)競(jìng)技。
在該賽道評(píng)測(cè)中,智元團(tuán)隊(duì)使用了原生的世界模型 GE 2.0,并未針對(duì)賽題進(jìn)行特殊設(shè)計(jì)優(yōu)化,僅基于榜單數(shù)據(jù)進(jìn)行了基礎(chǔ)微調(diào)(Finetune)。“輕裝上陣” 依然拔得頭籌,充分印證了 GE 2.0 強(qiáng)大的通用適配性。面對(duì)近期世界模型方向的火熱關(guān)注和創(chuàng)業(yè)浪潮,智元始終保持自己的節(jié)奏,從長(zhǎng)遠(yuǎn)第一性原理出發(fā) ,專(zhuān)注于打磨具身世界模型的堅(jiān)實(shí)技術(shù)底座。此次登頂,是智元堅(jiān)持長(zhǎng)期技術(shù)演進(jìn)的實(shí)力見(jiàn)證。
![]()
- 項(xiàng)目鏈接:https://ge-sim-v2.github.io/
- Arxiv:https://arxiv.org/abs/2605.27491
- Github:https://github.com/AgibotTech/GE-Sim-V2
裸考封神
智元 GE 2.0 模型實(shí)力登頂
沒(méi)有針對(duì) WorldArena 進(jìn)行特別調(diào)優(yōu),裸考出戰(zhàn)依然斷層領(lǐng)跑。在 GE 2.0 技術(shù)報(bào)告中,智元團(tuán)隊(duì)對(duì)模型進(jìn)行了全面的能力剖析。相比上一代模型,GE 2.0 不僅在單點(diǎn)性能上實(shí)現(xiàn)了躍升,更真正演進(jìn)為一個(gè)全功能、高可用的世界模擬器,構(gòu)建可試錯(cuò)、可迭代、可進(jìn)化的虛擬仿真環(huán)境,讓機(jī)器人策略在虛擬場(chǎng)景中自主積累經(jīng)驗(yàn)、完成動(dòng)態(tài)試錯(cuò),規(guī)避真實(shí)場(chǎng)景的試錯(cuò)成本,最終高效遷移至真實(shí)物理世界穩(wěn)定落地,真正實(shí)現(xiàn)從 “感知預(yù)測(cè)” 到 “仿真進(jìn)化、自主決策” 的閉環(huán)升級(jí)。
功能矩陣全面補(bǔ)齊:GE 2.0 在功能上首次全面覆蓋了長(zhǎng)時(shí)序生成、多視角生成、本體狀態(tài)生成、近實(shí)時(shí)推理以及獎(jiǎng)勵(lì)判別等核心環(huán)節(jié),構(gòu)建了世界模擬器完整的技術(shù)能力閉環(huán)。
![]()
長(zhǎng)時(shí)序推演能力突破: 在長(zhǎng)時(shí)序推理任務(wù)中,GE 2.0 表現(xiàn)出極強(qiáng)的穩(wěn)定性,畫(huà)面質(zhì)量隨推理時(shí)長(zhǎng)的衰減顯著弱于行業(yè)基線(xiàn)方案。即使在連續(xù)推演 40-50 秒的長(zhǎng)視頻片段時(shí),其生成質(zhì)量依然超越了基線(xiàn)模型前 10 秒內(nèi)的表現(xiàn)。
![]()
高可靠的閉環(huán)評(píng)測(cè):作為世界模擬器,核心在于能否真實(shí)反映物理世界。團(tuán)隊(duì)驗(yàn)證了大量閉環(huán)評(píng)測(cè)結(jié)果,證明 GE 2.0 在多項(xiàng)任務(wù)上均與真實(shí)世界保持著強(qiáng)相關(guān)性。這種相關(guān)性不止步于宏觀統(tǒng)計(jì)意義上的 “成功率一致”,團(tuán)隊(duì)還進(jìn)行了逐案(Case-by-case)的 rollout 結(jié)果對(duì)比分析,并通過(guò)混淆矩陣(Confusion Matrix)提供了嚴(yán)謹(jǐn)?shù)牧炕糇C,強(qiáng)有力地證明了 GE 2.0 作為策略評(píng)測(cè)器的可靠性。
![]()
打通數(shù)據(jù)回流反哺機(jī)制:在獎(jiǎng)勵(lì)模型(Reward Model)的加持下,GE 2.0 能夠?qū)﹂]環(huán)評(píng)測(cè)的 rollout 過(guò)程進(jìn)行自動(dòng)化篩選,將世界模型中產(chǎn)出的有效高質(zhì)量數(shù)據(jù)精準(zhǔn)回流給策略模型(Policy Model)。實(shí)驗(yàn)證明,這一機(jī)制在多項(xiàng)任務(wù)上均助力策略模型實(shí)現(xiàn)了顯著的性能漲點(diǎn)。
![]()
從技術(shù)沉淀來(lái)看,智元 GE 2.0 的登頂,是長(zhǎng)期深耕底層算法、打磨物理 AI 核心能力的必然結(jié)果。相較于行業(yè)同類(lèi)模型,該模型實(shí)現(xiàn)了全方位技術(shù)躍升,不僅補(bǔ)齊長(zhǎng)時(shí)序穩(wěn)定推演、多視角精準(zhǔn)生成、實(shí)時(shí)物理還原、閉環(huán)獎(jiǎng)勵(lì)判別等全維度能力,更突破傳統(tǒng)模型 “重視覺(jué)、輕物理、難落地” 的行業(yè)痛點(diǎn)。即便在 40-50 秒超長(zhǎng)時(shí)序復(fù)雜場(chǎng)景推演中,依舊能保持畫(huà)面穩(wěn)定、物理邏輯精準(zhǔn)、空間結(jié)構(gòu)無(wú)偏差,生成數(shù)據(jù)可直接反哺機(jī)器人策略模型迭代,真正實(shí)現(xiàn)從 “視覺(jué)擬真” 到 “物理可信、可用、可落地” 的質(zhì)變,算法通用性、穩(wěn)定性、實(shí)用性全面領(lǐng)先行業(yè)水平。
ALL IN AI
智元定位 “具身智能的基礎(chǔ)模型公司”
區(qū)別于行業(yè)多數(shù)聚焦機(jī)器人硬件整機(jī)、場(chǎng)景應(yīng)用或單點(diǎn)技術(shù)優(yōu)化的企業(yè),智元堅(jiān)定錨定具身智能基礎(chǔ)模型公司核心定位,核心邏輯不在于制造機(jī)器人本體,而在于打造支撐整個(gè)物理 AI 行業(yè)發(fā)展的底層基礎(chǔ)設(shè)施與通用基礎(chǔ)能力。不同于單點(diǎn)應(yīng)用技術(shù)的迭代,智元深耕通用具身基礎(chǔ)模型,打造可適配全場(chǎng)景、可通用泛化、可自主進(jìn)化的底層 AI 能力,為機(jī)器人的運(yùn)動(dòng)、感知、決策、作業(yè)提供核心大腦。
今年 4 月,智元連續(xù)一周進(jìn)行了 “ALL IN AI” 智元 AI WEEK 成果發(fā)布,完成了開(kāi)源數(shù)據(jù)集、開(kāi)源仿真平臺(tái)、基座大模型、世界仿真器、機(jī)器人部署應(yīng)用平臺(tái)五大核心維度的完整技術(shù)閉環(huán)搭建,構(gòu)建了行業(yè)獨(dú)一份的 “數(shù)據(jù)筑基 — 仿真賦能 — 模型進(jìn)化 — 應(yīng)用落地 — 生態(tài)開(kāi)放” 全鏈路能力體系,徹底擺脫單點(diǎn)技術(shù)短板,成為具身智能領(lǐng)域全能型戰(zhàn)士。
- AGIBOT WORLD 2026:首個(gè)系統(tǒng)性覆蓋具身智能全域研究的開(kāi)源數(shù)據(jù)集
- Genie Sim 3.0:首個(gè)大語(yǔ)言模型驅(qū)動(dòng)的仿真開(kāi)發(fā)平臺(tái)
- Genie Operator-2:通用具身基座大模型,定義 “知行合一” 新高度
- Genie Envisioner 2.0:世界模型驅(qū)動(dòng)的環(huán)境模擬器
- Genie Studio Agent:面向具身作業(yè)場(chǎng)景的零代碼 Agent 應(yīng)用平臺(tái)
當(dāng)前行業(yè)普遍存在數(shù)據(jù)質(zhì)量參差不齊、仿真成本高、模型落地難、部署門(mén)檻高的痛點(diǎn),智元通過(guò)全棧基礎(chǔ)技術(shù)布局,打通了完整價(jià)值閉環(huán),解決了制約行業(yè)發(fā)展的共性底層難題。同時(shí),智元堅(jiān)持 ALL IN AI 的核心戰(zhàn)略,所有技術(shù)迭代均圍繞通用基礎(chǔ)能力升級(jí),而非單一場(chǎng)景定制優(yōu)化,其技術(shù)成果可覆蓋全品類(lèi)機(jī)器人、全行業(yè)物理作業(yè)場(chǎng)景,具備極強(qiáng)的產(chǎn)業(yè)賦能屬性,真正承擔(dān)起具身智能領(lǐng)域基礎(chǔ)底座搭建者、行業(yè)標(biāo)準(zhǔn)定義者的角色,也是智元能夠拿下世界模型賽道全球總冠軍、持續(xù)領(lǐng)跑物理 AI 的核心根源。
真正的通用機(jī)器人,離不開(kāi)硬件本體與智能系統(tǒng)的深度協(xié)同,更需要全棧自研的 AI 能力體系作為堅(jiān)實(shí)底座。具身智能的未來(lái),不在于零散的單點(diǎn)創(chuàng)新,而在于可持續(xù)進(jìn)化、可協(xié)同放大的系統(tǒng)性能力。從建成全球首個(gè) 3000 平方米機(jī)器人實(shí)景數(shù)據(jù)采集場(chǎng)地,到推出一站式仿真開(kāi)發(fā)平臺(tái) Genie Sim;從通用具身基礎(chǔ)模型 Genie Operator 1,到實(shí)現(xiàn)對(duì)物理世界深度理解的世界模型 Genie Envisioner;再到面向全量開(kāi)發(fā)者的具身智能一站式開(kāi)發(fā)平臺(tái) Genie Studio:智元持續(xù)構(gòu)建面向物理 AI 的完整能力底座,打通技術(shù)價(jià)值閉環(huán),讓每一項(xiàng) AI 能力都成為推動(dòng)機(jī)器人邁向 “部署態(tài)” 的堅(jiān)實(shí)支撐。
錨定 “部署態(tài)”
讓具身智能從炫技走向商用閉環(huán)
部署態(tài)是今年智元在 2026APC 合作伙伴大會(huì)上提出來(lái)的概念,智元依托全棧技術(shù)閉環(huán),實(shí)現(xiàn)機(jī)器人在真實(shí)復(fù)雜場(chǎng)景中大規(guī)模穩(wěn)定作業(yè)、持續(xù)迭代,具備可落地、可復(fù)用特質(zhì),真正標(biāo)志著具身智能從技術(shù)演示邁向規(guī)模化商用新階段。
成功實(shí)施 “部署態(tài)” 的核心在于底層算法的演進(jìn),智元 ALL IN AI 的核心邏輯始終圍繞真實(shí)物理世界、真實(shí)作業(yè)需求、真實(shí)商用落地,全部服務(wù)于機(jī)器人規(guī)模化部署:真實(shí)場(chǎng)景數(shù)據(jù)集保證模型適配復(fù)雜真實(shí)環(huán)境;生成式仿真大幅降低試錯(cuò)成本;基座模型保障作業(yè)精準(zhǔn)穩(wěn)定;世界模型提升復(fù)雜任務(wù)自主決策能力;零代碼平臺(tái)徹底解決落地難、復(fù)制難、迭代難的產(chǎn)業(yè)痛點(diǎn),實(shí)現(xiàn)技術(shù)價(jià)值到產(chǎn)業(yè)價(jià)值的完整閉環(huán)。
一次裸考登頂,是實(shí)力的印證;持續(xù)全域領(lǐng)跑,是強(qiáng)者的常態(tài)。智元本次登頂 WorldArena 世界模型總分冠軍,是智元長(zhǎng)期堅(jiān)持 All in AI 戰(zhàn)略的成果。算法是未來(lái)具身智能產(chǎn)業(yè)的競(jìng)爭(zhēng)核心,只有持續(xù)迭代世界模型、基座大模型等核心算法能力,深化虛實(shí)融合技術(shù)閉環(huán),才能在具身智能這條長(zhǎng)跑之路上,不斷引領(lǐng)向前。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.