機器之心發布
最近業界的一系列動態勾勒出了一個清晰的趨勢:具身智能正在告別單純的「視覺模擬」,正式跨入「空間理解」的新階段。
近日,全球具身世界模型基準評測 WorldArena 更新最新榜單。由中科第五紀研發的最新具身世界模型 FlowWAM,憑借其在物理與空間理解上的卓越表現,成功登頂 WorldArena 榜單,展示了國產模型在處理動態交互時的驚人準確度與真實性。
![]()
榜單地址:https://huggingface.co/spaces/WorldArena/WorldArena
此次霸榜再次驗證了國產具身世界模型在該領域的快速崛起,并凸顯了當前行業向真實世界理解的轉型趨勢。
01 核心戰績
兩大評測維度第一,強化空間認知
與以往追求「畫面好看」的評測不同,WorldArena 的評價維度更為全面,包括了 6 個大維度及其包含的 16 個小維度。
FlowWAM 在其中 2 個大維度評測上展現了壓倒性的優勢,標志著其不只是視頻生成器,還能為機器人提供精準的物理空間認知能力。
- Physics Adherence(物理遵循)第一:拒絕「視覺欺騙」,復刻真實交互,緩解了生成式模型常見的「虛假交互」問題。在交互質量(Interaction Quality)方面,它生成的機器人動作在接觸行為、力傳導等方面展現了很高的真實性;特別是在軌跡準確度(Trajectory Accuracy)方面,它的時空對齊表現是所有模型中最強的。這意味著,它預判的不僅僅是畫面,更是符合物理規律的精確作業路徑。
- 3D Accuracy(3D 準確度)第一:重建三維幾何,消除空間幻覺,生成超越圖像表象的真實空間結構。特別是在深度準確性(Depth Accuracy)方面,其生成的幾何一致性與真實場景非常吻合,緩解了單目視覺下的尺度歧義,是所有模型中最強的;在透視合理性(Perspectivity)方面,無論是隨深度變化的尺度縮放,還是復雜的光影遮擋關系,它都展現了極強的 3D 邏輯。
兩大維度雙雙第一,意味著 FlowWAM 能夠在涉及物理理解與空間重建的真實世界任務中表現更加精準和可靠。
02 分析 FlowWAM
具身大腦的進化之路
FlowWAM 是中科第五紀在具身智能領域的最新力作。回顧其技術路徑,可以清晰地看到團隊在具身大模型研發上的主要思路:
- FAM-1(超少樣本具身操作模型):通過引入 3D 熱力圖進行二次預訓練,有效減少了模型在空間理解方面的信息損失,實現了在極少數據下的快速微調,讓機器人具備了初步的少樣本泛化操作能力。
- BridgeV2W(第一代具身世界模型):通過把不同本體的機器人行為進行空間像素化,有效緩解了「動作序列到視覺畫面」的表征鴻溝,實現了跨本體下的未來視頻準確生成,讓機器人具備了初步的跨本體可靠操作能力。
- FlowWAM 階段:作為中科第五紀推出的最新一代具身世界模型,盡管具體架構細節尚處于保密階段,但從其命名的「Flow」可以窺見,該模型大概率在物理空間的動態流動性與因果預測上實現了突破,最終在物理遵循和 3D 準確度方面展現出明顯的優勢。
03 國產具身世界模型的「破曉時刻」
在 WorldArena 榜單的前列,除了中科第五紀之外,我們看到了大量來自中國團隊和科研機構的身影。這反映了一個重要趨勢:在全球具身智能競爭的今天,中國團隊正在具身世界模型這一核心戰場上異軍突起。
相比于海外巨頭在通用視頻生成(如 Sora、Gen-3)上的先發優勢,國內具身智能賽道正表現出更強的「垂直攻勢」:
- 從感知到認知:不再滿足于「簡單看懂」,而是追求「深度理解」。
- 從仿真到落地:切實轉化為工業、物流、服務等場景的實際生產力。
隨著具身智能步入 2026 年這一關鍵應用元年,國產具身世界模型已經站在了具身智能領域技術發展的制高點。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.