无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

機器人的終局:英偉達Jim Fan宣告VLA時代結束,WAM登場

0
分享至

Jim Fan是英偉達機器人與AI研究組(GEAR Lab)負責人,過去幾年主推的GR00T人形機器人基礎模型用的是VLA(Vision-Language-Action,視覺-語言-動作)架構。他剛在Sequoia AI Ascent 2026上做了一場20分鐘的演講,主題叫《Robotics' End Game》,第一件事就是宣布VLA路線過時——包括他自己半年前還在推的GR00T。


取而代之的新范式叫世界動作模型(WAM),代表作是英偉達2月發布的DreamZero。他把這套思路叫"底層同構":復制LLM(Large Language Model,大語言模型)走過的三步(預訓練→對齊→強化學習),用視頻世界模型替代語言模型,用人類第一人稱視頻替代遙操作數據,最終在2040年前讓機器人自己設計和制造下一代自己。他對此有95%的把握。

要點速覽

VLA路線落幕:Jim公開宣告VLA路線過時,新范式叫世界動作模型(WAM),代表作是DreamZero(140億參數)。

告別遙操作數據:遙操作物理上限低,預測一兩年內降到接近0,被傳感化人類數據取代。

神經縮放定律:EgoScale用21,000小時人類第一人稱視頻預訓練,團隊發現了靈巧操作的神經縮放定律(R2 = 0.998)。

神經仿真器:Dream Dojo用44,000小時人類視頻訓練出一個完全繞過物理引擎的神經仿真器。

終局倒計時:給出2040年完成機器人終局的預測(物理自動研究),置信度95%。

從DGX-1簽名到"底層同構"

Jim用一段往事開場。2016年夏天,就在OpenAI當時的辦公室,黃仁勛穿著標志性皮夾克,抱著一塊大金屬托盤走進來,上面寫著:"致Elon和OpenAI團隊,致計算和人類的未來。"那是全球第一臺DGX-1。

Jim當時是OpenAI的第一個實習生,趕緊排隊去上面簽了名。"那時候我完全不知道自己在簽什么。"旁邊一起簽的還有Andrej Karpathy。這臺機器現在在Computer History Museum收藏。

于是他做出了一個決定:抄作業,換個名字,叫"底層同構"(the Great Parallel)。把"模擬字符串的下一個狀態"換成"模擬物理世界的下一個狀態",通過動作微調收斂到機器人需要的那部分,最后讓強化學習走完最后一公里。

VLA怎么了:參數都堆在了語言上

過去三年,機器人領域的主流架構是VLA(Vision-Language-Action,視覺-語言-動作模型)。英偉達自家的GR00T和Physical Intelligence的π0都屬于這個類別。

Jim指出了結構性問題:其實這些模型該叫LVA,因為參數大頭全堆在語言上了。語言是一等公民,視覺次之,動作只能墊底。

VLA擅長編碼知識和名詞,不擅長物理和動詞。重心放在了不對的地方。

他舉了RT-2原始論文里那個經典demo:讓機器人把可樂罐推到Taylor Swift的照片旁邊。模型沒見過Taylor Swift,但能泛化過去。問題是,泛化的是名詞(能認出Taylor Swift),而不是動詞(該怎么推、找什么角度、用多大力)。

從AI垃圾視頻到DreamZero

VLA不是答案,那下一個預訓練范式是什么?結果發現是視頻模型,它們在內部學會了模擬物理世界的下一個狀態。

怎么把這些世界模型變有用?做動作微調。把"所有可能的未來"這種疊加態,收斂到一條對真實機器人有意義的動作軌跡上。

英偉達的答案叫DreamZero。這是一種新型策略模型,在執行動作之前先往未來"做夢"幾秒鐘,然后根據夢境行動。DreamZero同時解碼下一幀畫面和下一步動作。在這里,視覺和動作第一次真正成為了"一等公民"。

Jim坦率地承認DreamZero目前做不到每個任務都100%可靠。"它大概相當于GPT-2的階段,方向對了,但表現還不夠穩定可靠。"他給這個新架構起名叫WAM(World Action Models,世界動作模型)。

數據革命:從遙操作到"機器人不用參與的數據采集"

過去三年是遙操作(teleop)的黃金時代。但遙操作有一個硬上限:每臺機器人每天24小時。

"我說一天24小時,那是騙自己的。實際一天能干3小時就不錯了,還得看當天的'機器人之神'賞不賞臉——畢竟這幫機器天天鬧脾氣出毛病。"

怎么破局?把機器人的末端執行器直接戴在人手上,直接采集數據,完全繞過機器人本體。

英偉達方案是DexUMI,一種外骨骼裝置。用外骨骼數據訓練出的機器人策略可以完全自主運行,訓練數據里沒有任何遙操作數據。

EgoScale:21,000小時人類視頻和縮放定律

英偉達搞了一個叫EgoScale的數據集,包含21,000小時人類第一人稱視頻,涵蓋日常家務、辦公室工作、工業操作等場景。

團隊發現了靈巧操作的神經縮放定律:隨著預訓練數據量增加,模型在下游任務上的表現呈線性提升,擬合度R2 = 0.998。

這意味著什么?機器人學習也遵循和LLM類似的縮放規律——只要數據夠多,模型就能持續變強。

Dream Dojo:完全繞過物理引擎的神經仿真器

傳統機器人訓練需要在仿真環境里一遍遍試錯,但仿真器和真實世界總有差距。

Jim團隊的解決方案是Dream Dojo:用44,000小時人類視頻訓練出一個完全基于神經網絡的世界模型,徹底繞過傳統物理引擎。

這個神經仿真器能生成逼真的物理交互視頻,機器人在"夢境"里訓練,然后零樣本遷移到真實世界。

2040年終局:機器人自己造下一代

Jim給出了一個大膽預測:2040年前,機器人將完成"物理自動研究"——也就是機器人自己設計和制造下一代機器人。他對此的置信度是95%。

路徑已經很清晰:預訓練(世界模型)→對齊(動作微調)→強化學習(自我改進)→自動研究(機器人造機器人)。

這和LLM的發展軌跡幾乎一模一樣。唯一的區別是,LLM處理的是文本,WAM處理的是物理世界。

"如果你相信深度學習,深度學習就信你。"

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
世界杯倒計時,姆巴佩飛馬德里見女友,太不可思議了

世界杯倒計時,姆巴佩飛馬德里見女友,太不可思議了

觀星娛記
2026-06-12 11:35:13
董路:中國無緣世界杯不是因為被巴西揍,是因為贏不了菲律賓也門

董路:中國無緣世界杯不是因為被巴西揍,是因為贏不了菲律賓也門

童叔不飆車
2026-06-13 02:03:34
捷克球迷表態!孫興慜實力水分挺大,跟中國的那個武磊差不太多

捷克球迷表態!孫興慜實力水分挺大,跟中國的那個武磊差不太多

十點體壇
2026-06-12 22:48:15
玩過14位男星!人前玉女,人后“欲女”,47歲至今未婚無人敢娶

玩過14位男星!人前玉女,人后“欲女”,47歲至今未婚無人敢娶

秋姐居
2026-06-13 09:29:15
川普稱達成“偉大的和解協議”,阿爾巴尼亞爆發“火烈鳥革命”

川普稱達成“偉大的和解協議”,阿爾巴尼亞爆發“火烈鳥革命”

西樓飲月
2026-06-12 19:27:15
法拉利凌晨發了一條微博,智界到現在沒敢回

法拉利凌晨發了一條微博,智界到現在沒敢回

西莫的藝術宮殿
2026-06-13 02:49:34
英媒一語驚人:中美貿易戰中,美國唯獨算錯的是中國的底牌!

英媒一語驚人:中美貿易戰中,美國唯獨算錯的是中國的底牌!

流史歲月
2026-06-12 18:30:08
“你兒子長相不對勁!”家長驕傲曬研究生,網友:娶媳婦有點困難

“你兒子長相不對勁!”家長驕傲曬研究生,網友:娶媳婦有點困難

熙熙說教
2026-06-11 18:38:08
穆里尼奧硬剛皇馬高層!原定掃地出門的王牌,被狂人強行續約留隊

穆里尼奧硬剛皇馬高層!原定掃地出門的王牌,被狂人強行續約留隊

奶蓋熊本熊
2026-06-13 04:15:49
A股:股民要做好切換準備,一重要信號出現!下周將迎來新的變盤

A股:股民要做好切換準備,一重要信號出現!下周將迎來新的變盤

虎哥閑聊
2026-06-13 00:00:06
SpaceX上市前,馬斯克半裸充氣人偶現身時代廣場!馬斯克回應來了

SpaceX上市前,馬斯克半裸充氣人偶現身時代廣場!馬斯克回應來了

王爺說圖表
2026-06-12 15:24:39
我們比韓國差在哪?

我們比韓國差在哪?

地圖帝
2026-06-12 22:27:56
全球最深鯨類大墓地被發現:超1000萬頭鯨長眠 最早可追溯到530萬年前

全球最深鯨類大墓地被發現:超1000萬頭鯨長眠 最早可追溯到530萬年前

快科技
2026-06-12 07:57:04
盧秀燕竄訪柏林,叫囂“臺獨”,德國官方冷處理,一個中國不動搖

盧秀燕竄訪柏林,叫囂“臺獨”,德國官方冷處理,一個中國不動搖

井普獨白
2026-06-12 13:16:27
巴基斯坦總統、總理哀悼

巴基斯坦總統、總理哀悼

環球時報國際
2026-06-11 14:35:12
如今來看,馬斯克"安插"在中國的秘密武器,已經見效了!

如今來看,馬斯克"安插"在中國的秘密武器,已經見效了!

無情有思可
2026-06-13 06:07:35
卸下反艦導彈!22型快艇爆改出山,美軍被碾壓,中國下了盤大棋

卸下反艦導彈!22型快艇爆改出山,美軍被碾壓,中國下了盤大棋

李健政觀察
2026-06-12 16:07:05
大博阿滕:我曾經與女友每周纏綿至少七八次,上場后雙腿無力

大博阿滕:我曾經與女友每周纏綿至少七八次,上場后雙腿無力

懂球帝
2026-06-11 10:02:52
13日凌晨WTT挑戰賽:男單4強賽誕生 溫瑞博苦戰5局 林詩棟也被淘汰

13日凌晨WTT挑戰賽:男單4強賽誕生 溫瑞博苦戰5局 林詩棟也被淘汰

林子說事
2026-06-13 03:24:14
“孩子等了一個月的硬菜被你毀了!”家長給娃請假,被嘲自我感動

“孩子等了一個月的硬菜被你毀了!”家長給娃請假,被嘲自我感動

熙熙說教
2026-06-12 19:28:35
2026-06-13 10:40:49
可達鴨面面觀
可達鴨面面觀
不看新聞就頭疼,看了更疼
1682文章數 158421關注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

沈逸:日菲"地圖開疆"耍花招 中方高度敏感明確回應

頭條要聞

沈逸:日菲"地圖開疆"耍花招 中方高度敏感明確回應

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

12年情懷碎一地!跑男接連翻車

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

親子
本地
游戲
家居
公開課

親子要聞

上海六一兒童醫院舉辦fNIRS腦功能成像設備活動,開啟兒童腦科學“可視化”診療新時代

本地新聞

AK劉彰邂逅河北南大港濕地

《瘟疫傳說》廠商稱GTA6如巨獸:全行業改檔避鋒芒

家居要聞

空間微調 移形換境

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版