網易首頁 > 網易號 > 正文申請入駐

實現AGI，我們必須補上世界模型這一課！

2026-05-08 09:03:30　來源: 萬點研究

上海舉報

分享至

文/勁草

來源/萬點研究

近日，圖靈獎得主、深度學習“三巨頭”之一、曾長期擔任Meta AI首席科學家的楊立昆（Yann LeCun）博士，在Welch Labs訪談中再次直言：當前大語言模型和生成式AI，難以通往真正的AGI（通用人工智能）。

楊博士不是首次這樣陳述自己的觀點，早在2022年提出JEPA等世界模型相關思路時，他就強調AI需要構建對物理世界的內部模擬規劃和因果理解、而非單純依賴語言預測。后續在多個訪談、演講和社交媒體中，針對大模型的批評變得更加鮮明和公開。所以，LeCun的觀點不是在GPT徹底火爆后的“臨時轉向”，而是建立在他長期對AI智能、世界模型和AGI實現路徑的深入研究基礎上的。

在筆者看來，這并非否定大模型的巨大價值，而是對技術路徑的清醒校準。大模型在語言理解、代碼生成、內容創作等領域已展現超凡生產力，極大降低了個人與企業的門檻。但其本質是“下一個token預測”的統計機器，擅長模式匹配，卻缺乏對物理世界因果關系、時空連續性和長期規劃的深刻建模。這正是為什么它們在聊天和寫作上得心應手，卻難以直接驅動需要真實交互的具身智能系統——機器人自主行動、高階自動駕駛或復雜工業場景。LeCun的判斷，體現了頂級科學家的戰略視野：我們不能被短期繁榮蒙蔽雙眼，必須為下一范式布局。

如上所言，楊立昆的解決方案指向明確：轉向世界模型（World Model）。這不是簡單升級，而是AI從“會說話”向“懂世界、會行動”的根本躍遷。世界模型的可預測、可模擬、可規劃的“內心模擬器”特征，能夠讓AI像人類一樣通過觀察、預測多步后果并決策，而這種能力正是通往AGI的關鍵橋梁。

世界模型幫助AI認知“物理世界”

世界模型擅長理解物理規律、時空動態和因果關系，強調預測未來狀態。比如“假使我這樣做，世界會怎樣變化”，在腦中模擬多種行動序列，選擇最佳路徑，實現目標。更重要的是世界模型的反事實推理能力，比如“如果當時不這么做，會發生什么”。

而人類智能的根基也正是這種“世界模型”。嬰兒通過感官互動逐步構建對重力、物體持久性和社會規則的理解，進而發展高級認知。

從這一點推敲，AI若要實現通用智能，這一課必須補上。

很長一段時間內，AI發展注重處理符號，比如文字、數字、圖像、語音等，而世界模型更加關注“具身 grounding”的回歸，這也提示當前LLM的局限性已日益顯現——它們在封閉環境中表現亮眼，但在開放物理世界中易出現“幻覺”或不可預測行為。

而世界模型通過視頻、傳感器等多模態數據訓練，能習得更穩健的物理一致性，這對機器人、自動駕駛等落地場景至關重要，高階自動駕駛實現真正零事故、機器人全面進入工廠與家庭、醫療AI從輔助診斷走向自主干預。

想象一下：工廠內智能機器人自主規劃復雜裝配，城市中Robotaxi無縫應對突發路況，家庭機器人理解人類意圖并安全協作，這些場景不再是科幻，而是世界模型成熟后的必然結果。

簡單總結，LLMs像一個博學的“聊天高手”，但出門就迷路；世界模型像一個有“內心地圖”和“預演能力”的探險家，能真正行動并生存。

我們有理由相信，世界模型推動AI發展范式轉變而帶來的商業前景，將極為廣闊。正如馬斯克關于“AI與機器人滿足人類一切欲望”的預言，因世界模型而變得可及。

而資本市場與產業界的行動投票也證明這一點：李飛飛World Labs和楊立昆AMI Labs均獲超10億美元融資，NVIDIA、Tesla深度布局，國內車企加速跟進，資本市場已將世界模型視為后LLM時代主賽道。

和而不同：生成派VS表征派

落地到實踐層面看，當前世界模型領域呈現鮮明的技術流派競爭，以李飛飛和楊立昆為代表的兩大路線尤為矚目。

AI教母李飛飛博士創立的World Labs走生成路線，首個商用產品Marble能從一句話、一張圖或視頻生成高保真、可漫游、可編輯的3D世界。這些世界具備真實幾何結構、物理屬性，支持交互編輯和大規模構建。而Marble強調的空間智能與物理一致性，特別適合內容創作、虛擬生產、游戲開發和可視化模擬。騰訊混元、阿里等國內項目也聚焦類似方向，在前端可視化和資產生成上展現潛力。

商業化落地快的特征，使得生成路線在娛樂和設計領域更快看到明確的變現路徑，這說明生成路線直擊“創造世界”的痛點，極大降低了3D內容門檻，但長程規劃有時仍需后處理優化的弊端也十分明顯。

另一方面，楊立昆創立的AMI Labs則強調表征路線。不同于Marble的空間生成，基于JEPA架構理念的技術路線不追求像素生成，更強調在潛在空間學習抽象表示，如同人類的心智模型，擅長直覺預測，如同人看到玻璃杯即將傾倒，會預測水撒出甚至摔地破碎，應該及時決策扶住并阻止等。

很明顯，表征路線更接近人類“腦中模擬”的本質，尤其適合機器人規劃、智能駕駛等場景。

汽車成為世界模型產業實踐的熱土

事實上，汽車行業是世界模型落地最快的領域。

如Tesla Neural World Simulator利用海量數據實現高效閉環，國內蔚來NWM世界模型早在2024年推出，能全量理解信息、生成新場景、預測軌跡，在主動安全、領航、泊車等場景升級，支持人機共駕。

在剛剛閉幕的2026北京車展上，物理AI、世界模型成為全場關鍵詞，也是更加貼切的產業印證。

展會上，小鵬以“物理AI科技公司”身份亮相，展出IRON人形機器人和Robotaxi原型車，宣布投入70億元研發物理AI；吉利發布原生Robotaxi Eva Cab，搭載WAM世界動作模型，支持L4級無人運營；輕舟智航推出基于“世界模型+強化學習”的乘風MAX方案，算力超500TOPS，實現城市NOA；華為ADS 5.0引入多智能體+云端世界模型；Momenta R7強化學習世界模型等也在多款車型落地。人形機器人布局火熱，小鵬、理想、小米、奇瑞等均有實質進展......

從新勢力到傳統車企，從整車到供應鏈，幾乎人人都在談如何讓AI進入物理世界，而世界模型作為物理AI的“大腦”核心，重要性不言而喻。單純依賴LLM已不足以應對物理世界的復雜性，世界模型+強化學習成為從感知到決策閉環的關鍵。

這一共識的形成遠早于眾人預期，反映出車企在智能化下半場的戰略敏銳度。供應鏈話語權提升，寧德時代、地平線等與整車同臺，也預示產業生態重構。車展上的密集落地，也為全球提供了中國樣本——數據優勢、工程能力與資本結合，正加速技術從實驗室走向量產，同時也說明世界模型是克服LLM局限的必由之路。

產業界的觀點是，2026或將是世界模型大爆發的元年，世界模型的成熟周期將快于預期。

盡管世界模型的發展面臨物理一致性、長程規劃、數據安全等挑戰，但合成數據技術、強化學習閉環和多方協同正快速破局。值得一提的是，NVIDIA Cosmos平臺在基礎設施層面發揮關鍵作用，其Predict、Transfer、Reason等模型家族生成定制合成數據，大幅降低真實數據采集成本，支持物理一致性訓練，已成為機器人和自動駕駛的訓練底座。NVIDIA的平臺策略著實聰明，將基礎設施開放與生態綁定，加速全行業進步。

世界模型不再是營銷口號，而是定義下一代競爭力的核心，而真正的智能始于世界而非語言這一理念正被越來越多的實踐驗證。

本文由萬點原創，如需轉載、商務合作

請私信或加V溝通：微信號zzdmw5728

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.