文/勁草
來源/萬點研究
![]()
近日,圖靈獎得主、深度學習“三巨頭”之一、曾長期擔任Meta AI首席科學家的楊立昆(Yann LeCun)博士,在Welch Labs訪談中再次直言:當前大語言模型和生成式AI,難以通往真正的AGI(通用人工智能)。
楊博士不是首次這樣陳述自己的觀點,早在2022年提出JEPA等世界模型相關思路時,他就強調AI需要構建對物理世界的內部模擬規劃和因果理解、而非單純依賴語言預測。后續在多個訪談、演講和社交媒體中,針對大模型的批評變得更加鮮明和公開。所以,LeCun的觀點不是在GPT徹底火爆后的“臨時轉向”,而是建立在他長期對AI智能、世界模型和AGI實現路徑的深入研究基礎上的。
在筆者看來,這并非否定大模型的巨大價值,而是對技術路徑的清醒校準。大模型在語言理解、代碼生成、內容創作等領域已展現超凡生產力,極大降低了個人與企業的門檻。但其本質是“下一個token預測”的統計機器,擅長模式匹配,卻缺乏對物理世界因果關系、時空連續性和長期規劃的深刻建模。這正是為什么它們在聊天和寫作上得心應手,卻難以直接驅動需要真實交互的具身智能系統——機器人自主行動、高階自動駕駛或復雜工業場景。LeCun的判斷,體現了頂級科學家的戰略視野:我們不能被短期繁榮蒙蔽雙眼,必須為下一范式布局。
如上所言,楊立昆的解決方案指向明確:轉向世界模型(World Model)。這不是簡單升級,而是AI從“會說話”向“懂世界、會行動”的根本躍遷。世界模型的可預測、可模擬、可規劃的“內心模擬器”特征,能夠讓AI像人類一樣通過觀察、預測多步后果并決策,而這種能力正是通往AGI的關鍵橋梁。
世界模型幫助AI認知“物理世界”
世界模型擅長理解物理規律、時空動態和因果關系,強調預測未來狀態。比如“假使我這樣做,世界會怎樣變化”,在腦中模擬多種行動序列,選擇最佳路徑,實現目標。更重要的是世界模型的反事實推理能力,比如“如果當時不這么做,會發生什么”。
而人類智能的根基也正是這種“世界模型”。嬰兒通過感官互動逐步構建對重力、物體持久性和社會規則的理解,進而發展高級認知。
從這一點推敲,AI若要實現通用智能,這一課必須補上。
很長一段時間內,AI發展注重處理符號,比如文字、數字、圖像、語音等,而世界模型更加關注“具身 grounding”的回歸,這也提示當前LLM的局限性已日益顯現——它們在封閉環境中表現亮眼,但在開放物理世界中易出現“幻覺”或不可預測行為。
而世界模型通過視頻、傳感器等多模態數據訓練,能習得更穩健的物理一致性,這對機器人、自動駕駛等落地場景至關重要,高階自動駕駛實現真正零事故、機器人全面進入工廠與家庭、醫療AI從輔助診斷走向自主干預。
想象一下:工廠內智能機器人自主規劃復雜裝配,城市中Robotaxi無縫應對突發路況,家庭機器人理解人類意圖并安全協作,這些場景不再是科幻,而是世界模型成熟后的必然結果。
簡單總結,LLMs像一個博學的“聊天高手”,但出門就迷路;世界模型像一個有“內心地圖”和“預演能力”的探險家,能真正行動并生存。
我們有理由相信,世界模型推動AI發展范式轉變而帶來的商業前景,將極為廣闊。正如馬斯克關于“AI與機器人滿足人類一切欲望”的預言,因世界模型而變得可及。
而資本市場與產業界的行動投票也證明這一點:李飛飛World Labs和楊立昆AMI Labs均獲超10億美元融資,NVIDIA、Tesla深度布局,國內車企加速跟進,資本市場已將世界模型視為后LLM時代主賽道。
和而不同:生成派VS表征派
落地到實踐層面看,當前世界模型領域呈現鮮明的技術流派競爭,以李飛飛和楊立昆為代表的兩大路線尤為矚目。
AI教母李飛飛博士創立的World Labs走生成路線,首個商用產品Marble能從一句話、一張圖或視頻生成高保真、可漫游、可編輯的3D世界。這些世界具備真實幾何結構、物理屬性,支持交互編輯和大規模構建。而Marble強調的空間智能與物理一致性,特別適合內容創作、虛擬生產、游戲開發和可視化模擬。騰訊混元、阿里等國內項目也聚焦類似方向,在前端可視化和資產生成上展現潛力。
商業化落地快的特征,使得生成路線在娛樂和設計領域更快看到明確的變現路徑,這說明生成路線直擊“創造世界”的痛點,極大降低了3D內容門檻,但長程規劃有時仍需后處理優化的弊端也十分明顯。
另一方面,楊立昆創立的AMI Labs則強調表征路線。不同于Marble的空間生成,基于JEPA架構理念的技術路線不追求像素生成,更強調在潛在空間學習抽象表示,如同人類的心智模型,擅長直覺預測,如同人看到玻璃杯即將傾倒,會預測水撒出甚至摔地破碎,應該及時決策扶住并阻止等。
很明顯,表征路線更接近人類“腦中模擬”的本質,尤其適合機器人規劃、智能駕駛等場景。
汽車成為世界模型產業實踐的熱土
事實上,汽車行業是世界模型落地最快的領域。
如Tesla Neural World Simulator利用海量數據實現高效閉環,國內蔚來NWM世界模型早在2024年推出,能全量理解信息、生成新場景、預測軌跡,在主動安全、領航、泊車等場景升級,支持人機共駕。
在剛剛閉幕的2026北京車展上,物理AI、世界模型成為全場關鍵詞,也是更加貼切的產業印證。
展會上,小鵬以“物理AI科技公司”身份亮相,展出IRON人形機器人和Robotaxi原型車,宣布投入70億元研發物理AI;吉利發布原生Robotaxi Eva Cab,搭載WAM世界動作模型,支持L4級無人運營;輕舟智航推出基于“世界模型+強化學習”的乘風MAX方案,算力超500TOPS,實現城市NOA;華為ADS 5.0引入多智能體+云端世界模型;Momenta R7強化學習世界模型等也在多款車型落地。人形機器人布局火熱,小鵬、理想、小米、奇瑞等均有實質進展......
從新勢力到傳統車企,從整車到供應鏈,幾乎人人都在談如何讓AI進入物理世界,而世界模型作為物理AI的“大腦”核心,重要性不言而喻。單純依賴LLM已不足以應對物理世界的復雜性,世界模型+強化學習成為從感知到決策閉環的關鍵。
這一共識的形成遠早于眾人預期,反映出車企在智能化下半場的戰略敏銳度。供應鏈話語權提升,寧德時代、地平線等與整車同臺,也預示產業生態重構。車展上的密集落地,也為全球提供了中國樣本——數據優勢、工程能力與資本結合,正加速技術從實驗室走向量產,同時也說明世界模型是克服LLM局限的必由之路。
產業界的觀點是,2026或將是世界模型大爆發的元年,世界模型的成熟周期將快于預期。
盡管世界模型的發展面臨物理一致性、長程規劃、數據安全等挑戰,但合成數據技術、強化學習閉環和多方協同正快速破局。值得一提的是,NVIDIA Cosmos平臺在基礎設施層面發揮關鍵作用,其Predict、Transfer、Reason等模型家族生成定制合成數據,大幅降低真實數據采集成本,支持物理一致性訓練,已成為機器人和自動駕駛的訓練底座。NVIDIA的平臺策略著實聰明,將基礎設施開放與生態綁定,加速全行業進步。
世界模型不再是營銷口號,而是定義下一代競爭力的核心,而真正的智能始于世界而非語言這一理念正被越來越多的實踐驗證。
本文由萬點原創,如需轉載、商務合作
請私信或加V溝通:微信號zzdmw5728
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.