无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

圖靈獎得主楊立昆給世界模型補上了數學證明

0
分享至


來源:世界醬不會遇到電子羊

考試這件事,我們都經歷過。復習的時候有一種同學,刷了三十套卷子,答案全背下來了,分數比誰都高。但你讓他講一道題,他講不出來。他只記得這道選C,不記得為什么選 C。

在 AI 圈,“背題”有一個更專業的名字:過擬合。

但過擬合只是一個診斷,不是一個回答。真正的問題是:你怎么判斷一個 AI 是真的理解了世界,還是在背題?這個問題在 AI 領域有一個更專業的說法,叫“線性可識別性”。說白了就是,AI 的內部表示和真實世界的物理變量之間,是不是一個簡單的一一對應關系。如果是,說明它真的學到了;如果不是,那就是把所有東西攪在一起湊出了正確答案。

楊立昆花了四年時間回答這個問題。

楊立昆是誰就不用多介紹了。圖靈獎得主,Meta前首席 AI 科學家,卷積神經網絡的奠基人之一。過去幾年里,他一直走在一條和主流 AI 路線截然相反的路上。當全行業都在堆大語言模型、寄望于 Scaling Law 大力出奇跡的時候,他反復說同一句話:這條路走不通。他說大語言模型永遠不可能成為世界模型,因為它們只是在文字里統計規律,不是在世界里學習規律。

為此他和很多人吵過架。和 Hinton 吵,和 Sam Altman 吵,和 Demis Hassabis 吵,幾乎和 AI 圈的頂流們吵了一個遍。2025 年底他離開 Meta,一度讓人覺得這是一個孤獨的理想主義者被現實驅逐的故事。

然后 2026 年 5 月 25 日,他和兩位合作者在arXiv 上發了一篇論文,題目叫《When Does LeJEPA Learn a World Model?》翻譯過來就是:LeJEPA 這套東西,到底什么時候才算是真的理解了世界?

楊立昆給出的答案是:當世界的底層變量服從高斯分布的時候。而且高斯是唯一能做到的分布。

LeJEPA 我們之前聊過。它是 JEPA 的一個具體實現,加了一個叫做SIGReg 的正則項。JEPA 的核心想法聽起來有點反直覺:不是預測像素而是預測“表示”。什么意思呢?傳統的 AI 模型學東西經常試圖在像素層面復現世界。比如給它看一段視頻的開頭,讓它把后面的每一幀都畫出來。楊立昆說這樣太浪費了,你把計算力都花在畫云朵的紋理和地面的反光上了,而這些跟世界的物理規律沒什么關系。JEPA 改了一個思路:不是畫像素而是在模型內部想象。先讓模型把看到的畫面壓縮成一個緊湊的內部表示,然后在這個表示空間里預測未來狀態。

但這里一直有個懸而未決的問題:你怎么知道模型學到的東西,到底對不對?它內部的“想象”是真的反映了世界的物理結構,還是只是另一種形式的自我欺騙?一個模型在訓練集上表現優秀,不代表它真正理解世界,因為它可能只是把圖像的紋理、光照、背景這些無關信息混在一起,恰好拼湊出了正確答案。一旦場景發生變化,這套表示就完全失效。

楊立昆這篇論文干的事,就是給這個問題一個嚴格的數學答案。

首先,他把學會了定義為“線性可識別性”。意思是,如果學到的東西和真實世界的潛變量之間,只差一個旋轉,就算模型真的學會了。

這段可能不好理解,讓我們來打個比方:假如你從樓上往下看,有個人在遮陽傘下,燈光在地面上打出他的影子。但人被遮陽傘擋住了,所以你不能直接看到他。在這種情況下,你能判斷這個人此時是坐著還是站著、手放在哪,但你沒法判斷他面朝東還是面朝南。所以在這套體系里,旋轉是唯一允許的誤差,因為從信息論的角度講,沒有額外的參照系,你本來就不可能確定絕對方向。

讓我們回到論文,楊立昆在線性可識別性的基礎上證明了,只要真實世界的底層變量服從高斯分布,那么世界模型學到的東西和真實世界的潛變量之間就只差一個旋轉。

到這里,這篇論文最漂亮的部分出現了。

在數學上,高斯分布下的任何函數,都可以按復雜度拆成許多層,直線是一層,輕微彎曲是一層,劇烈彎曲又是一層,可以無限往下拆。這個拆分工具叫 Hermite 多項式。

它有一個關鍵性質:越復雜的層,在同一個東西的兩次觀測之間,相關性就越低。就像一張桌子的基本輪廓,從正面拍和從側面拍大差不差;但桌面上那一小塊反光,你稍微動一下角度,它就沒了。

而 LeJEPA 訓練的核心目標,恰恰是最大化兩次觀測之間的相關性。兩邊一合力,結果非常干凈:所有復雜的、彎曲的、高層的成分,在訓練中被自動淘汰。剩下的只有最底層的那個簡單的線性映射。

非線性成分在這個過程中就被自然地蒸發掉了。

論文接下來用一個叫Sturm-Liouville 理論的經典數學框架,證明了要讓這件事成立,潛變量的分布必須滿足一個非常嚴格的條件——它的對數密度的導數必須是線性的。在所有分布里,只有高斯滿足這個條件。換成 Laplace 分布、均勻分布、或者任何其他形狀的分布,線性可識別性都無法保證。

實驗也驗證了這一點:在廣義正態分布族里掃描形狀參數,線性恢復的 R2在恰好是高斯分布的時候會出現尖銳的峰值,偏離一點就迅速掉下去。

換句話說,楊立昆用數學證明了,如果想讓世界模型真能學到東西,世界本身就得是高斯的。

到這里你可能想問一個特別實在的問題:這個數學證明對做機器人有什么用?

我們知道,世界模型在訓練的時候要做兩件事:第一件是“對齊”,也就是把同一個東西的兩次觀測(比如一段視頻的連續兩幀、一張圖片的兩種裁剪方式)在內部表示里拉近;第二件是防止模型作弊直接把所有表示都變成一模一樣的常數。LeJEPA 用 SIGReg 來做第二件事:強制模型的內部表示服從各向同性高斯分布。做完這一步,模型就不能偷懶了,它必須真的學到點什么。

論文里有一個實驗叫 DMC Reacher:讓一個有兩個關節的機械臂,從起始姿態運動到目標姿態。實驗分兩組。第一組用隨機探索的方式生成訓練數據,潛變量的分布滿足高斯假設;第二組直接用強化學習策略跑出來的真實軌跡做訓練數據,這時候因為策略本身是有目標導向的,潛變量的分布集中在狀態空間的某個低熵區域,不再滿足高斯假設。

結果第一組訓練出來的模型,在內部表示空間里做直線插值規劃,得到的關節運動軌跡和已知真實狀態下的理想軌跡,在統計上沒有差異。也就是說,模型在腦子里想的規劃,等于在真實世界里求解最優控制。第二組呢?同樣的規劃方法,偏差顯著上升,控制代價高了一大截。

同一套物理系統,同一套算法,唯一的不同是訓練數據的分布。

打個比方,這就很像去認識一個沒見過的人,看她的證件照遠沒有看她的生活照來得直接有效。

所以,數據不光要多,更重要的是數據的分布場景要豐富,角度、背景、光照……這些幾乎和數據本身同樣重要。分布豐富了,模型就能學到真實結構;分布太少,再多數據也只是更高精度的背題。

至此,楊立昆的這篇論文補上了世界模型最關鍵的一塊理論拼圖。它不是一個新的 benchmark 記錄,不是一個更大的模型參數,而是一個為什么的答案。

論文里有一句話,楊立昆是這么寫的:“Our theory turns an empirically successful recipe into a mathematical guarantee——我們把一個經驗上成功的方法,變成了一項數學證明?!?/p>

從經驗到證明,這可能就是世界模型從技術信仰變成科學必然的時刻。

閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”


未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

(加入未來知識庫,全部資料免費閱讀和下載)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中足聯官宣重磅罰單!52歲于根偉禁賽5場罰5萬 辱罵+率隊圍堵裁判

中足聯官宣重磅罰單!52歲于根偉禁賽5場罰5萬 辱罵+率隊圍堵裁判

我愛英超
2026-07-02 22:05:30
早上7點 世界杯14億大戰!C羅深陷20年魔咒 必有1巨星出局

早上7點 世界杯14億大戰!C羅深陷20年魔咒 必有1巨星出局

葉青足球世界
2026-07-02 17:12:02
一路走好!1天時間4位名人被曝去世,最大78歲,最小才30歲

一路走好!1天時間4位名人被曝去世,最大78歲,最小才30歲

借你一生
2026-07-02 10:26:03
成田機場的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國”

成田機場的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國”

東京在線
2026-07-02 16:57:07
里子面子都丟了!管不住下半身的任素汐,一場演唱會撕下她的體面

里子面子都丟了!管不住下半身的任素汐,一場演唱會撕下她的體面

往史過眼云煙
2026-07-02 09:55:26
首都保衛戰打響后,普京發表全國講話,俄羅斯對美西方發出通牒

首都保衛戰打響后,普京發表全國講話,俄羅斯對美西方發出通牒

策前論
2026-07-02 17:21:49
“一個月600塊你要餓死他?”大學男生吃飯被偷拍,看的人心疼!

“一個月600塊你要餓死他?”大學男生吃飯被偷拍,看的人心疼!

林林先生
2026-07-01 12:30:03
從699分到愛心接力:少年向上 社會向善丨中聽

從699分到愛心接力:少年向上 社會向善丨中聽

大象新聞
2026-07-01 16:30:12
六代機,就這么明晃晃的官宣了!

六代機,就這么明晃晃的官宣了!

新動察
2026-07-02 08:25:58
韓紅一句“走個面兒”引全網聲討,這屆觀眾不伺候了

韓紅一句“走個面兒”引全網聲討,這屆觀眾不伺候了

可達鴨面面觀
2026-07-02 19:44:03
曝38歲德國主帥下課 足協開會3小時要求他辭職 愿付700萬歐補償金

曝38歲德國主帥下課 足協開會3小時要求他辭職 愿付700萬歐補償金

我愛英超
2026-07-02 21:40:07
80%變0!里奇·保羅曝光詹姆斯離湖心路

80%變0!里奇·保羅曝光詹姆斯離湖心路

籃壇第一線
2026-07-02 00:47:17
地鐵吐血女孩半月內多次收到病危通知單,當事人:自己的生命已經進入倒計時,但還是希望能夠有人關注到自己手里仍在運行的公益項目

地鐵吐血女孩半月內多次收到病危通知單,當事人:自己的生命已經進入倒計時,但還是希望能夠有人關注到自己手里仍在運行的公益項目

瀟湘晨報
2026-07-02 16:32:20
賈玲直言自己又活過來了,大方承認體重反彈了,坦言不再逼自己極端自律,活得太通透了

賈玲直言自己又活過來了,大方承認體重反彈了,坦言不再逼自己極端自律,活得太通透了

背包旅行
2026-07-02 11:45:23
西安賽格墜樓熱搜刷屏:我看到謀生的嚴總,走上絕路時的無助

西安賽格墜樓熱搜刷屏:我看到謀生的嚴總,走上絕路時的無助

李晚書
2026-07-02 18:44:26
故意剝奪伊朗隊勝利!伊朗裔美國專家起訴國際足聯,索賠10億美元

故意剝奪伊朗隊勝利!伊朗裔美國專家起訴國際足聯,索賠10億美元

全景體育V
2026-07-02 21:38:20
成都一女子不洗手抱孫子,兒媳怒斥不衛生,兒子一拳打面中,母親揚言要兒子坐牢,兒子卻說:她活該!6年后現狀曝光...

成都一女子不洗手抱孫子,兒媳怒斥不衛生,兒子一拳打面中,母親揚言要兒子坐牢,兒子卻說:她活該!6年后現狀曝光...

背包旅行
2026-07-02 14:33:11
中國臺灣演員陳昊森承認與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

中國臺灣演員陳昊森承認與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

極目新聞
2026-07-02 22:47:55
加息,突變!美國重磅數據出爐!美股、黃金、比特幣全線拉升

加息,突變!美國重磅數據出爐!美股、黃金、比特幣全線拉升

證券時報
2026-07-02 21:53:03
扎哈羅娃:馮德萊恩是個“出色的騙子”

扎哈羅娃:馮德萊恩是個“出色的騙子”

參考消息
2026-07-02 14:14:08
2026-07-03 02:28:49
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4864文章數 37483關注度
往期回顧 全部

科技要聞

馬斯克不承認,但SpaceX就該造AI手機

頭條要聞

商戶在西安賽格商場墜亡 好友:他曾變賣門店發工資

頭條要聞

商戶在西安賽格商場墜亡 好友:他曾變賣門店發工資

體育要聞

韓國人,為什么恨透了洪明甫?

娛樂要聞

眾星祝福祖國,曾沛慈原形畢露?

財經要聞

千億茶市場無贏家:瀾滄巨虧 八馬停"蹄"

汽車要聞

有純電有增程 還有二代VLA支持 小鵬MONA L03預售價14.38萬起

態度原創

房產
親子
健康
數碼
公開課

房產要聞

稀缺預警!海岸線200米+限墅令下,海南「絕版硬通貨」來了!

親子要聞

從新生兒到學齡期全覆蓋:兒童被子成長型選型的策略與實用方法

這4類消化病患者 吃粘食管住嘴

數碼要聞

卓威同步發布XQ2766X顯示器:27" QHD 360Hz TN

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版