網易首頁 > 網易號 > 正文 申請入駐

大語言模型無法通往AGI,空間智能才是最優路徑

0
分享至



作者|林易

編輯|重點君

2月4日,在思科(Cisco)AI峰會上,李飛飛以World Labs創始人的身份,披露了公司首款空間智能產品Marble的技術細節 。

作為這一輪生成式AI浪潮的核心奠基者之一,李飛飛并未盲目追逐大語言模型的熱潮。相反,她再次拋出了一個鮮明的反共識觀點:單純的大語言模型無法通往AGI。

在李飛飛看來,語言在生物進化史上只是最近50萬年的產物,而視覺與觸覺所代表的空間智能,早在5億年前的寒武紀就開啟了神經系統的演化競賽。如果AI無法理解三維物理世界、無法具備物理直覺,它就只能被永遠困在數字的像素中。

帶著這樣的判斷,李飛飛創辦的World Labs試圖走通一條不同于OpenAI的路徑:通過構建具有物理一致性的世界模型,為AI補上感知的短板。

我們梳理了這場訪談的核心信息,以下是重點內容:

1. AGI路線之爭:語言并不是智能的全部,甚至不是智能的基石。

李飛飛用生物進化的宏觀視角重新審視了AI的發展路徑:語言在人類進化史上只有約50萬年的歷史,是極其晚近的產物。相比之下,視覺、觸覺等感知能力早在5億年前的寒武紀就開啟了演化競賽。

結論是:如果AI只有語言能力,它將被永遠困在數字世界中。只有補齊了比語言更古老、更基礎的空間智能,讓機器擁有理解、推理并與三維物理世界互動的能力,AI才能真正通往AGI。

2. 重新定義世界模型:物理一致性(Physical Consistency)是關鍵。

李飛飛介紹,作為一個前沿空間智能模型,Marble能接收多模態輸入,無論是句子、圖片、視頻還是簡單的3D輸入,并將這些提示詞轉化為一個完全可導航、可交互且具有永久一致性的3D世界。

與Sora等強調視覺效果的視頻模型不同,Marble生成的環境具有幾何結構(Geometric Structure)和物理一致性。這意味著生成的不僅僅是一段像素動畫,而是一個擁有物理屬性的虛擬空間,用戶可以在其中自由漫游。

Marble目前已被用于游戲開發、影視特效(VFX)、機器人訓練、室內設計等領域,臨床研究人員將Marble用于治療強迫癥,通過生成特定的觸發環境(如臟亂的洗衣房)來對患者使用暴露療法。

3. 隨著合成數據技術的成熟,世界模型即將迎來類似LLM的Scaling Law爆發時刻。

為什么物理世界的AI 發展比語言模型慢?核心瓶頸在于數據的信噪比。文本數據是清晰、語義明確的,而物理世界的像素(Pixels)和體素(Voxels)充滿了噪音,且難以大規模獲取 。

為了解決這一難題,World Labs采取了一種混合數據策略(Hybrid Data Strategy):利用互聯網現有的文本、圖像、視頻數據;結合仿真模擬數據(Synthetic Data);加上真實世界采集的數據。

李飛飛預判,隨著合成數據技術的成熟,世界模型領域即將迎來類似LLM的Scaling Law爆發時刻。

4. 通用機器人才是AI技術的皇冠,因為自動駕駛與通用機器人的邏輯完全相反。

大眾往往認為自動駕駛是AI技術的皇冠,但在李飛飛看來,通用機器人的維度要高得多。

自動駕駛是2D 邏輯:汽車本質上是一個在二維平面移動的方塊,它的核心任務是避障,只要不碰到東西就是勝利。

通用機器人則是3D 邏輯:機器人的核心任務恰恰相反,是接觸,它必須在三維空間中,以不破壞物體的方式進行精確操作。

5.AI技術的終局是成為新的電力,成為賦能文明的基礎設施。

面對當前關于AI毀滅人類或技術烏托邦的極化爭論,李飛飛表現出了科學家的審慎與人文關懷。

她將AI比作一百多年前的電力。電力的成功,不是因為建立了龐大的電網,而是因為它點亮了學校的燈、驅動了工廠的機器、延長了人類的壽命。同理,AI的成功不在于模型參數有多大,而在于它能否像電力一樣,成為一種賦能文明的基礎設施,讓每一個體獲得尊嚴與幸福 。

李飛飛在訪談結束時透露,World Labs的目標是讓空間智能技術真正進入醫療健康、農業制造等各個垂直行業。希望在2026年,我們能看到擁有了空間智能的AI,真正走出屏幕,與物理世界產生美妙的交互。



以下為李飛飛訪談實錄:

1、空間智能是AI的下一個前沿領域

主持人:很高興能親眼見證World Labs在過去一年中所取得的進展。讓我們先來聊聊你們正在做的事情,以及它為何如此重要。

李飛飛:現在我每天醒來腦子里只思考一件事,那就是空間智能(spatial intelligence)。大約兩年前,我與一群年輕的技術專家共同創立了World Labs。為什么空間智能如此重要?我認為它是AI的下一個前沿領域。如果從進化的角度看待智能發展,這段歷史可以追溯到5億多年前。最先開啟神經系統演化競賽的是感知而非語言。相比之下,語言是一種非常新穎的智能形式,歷史大概只有50萬年。但在15億年前,動物就開始感知光線并觸摸環境,從而產生了觸覺、視覺、本能和知覺。

“本能”這個詞雖然有些模糊,但不可否認的是,正是通過觸覺和視覺與物理世界進行身體接觸,才開啟了神經系統的發育,引發了動物進化的軍備競賽。這使得生物在與環境交互中變得越來越活躍,也越來越智能。我想表達的是,在真實的3D、4D物理世界中進行理解、推理、交互和導航的能力是基礎性的,與語言智能同樣重要。這一核心關鍵技術就是空間智能。這就是為什么我認為它是AI的下一代前沿領域,也是World Labs一直致力于構建的目標。

主持人:請跟我們聊聊Marble,這是你們最近剛剛發布的產品。究竟什么是Marble?

李飛飛:Marble是我們第一代空間智能模型。雖然我們常隨口稱其為世界模型(world model),但鑒于目前關于世界模型的定義繁多,稱謂其實并不重要。本質上,這是一個前沿的空間智能模型。Marble能接收多模態輸入,無論是句子、圖片、視頻還是簡單的3D輸入,并將這些提示詞轉化為一個完全可導航、可交互且具有永久一致性的3D世界。這與大家現在看到的視頻模型截然不同,Marble生成的環境擁有幾何結構,支持模擬機器人動作或編寫游戲代碼等操作。

李飛飛:我們大約兩個月前發布了Marble。雖然它仍處于起步階段,是第一代產品,但作為最先進的3D生成式世界模型,我們對開啟這段旅程感到非常激動。

主持人:有一種觀點認為,如果僅僅依賴語言模型,我們將無法實現AGI,必須對自身的物理性進行某種增強。您顯然深信這一點。那么請談談這個維度,隨著時間推移,未來五年最重要的突破點會是什么?除了機器人技術這個顯而易見的用例,還有哪些我們今天無法想象的應用?

李飛飛:其實不需要等五年,我們的用戶和客戶已經開始嘗試早期版本的模型了。我們看到用戶利用它開發游戲;視覺特效(VFX)客戶將其用于商業化的虛擬制作場景;包括Nvidia在內的大公司、初創企業及學術實驗室等合作伙伴,正在利用Marble作為訓練環境來訓練機器人;建筑師和設計師則用它進行室內設計

我們還發現了一些意想不到的用例。例如,臨床研究人員對Marble表現出了極大的熱情。大量的精神病學和心理健康研究及干預手段都需要沉浸式環境,且需針對特定情況進行個性化定制。以強迫癥(OCD)為例,患者會被非常具體的場景觸發,比如我個人會被堆積的臟衣服困擾,但每個人的觸發點各不相同。研究人員發現搭建實體環境非常困難,而Marble只需輸入提示詞,幾分鐘內就能生成各種不同類型的環境。

此外,還有人將其用于健身訓練,比如個性化的瑜伽環境。隨著Marble不斷完善,畢竟我們現在還處于早期階段,我相信未來會看到越來越多橫向的應用場景。

2、AI的社會價值

主持人:你進入AI行業已經很長時間了。

李飛飛:這是在委婉地討論我的年齡。

主持人:不,我的意思是,你不僅僅是那種跟風研究了三年的人,而是將畢生精力都奉獻給了AI。當你創立這家公司并著手構建空間智能時,最讓你感到驚訝的是什么?

李飛飛:這個問題問得很好。正如我們討論過的,即便到了我們這個年紀,保持求知欲和學習能力依然是最重要的事情。我投身AI領域已經很多年了,最初是因為強烈的好奇心,我想探索什么是智能以及如何讓機器變得智能。當時AI還是一個無人問津的冷門領域,大家甚至不知道怎么拼寫AI,那段時光非常有趣。但過去十年發生了翻天覆地的變化,AI對我而言不再僅僅是個人層面的追求,它已經上升到了文明層面。這讓我作為教育者和企業家多了一層責任感,不僅要在技術上做出貢獻,還要推動其健康發展。

作為企業家,最讓我驚訝的有幾點。首先是過去幾年AI的發展速度令人屏息。無論我們外表如何淡定,內心深處都難免焦慮,因為有太多的論文要讀、太多的博客、新聞和模型發布。這種焦慮感正是我們這個時代的寫照,技術正以驚人的速度推動我們前進。這讓我既興奮又清醒,正如蘇格拉底所言“我一無所知”,我希望大家不要放棄學習,保持好奇心。

另一點讓我驚訝甚至擔憂的是關于AI的極化言論。網絡上的討論往往是非黑即白的:要么是完全的技術烏托邦主義,忽略了技術是一把雙刃劍;要么就是末日論調,仿佛人類時刻面臨生存危機。對于一項對人類文明如此深遠的技術,這種討論方式是不負責任的。主動權掌握在每一位企業家、產品經理、工程師和公民手中,我們需要具備能動性來引導技術的發展。我真心希望在邁向2026年及未來的過程中,我們能更客觀、細膩且心懷仁慈地看待AI,既保持樂觀,又肩負起責任,而不是為了博取眼球去發表極端言論。

主持人:在你心中,未來幾年AI取得什么樣的成果才算成功?我很喜歡你提到的這種兩極分化的觀點,要么工作全部消失盯著大海發呆,要么技術完全沒用。

李飛飛:如果我們把時間回撥一百多年,想象一下當時的人們如何定義電力的成功。很難想象那個版本的我們能預見到今天的景象,但我希望那時的愿景是:學校燈火通明,家園溫暖如春,機器被賦予力量實現工業化,進而延長人類壽命,讓更多孩子接受教育。這就是技術和AI的意義,是一種永恒的價值。成功的定義應該是文明變得更加美好,而文明是由每一個追求幸福、繁榮且擁有尊嚴的個體組成的。這就是AI以及每一項技術成功的定義。

3、世界模型與具身智能的技術難點

主持人:接下來我們談談戰術層面。Large World Models(大型世界模型)的計算密集度是否與Language Models(語言模型)相當?

李飛飛:首先,存在不同種類的大型世界模型。我們致力于創建具有顯式3D表示的世界模型,以賦能機器人、游戲、娛樂和設計等領域。還有一類通常被稱為世界模型的其實是視頻生成模型。目前我們的模型規模并沒有那么大。從宏觀視角來看,GPT-5的訓練量大約在10的26次方flops(每秒浮點計算)左右,而我們的Marble模型在規模上仍要小幾個數量級。

主持人:這僅僅是因為沒有足夠的數據來喂給這些模型嗎?

李飛飛:我認為兩者兼而有之。規模化確實始于數據和模型參數,數據起到了重要作用。但另一方面,這個領域還處于早期階段。Transformer論文發表于2016年左右,語言模型的發展已經快十年了,而世界模型是一個新得多的領域。雖然過去兩年我們降低了一些科學風險,但仍處于探索模型架構的相對早期階段,所以規模較小。不過考慮到我們實驗室以及整個領域的進展,接下來的幾年將會非常令人興奮,我們將見證大型世界模型在Scaling Law(規模定律)曲線上的飛躍。

主持人:這讓我很著迷。語言模型是在互聯網上免費、公開的數據上訓練的,獲取海量數據相對容易。但物理數據很難獲取,因此合成數據(Synthetic Data)變得至關重要,同時你也需要以更慢的速度去收集真實數據。這帶來了哪些限制?世界模型的進步速度會因此變慢嗎?我們會擁有通用機器人,還是因為數據限制只能擁有專用機器人?

李飛飛:這是一個信息量很大的問題。在World Labs,我們采取混合數據策略。我非常羨慕研究語言的朋友,因為語言數據的輸入是完全可觀測的、單一模態的,且含義清晰。而像素或體素構成的3D世界則要混亂得多。為了突破技術極限創造3D、4D世界,我們必須意識到我們并沒有海量的3D數據。因此我們采取分層混合方法:利用互聯網規模的文本、圖像和視頻,結合模擬數據,再加上真實世界采集的數據。這就像自動駕駛公司花費數十年收集真實和模擬數據一樣。

至于速度,雖然數據獲取難,但算力在增強,芯片在進步,整個生態系統也在成熟。我們現在合作的數據供應商在三年前甚至不存在。合成數據確實發揮了很好的作用,而且我們正在制作的模型也將反過來為模擬世界貢獻數據,形成飛輪效應。

關于通用機器人,這幾句話就能概括,但做起來很難。我在斯坦福運營機器人實驗室十多年,作為科學家,我必須承認這是一個極具挑戰的問題。看清北極星并不意味著旅程會很短。回想2006年,我和同事帶領團隊創造了第一輛在沙漠行駛138英里的自動駕駛汽車,當時我們預言20年后會有自動駕駛汽車。直到去年,Waymo才開始在城市街道大規模運行,這確實是一段漫長的旅程。

汽車與機器人的區別在于,汽車可以被視作一個在二維平面上移動的方塊機器人,它的目標是不要碰到任何東西。而機器人是一個三維實體,在三維世界中運行,通用機器人的目標是必須接觸物體而不破壞它們。這是一個更高維度的問題,加上手部模擬的極高難度、視覺的精準度以及空間理解的需求,挑戰巨大。這就是我創立World Labs的原因。我不喜歡過度承諾,但這確實是我們致力于解決的重要問題。

主持人:最后,對于企業界人士,他們應該如何看待世界模型、物理AI以及你正在思考的整個領域?

李飛飛:雖然我的思維方式有時候還像個研究生,總想著要有免費食物才行,但對于企業而言,World Labs非常樂意與合作伙伴交流。世界模型和空間智能是一項橫向技術。我們談論機器人、模擬和沉浸式交互娛樂,但這不僅僅局限于此。我們還沒有深入探討醫療保健、教育產品、現場服務、金融服務、農業制造、倉儲檢測以及城市規劃等領域。利用空間智能我們可以做的事情還有很多,這確實是下一個前沿領域,我邀請大家無論是與我們合作還是獨立開展研究,都加入到這個進程中來。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
施瓦辛格私生子太爭氣,首奪健美冠軍!女保姆所生,肌肉復制父親

施瓦辛格私生子太爭氣,首奪健美冠軍!女保姆所生,肌肉復制父親

頭號電影院
2026-04-03 22:24:38
唐代宗李豫:天生的帝王,遭遇崇禎式的困境,卻能為大唐續命百年

唐代宗李豫:天生的帝王,遭遇崇禎式的困境,卻能為大唐續命百年

顧史
2026-04-24 11:47:11
被拒上廁所老兵發聲,透露自己98抗洪致殘,訴求未解決,拒收捐款

被拒上廁所老兵發聲,透露自己98抗洪致殘,訴求未解決,拒收捐款

社會日日鮮
2026-04-23 21:43:19
5月1日斷供!俄宣布關閉“友誼”管道,德國超九成汽車面臨停擺

5月1日斷供!俄宣布關閉“友誼”管道,德國超九成汽車面臨停擺

南風不及你溫柔
2026-04-23 12:13:05
打破沉默!中方安理會清算以色列違規,內塔尼亞胡陷全球禁行困境

打破沉默!中方安理會清算以色列違規,內塔尼亞胡陷全球禁行困境

無人傾聽無人傾聽
2026-04-24 14:43:25
老兵更新動態,保安被辭退處境堪憂,老兵一番話讓保安無地自容

老兵更新動態,保安被辭退處境堪憂,老兵一番話讓保安無地自容

離離言幾許
2026-04-23 07:41:27
這下尷尬了!美國最新民調出爐:特朗普支持率竟然沒干過教皇

這下尷尬了!美國最新民調出爐:特朗普支持率竟然沒干過教皇

溫讀史
2026-04-24 09:52:26
39集諜戰大作來襲!于和偉、張志堅領銜主演,懸念迭起,環環相扣

39集諜戰大作來襲!于和偉、張志堅領銜主演,懸念迭起,環環相扣

樂楓電影
2026-04-24 14:38:31
騎士慘敗!哈登18+4+4,最后30秒,替補席米切爾走過來和哈登擊掌

騎士慘敗!哈登18+4+4,最后30秒,替補席米切爾走過來和哈登擊掌

擔酒
2026-04-24 10:39:47
內維爾和21年前與自己發生沖突的埃弗頓球迷見面:你這個混蛋

內維爾和21年前與自己發生沖突的埃弗頓球迷見面:你這個混蛋

懂球帝
2026-04-24 09:16:18
廣東女孩當眾悔婚,拒絕退55萬彩禮,新郎沒怨,十天后新娘全家傻眼

廣東女孩當眾悔婚,拒絕退55萬彩禮,新郎沒怨,十天后新娘全家傻眼

趣味萌寵的日常
2026-04-24 08:09:12
新款大眾ID. Buzz官圖發布!網友:價格25萬起,肯定排隊

新款大眾ID. Buzz官圖發布!網友:價格25萬起,肯定排隊

汽車網評
2026-04-23 23:00:31
朝鮮戰場整支部隊失蹤 7 天,歸來竟押 119 名俘虜凱旋

朝鮮戰場整支部隊失蹤 7 天,歸來竟押 119 名俘虜凱旋

嘮叨說歷史
2026-01-28 14:32:25
各科醫生最想跟你說的大實話,很有用!收藏好常看看

各科醫生最想跟你說的大實話,很有用!收藏好常看看

華人星光
2026-04-23 12:00:20
亂套!CBA季后賽臨時改賽制?球迷怒噴:去年這樣,廣廈早就完了

亂套!CBA季后賽臨時改賽制?球迷怒噴:去年這樣,廣廈早就完了

米果說識
2026-04-24 14:38:45
此論調不可取:整個北約打不過俄羅斯?把德國逼下場會讓俄軍絕望

此論調不可取:整個北約打不過俄羅斯?把德國逼下場會讓俄軍絕望

寰球經緯所
2026-04-24 15:00:27
徹底改變!捷達正式換標

徹底改變!捷達正式換標

新浪財經
2026-04-24 00:42:22
女子買12萬黃金首飾,金店為何報警?起底退費騙局

女子買12萬黃金首飾,金店為何報警?起底退費騙局

環球網資訊
2026-04-23 16:39:17
槍法也是法,彈道也是道!高僧“反恐”20年,心中超度外掛玩家

槍法也是法,彈道也是道!高僧“反恐”20年,心中超度外掛玩家

17173游戲網
2026-04-23 14:43:50
參與抓捕馬杜羅的美國士兵在預測市場投注獲利40萬美元被捕

參與抓捕馬杜羅的美國士兵在預測市場投注獲利40萬美元被捕

Nee看
2026-04-24 10:04:26
2026-04-24 15:59:00
劃重點KeyPoints incentive-icons
劃重點KeyPoints
去除噪音,劃下重點 追蹤全球AI科技,記錄中國硬核崛起 溝通?一把把一傘一久耳久久漆
199文章數 18關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

女子買二手奔馳里程數偏差20萬公里 看到事故記錄崩潰

頭條要聞

女子買二手奔馳里程數偏差20萬公里 看到事故記錄崩潰

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

YU7 GT 5 月上市!小米Vision GT概念車國內首秀

態度原創

房產
數碼
家居
教育
旅游

房產要聞

三亞安居房,突然官宣!

數碼要聞

DeepSeek:預計下半年昇騰950超節點批量上市后 V4-Pro模型價格會大幅下調

家居要聞

自然肌理 溫潤美學

教育要聞

江西省委宣傳部原常務副部長陳東有:教育孩子不能太急切

旅游要聞

剛剛,在昭化區啟幕,標著廣元正式...

無障礙瀏覽 進入關懷版