无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

李飛飛一篇論文,ChatGPT、Claude全部是”智障”

0
分享至

最近一篇論文讓我反復觀看,那就是李飛飛聯合西北大學教授做了一個測試,將ChatGPT、Claude、DEEPSEEK等主流一線模型做了一個基線測試。

“Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces”

研究團隊設計了一個 空間推理測試集 VSI-Bench ,包含:

  • 5000+ 視頻空間問答任務

  • 需要模型理解:

    • 物體位置

    • 空間移動

    • 距離關系

    • 環境結構


測試模型

論文測試了多種大模型,例如:

  • GPT 系列

  • 多模態模型

  • 視覺語言模型

從而得出結論

  1. LLM的空間理解能力遠低于人類

  2. 語言推理技巧(CoT、Tree-of-Thought)幾乎無幫助

  3. 模型缺乏真正的 “world model / 空間認知結構”

并且語言推理技巧也幾乎完全落后人類

  • 語言推理技巧(CoT、Tree-of-Thought)幾乎無幫助

  • 模型缺乏真正的 “world model / 空間認知結構”

LLM模型無法做空間的底座

為什么現在的AI模型無法生成空間系統了,因為他就沒有辦法去理解空間操作能力,這就導致我們現在做vision Pro的開發,當程序員想用AI編碼工具生成,幾乎無法完成。


被迫只能手動寫代碼,在現在空間計算里面,因為他們記不住在視頻里面的內容,也很難分辨出空間里面的物體。

在論文里舉例,如果現在的常識是在3D圖形旋轉一圈之后,看下AI模型能不能識別,而這種只是拿著標準答案來測試;于是他們用真實的家庭識別來測試,或者工廠或者辦公室。


空間智能有4個能力,分別是視覺能力、語言能力、時間處理、空間推理,其中

1.視覺感知(visual perception)

模型需要:

  • 識別物體

  • 識別形狀

  • 識別位置

例如:

桌子、椅子、門、窗戶

2.語言能力(linguistic intelligence)

模型要理解問題。

例如:桌子在沙發左邊還是右邊?

3.時間處理(temporal processing)

視頻是:

時間序列

模型要理解:

  • 物體移動

  • 相機移動

  • 人的路徑

4.空間推理(spatial reasoning)

這是最難的部分。

模型要理解:

  • 距離

  • 方向

  • 相對位置

例如:

桌子在椅子前面

而這點現在大模型做不到,主要是因為大模型現在只有tokens sequence,所以LLM不會真正理解房間結構、路徑、距離。

最后就是通過空間智能之后,加上時間的維度就是空間記憶,比如在記憶里面人類可以記住物體的位置,完整的房間布局結構。


而機器人要想能夠自主運動,就是需要空間模型,而當前時間是沒有空間模型的,都是LLM,這也是為什么vision Pro與AndroidXR會成為下一代革命,當真正使用空間設備的人多了之后,就可以快速生成更多高質量的空間數據,就可以完成空間智能模型的訓練了。

今天的分享就到這里

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
生吃殺菌,熟吃潤肺,夏天抓緊吃,才2元1斤,健脾通便,身體硬朗

生吃殺菌,熟吃潤肺,夏天抓緊吃,才2元1斤,健脾通便,身體硬朗

江江食研社
2026-06-13 23:30:07
外媒:俄羅斯新西伯利亞發生一起槍擊事件

外媒:俄羅斯新西伯利亞發生一起槍擊事件

環球網資訊
2026-06-14 16:33:18
張本美和4比3擊敗朱雨玲成為雙冠王!韓國兩冠,國乒零冠!

張本美和4比3擊敗朱雨玲成為雙冠王!韓國兩冠,國乒零冠!

呀古銅
2026-06-15 00:43:14
災難首秀!沒有桑巴魂!巴西隊世界杯前景堪憂

災難首秀!沒有桑巴魂!巴西隊世界杯前景堪憂

澎湃新聞
2026-06-14 13:26:34
6月該換菜譜了,菜市場最該買7大的黃金菜,看著有食欲,清爽不膩

6月該換菜譜了,菜市場最該買7大的黃金菜,看著有食欲,清爽不膩

阿龍美食記
2026-06-10 20:32:49
最新 | 葡萄牙隊決定:佩戴腕帶上場

最新 | 葡萄牙隊決定:佩戴腕帶上場

天津廣播
2026-06-14 17:00:35
世界杯官方用球只剩4塊面板:球越做越圓,為什么反而要故意做粗糙?

世界杯官方用球只剩4塊面板:球越做越圓,為什么反而要故意做粗糙?

平流層散步者
2026-06-13 15:41:24
劉國梁,算是安全落地了嗎

劉國梁,算是安全落地了嗎

中場陰謀家
2026-05-19 15:21:34
兒子長相與妻子領導神似,丈夫偷偷做親子鑒定,結果出來后愣住了

兒子長相與妻子領導神似,丈夫偷偷做親子鑒定,結果出來后愣住了

婉婉碎碎念
2024-10-14 16:07:36
克林頓與前美女記者12年秘密戀情被曝,女方發聲:他太討人喜歡了

克林頓與前美女記者12年秘密戀情被曝,女方發聲:他太討人喜歡了

譯言
2026-06-13 22:23:00
伊朗最新喊話:全面關閉!局勢突變,全線大漲

伊朗最新喊話:全面關閉!局勢突變,全線大漲

新浪財經
2026-06-14 13:54:47
總決賽砍90+30+10歷史唯一!馬刺丟冠,唯獨他一人可以昂首離開

總決賽砍90+30+10歷史唯一!馬刺丟冠,唯獨他一人可以昂首離開

你的籃球頻道
2026-06-14 12:44:04
歐盟沒想到,明明已經服軟了,中國卻不給面子,直接拒絕“求饒”

歐盟沒想到,明明已經服軟了,中國卻不給面子,直接拒絕“求饒”

究竟誰主沉浮
2026-06-14 13:45:49
巴西沒贏球原因曝光!跟中國國足一模一樣,這是足球的通病

巴西沒贏球原因曝光!跟中國國足一模一樣,這是足球的通病

酷侃體壇
2026-06-14 10:48:35
這部Netflix戰爭片,被低估27年才發現是真神作

這部Netflix戰爭片,被低估27年才發現是真神作

娛圈觀察員
2026-06-15 00:53:21
伊朗國足佩戴徽章紀念168名遇難兒童,隊員反問美國記者:你確定我們在美國安全嗎?你對你的國家有信心嗎?

伊朗國足佩戴徽章紀念168名遇難兒童,隊員反問美國記者:你確定我們在美國安全嗎?你對你的國家有信心嗎?

政知新媒體
2026-06-14 19:09:36
內馬爾場邊金飾拉滿當“場外指導”,巴西首戰“鋒無力”遭球迷怒噴

內馬爾場邊金飾拉滿當“場外指導”,巴西首戰“鋒無力”遭球迷怒噴

揚子晚報
2026-06-14 12:53:11
午睡可能影響壽命!再三提醒:過了55歲,午睡“五不要”得牢記

午睡可能影響壽命!再三提醒:過了55歲,午睡“五不要”得牢記

芹姐說生活
2026-06-03 23:56:01
2026世界田聯鉆石聯賽女子標槍決賽落幕:中國小將嚴子怡再奪冠軍

2026世界田聯鉆石聯賽女子標槍決賽落幕:中國小將嚴子怡再奪冠軍

童叔不飆車
2026-06-15 01:19:37
《主角》劉浩存秦海璐竇驍現在陜西打出租車都不用付錢,原因搞笑

《主角》劉浩存秦海璐竇驍現在陜西打出租車都不用付錢,原因搞笑

手工制作阿殲
2026-06-14 21:26:11
2026-06-15 05:08:49
Kevin改變世界的點滴 incentive-icons
Kevin改變世界的點滴
每周一次,產品案例與經驗分享
337文章數 22關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

德國7-1大勝庫拉索 庫拉索打入隊史世界杯首球

頭條要聞

德國7-1大勝庫拉索 庫拉索打入隊史世界杯首球

體育要聞

8年8隊奪冠,鄧肯那句話,現在還給了馬刺

娛樂要聞

鄧超攜子觀戰NBA,等等帥氣十足

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

狂歡置換價7.99萬 第三代豪越L歡樂PLUS大7座版上市

態度原創

教育
時尚
家居
藝術
旅游

教育要聞

2026廣東高考開始閱卷,現場圖曝光!如何查分?祝愿考生接高分!

絕望的直女:如何厭男又愛男?

家居要聞

空間微調 移形換境

藝術要聞

218米!建行最大的獨棟辦公樓,和農行長得一模一樣!

旅游要聞

6月14日最佳情報|五龍潭夏日遛娃好去處,煙臺現丁達爾現象!

無障礙瀏覽 進入關懷版