无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

普林斯頓認知科學家發現:AI通不過的那些測試,恰好是人類智能里最重要的部分——他們把這片空白叫做"認知暗物質"

0
分享至

  

  來源:智能前沿社

  宇宙里有一種東西,看不見,摸不著,不發光,不反射任何電磁波。

  但如果沒有它,銀河系會在自身引力下土崩瓦解。

  天文學家把它叫做暗物質——不是因為它神秘,而是因為它的存在只能從它的缺席里被推斷出來。星系轉得太快了,按照可見物質的質量根本撐不住,所以一定有什么東西我們還沒看見。

  2026年3月,普林斯頓大學認知科學系、Amaranth基金會和Protocol Labs的三位研究者,用完全相同的邏輯,描述了他們在AI里看到的一個結構性缺口。

  他們把它叫做認知暗物質

  先從一件讓人困惑的事說起

  GPT-5、Claude Opus 4.5、Gemini 3.0 Pro——這些模型能通過律師資格考試,能解答奧數題,能看一張病理切片給出診斷意見,能在一小時內寫出一個功能完整的Web應用。

  但研究者做了一個簡單的測試:讓這三個模型各自運行10次,完成同一個任務——

  寫一個包含三道國際象棋"一步將死"殘局的網頁應用,要有拖拽功能。

  沒有一個模型能穩定通過。

  原因不是代碼能力不夠——它們生成的HTML、CSS、JavaScript幾乎無可挑剔,連拖拽邏輯都完美實現了。

  失敗的地方是:它們生成的國際象棋殘局本身是無效的。黑方棋子已經被將軍了,根本還沒到白方走棋,殘局就已經結束了。

  這是任何一個真正下過象棋的人一眼就能看出來的錯誤。一個初學者可能不會擺出這樣的殘局。

  但AI沒有發現。

  更奇怪的是:這個錯誤在代碼層面完全可以被檢測出來——這些模型在生成代碼時,已經導入了能驗證棋盤合法性的Python棋類庫。它們擁有發現自己錯誤所需的全部工具,只是從來沒有想到要用這個工具檢查自己的輸出。

  研究者把這個現象起了個名字:鋸齒狀智能(Jagged Intelligence)——AI的能力不是一個完整的球體,而是一個奇怪的形狀,某些方向上突出得極遠,某些方向上有令人意外的深坑,而且你很難提前預測哪里會是坑。

  他們的問題是:這些坑,為什么會在這里?

  AI的訓練方式,決定了它不知道自己不知道什么

  要理解這個問題,需要先理解AI是怎么被訓練出來的。

  現有的AI模型,學習的材料是人類行為的數字痕跡——文字、圖像、代碼、對話記錄。這些都是行為的結果,而不是產生這些行為的認知過程

  舉個例子:你在網上看到一篇數學論文,最終呈現的是一個完整的證明。但論文背后是什么?是作者在某個下午突然想到了一個新思路,是他意識到之前的方向走錯了然后回頭,是他在白板前站了兩個小時發現了一個別人沒注意到的模式。

  這些東西都沒有被寫進論文。

  AI學的是那個證明,不是寫出那個證明的認知過程。

  研究者把那些真正在人類智能運作中發揮關鍵作用、但很難從行為結果里推斷出來的認知能力,統稱為"認知暗物質"。

  就像宇宙暗物質的存在是從"星系轉得太快"這件事被推斷出來的——認知暗物質的存在,是從AI在某些任務上的表現方式里被推斷出來的。

  那些任務,AI完成得很奇怪:對的部分非常對,錯的部分非常奇怪,錯誤的類型不像人類會犯的錯,更像一個不知道自己缺了什么的系統在盲目推進。

  七片暗物質,每一片都有名字

  研究者列出了他們認為最關鍵的七個認知暗物質域。這七個能力,共同構成了人類智能里那個"看不見但撐起了一切"的隱形骨架。

  第一片:元認知

  知道自己知道什么,知道自己不知道什么,知道什么時候需要停下來檢查自己的推斷是否正確。

  象棋殘局那個例子里,缺失的正是這個——模型生成了棋局,但從來沒有問自己"這個棋局合法嗎"。它沒有一個內置的聲音在說"等等,我在這一步可能犯了錯,讓我驗證一下"。

  人類做復雜任務時會有這種內部檢查機制,即便犯了很多錯,也能在某個節點意識到"這個方向不對"然后轉向。AI的成功率隨著任務步驟的增加呈指數級下降,就是因為缺乏這個錯誤恢復機制——它每一步犯錯,卻不知道自己在犯錯,然后繼續走。

  第二片:認知靈活性

  當規則變了,或者反饋表明當前策略不管用時,快速切換到另一種策略的能力。

  研究者嘗試給Claude Code連續反饋,告訴它殘局是無效的,讓它換一個思路。失敗了——模型反復使用同一種方法,哪怕每次都得到了"這條路走不通"的明確信號。

  人類碰到這種情況會有一種認知層面的"卡住感",然后主動尋找為什么卡住、有沒有別的思路。這個機制在AI里大體缺失。

  第三片:情節記憶

  記住"這件具體的事是什么時候發生在我身上的",然后用這段記憶來指導未來的行動。

  當前部署的語言模型沒有真正意義上的情節記憶。它們有訓練數據里蒸餾出來的通用知識,但沒有"我上次做類似任務時犯了這個錯誤"這種可以被檢索和利用的個人化記憶。每次對話都是全新開始,之前積累的經驗教訓無法被內化。

  第四片:終身學習

  在不忘記已有知識的前提下,不斷學習新東西,適應新環境的能力。

  人類的神經系統在一生中都在持續更新,學新技能不會讓之前的技能消失。現有的AI模型要更新知識,需要在海量數據上重新訓練。這被稱為"災難性遺忘"問題——給模型加入新知識,舊知識就被覆蓋了。

  第五片:溯因推理

  從已知的結果,推斷出最有可能的原因——即便那個原因是全新的、之前從未被明確提出過的。

  這是科學發現的核心機制。達爾文看到加拉帕戈斯群島上不同的雀類,推斷出了自然選擇。牛頓看到蘋果落地,推斷出了萬有引力。這種從零散觀察里"跳躍"到一個全新解釋框架的能力,極難被編碼進訓練數據,因為真正的"跳躍"在它發生之前沒有人知道它會在哪里發生。

  第六片:社會常識推理

  理解人和人之間那些不成文的規則,理解"他知道我知道他知道什么"這種多層嵌套的社會認知。

  人際交往里有大量的意義是通過沉默、語氣、時機傳遞的,而不是通過字面意思。一個真正理解社會規則的系統,不需要被明確告知"在這種情況下不應該說這種話"——它有一個關于人類社會互動的內建模型。

  第七片:情緒智能

  識別、理解自己和他人的情緒狀態,并據此調整自己的行為。

  這不是在問"AI有沒有感情"這個哲學問題。這是在問:在一個情緒高度敏感的對話場景里,AI能不能感知到對方的情緒信號,并給出在情感層面恰當的回應?相關事件顯示,這個能力目前存在相當大的缺口。

  為什么這七件事這么難補上

  你可能會問:這七件事,不就是更多的訓練數據,或者更大的模型能解決的問題嗎?

  研究者的回答是:不是,因為問題不在于量,而在于類型。

  他們分析了目前最大規模的神經成像數據集,發現了一個讓人警覺的模式:

  那些已經被AI掌握得很好的認知能力(視覺感知、語言理解、語言生成),有大量專門為AI訓練而設計的大規模神經數據集。

  那些AI還完全沒有掌握的認知能力(元認知、認知靈活性、情緒智能),對應的大規模數據集幾乎不存在。

  這不是偶然。AI研究者收集和使用那些容易被測量、能產生明確正確或錯誤答案的數據。元認知發生在內部,通常不留痕跡;溯因推理的"靈感時刻"稍縱即逝,無法被大規模記錄;情緒智能的微妙信號很難被標注成訓練標簽。

  結果就是:AI學會了大量可以被測量的東西,但那些真正塑造人類行為、但難以被測量的東西,從來沒有進入過任何訓練集。

  研究者還做了另一個分析:檢查了GPT-5.2、Claude Opus 4.5、Gemini 3.0 Pro的發布文檔里用到的所有評測基準——37個基準,分析每一個主要在考察什么認知能力。

  結果:幾乎所有基準都集中在中等難度的認知能力層級,對真正困難的認知暗物質域的測試幾乎為零。

  換句話說:AI在哪些方面進步,取決于我們在哪些方面給它出卷子。我們沒有出這七道題,所以這七塊地方從未被認真建設過。

  它如何失敗,比它是否失敗更重要

  論文里有一段話,讀完之后會停在腦子里:

"問題不只是任務失敗,而是失敗的方式。在一個精良的象棋應用里硬編碼了無效殘局,不只是錯誤,更是陌生的。人類犯錯有規律可循:忽略邊緣案例,算術出錯,注意力渙散。這些失敗模式是可被理解的,這讓協作成為可能。以不可預測的方式失敗的AI,很難被整合進人類的社會網絡。目標不只是減少失敗,而是確保失敗是可被發現和可被解釋的。"

  這句話說的是一件比能力本身更根本的事:可靠性的前提,不是永不出錯,而是出錯的方式讓人能看懂。

  一個人類同事犯了錯,你大概能理解為什么——太累了,信息不夠,理解有偏差。你知道下次怎么補救,知道在哪些環節多核查。這讓人類之間的分工成為可能。

  一個缺乏認知暗物質的AI犯了錯,那個錯誤經常是莫名其妙的——它做對了99個步驟,然后在第100步犯了一個初學者都不會犯的錯,沒有任何預兆,沒有任何你能事先檢測到的信號。

  這不只是技術問題,這是人機協作的根本挑戰。

  研究者說,解決這個問題會有雙重收益

  這篇論文最后的結論,有一種不常見的誠實:

  研究者承認,他們提出的解決方向——收集大規模的過程數據、眼動追蹤數據、神經成像數據,來訓練AI學習認知過程而不只是行為結果——可能來不及在常規AI研究進展之前發揮作用

  如果scaling law繼續下去,也許這七片暗物質會在某個未知的方式下被部分解決,而不需要等待神經科學數據的介入。

  但他們認為,即便如此,這項研究依然值得做。原因是雙重的:

  一方面,這些數據能幫助AI變得更通用、更少鋸齒。

  另一方面,這些數據能幫助我們更好地理解人類自己的認知是怎么運作的——元認知究竟發生在大腦的哪個部位,情緒智能的神經基礎是什么,溯因推理時大腦里在發生什么。

  研究AI缺什么,結果幫我們更清楚地看到了人類有什么。

  這個視角,讓這篇論文的意義超出了單純的AI研究邊界。

  最后

  回到開頭的那個比喻。

  宇宙暗物質之所以重要,不是因為它神秘,而是因為如果它不存在,我們觀察到的宇宙就無法成立——那些星系根本不該轉得那么穩定,那些結構根本不該那么完整。

  認知暗物質之所以重要,是同樣的邏輯:如果這七種能力真的只是可有可無的附加功能,那人類就不該如此穩定地在復雜的、不確定的、充滿情感張力的真實世界里生存和合作。

  它們一直在那里,支撐著我們,只是在AI被設計出來之前,我們從來沒有需要給它們一個名字。

  原論文:Patrick J. Mineault(Amaranth基金會)、Thomas L. Griffiths(普林斯頓大學)、Sean Escola(Protocol Labs),《Cognitive Dark Matter: Measuring What AI Misses》,arXiv:2603.03414,2026年3月5日

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中足聯官宣重磅罰單!52歲于根偉禁賽5場罰5萬 辱罵+率隊圍堵裁判

中足聯官宣重磅罰單!52歲于根偉禁賽5場罰5萬 辱罵+率隊圍堵裁判

我愛英超
2026-07-02 22:05:30
早上7點 世界杯14億大戰!C羅深陷20年魔咒 必有1巨星出局

早上7點 世界杯14億大戰!C羅深陷20年魔咒 必有1巨星出局

葉青足球世界
2026-07-02 17:12:02
一路走好!1天時間4位名人被曝去世,最大78歲,最小才30歲

一路走好!1天時間4位名人被曝去世,最大78歲,最小才30歲

借你一生
2026-07-02 10:26:03
成田機場的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國”

成田機場的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國”

東京在線
2026-07-02 16:57:07
里子面子都丟了!管不住下半身的任素汐,一場演唱會撕下她的體面

里子面子都丟了!管不住下半身的任素汐,一場演唱會撕下她的體面

往史過眼云煙
2026-07-02 09:55:26
首都保衛戰打響后,普京發表全國講話,俄羅斯對美西方發出通牒

首都保衛戰打響后,普京發表全國講話,俄羅斯對美西方發出通牒

策前論
2026-07-02 17:21:49
“一個月600塊你要餓死他?”大學男生吃飯被偷拍,看的人心疼!

“一個月600塊你要餓死他?”大學男生吃飯被偷拍,看的人心疼!

林林先生
2026-07-01 12:30:03
從699分到愛心接力:少年向上 社會向善丨中聽

從699分到愛心接力:少年向上 社會向善丨中聽

大象新聞
2026-07-01 16:30:12
六代機,就這么明晃晃的官宣了!

六代機,就這么明晃晃的官宣了!

新動察
2026-07-02 08:25:58
韓紅一句“走個面兒”引全網聲討,這屆觀眾不伺候了

韓紅一句“走個面兒”引全網聲討,這屆觀眾不伺候了

可達鴨面面觀
2026-07-02 19:44:03
曝38歲德國主帥下課 足協開會3小時要求他辭職 愿付700萬歐補償金

曝38歲德國主帥下課 足協開會3小時要求他辭職 愿付700萬歐補償金

我愛英超
2026-07-02 21:40:07
80%變0!里奇·保羅曝光詹姆斯離湖心路

80%變0!里奇·保羅曝光詹姆斯離湖心路

籃壇第一線
2026-07-02 00:47:17
地鐵吐血女孩半月內多次收到病危通知單,當事人:自己的生命已經進入倒計時,但還是希望能夠有人關注到自己手里仍在運行的公益項目

地鐵吐血女孩半月內多次收到病危通知單,當事人:自己的生命已經進入倒計時,但還是希望能夠有人關注到自己手里仍在運行的公益項目

瀟湘晨報
2026-07-02 16:32:20
賈玲直言自己又活過來了,大方承認體重反彈了,坦言不再逼自己極端自律,活得太通透了

賈玲直言自己又活過來了,大方承認體重反彈了,坦言不再逼自己極端自律,活得太通透了

背包旅行
2026-07-02 11:45:23
西安賽格墜樓熱搜刷屏:我看到謀生的嚴總,走上絕路時的無助

西安賽格墜樓熱搜刷屏:我看到謀生的嚴總,走上絕路時的無助

李晚書
2026-07-02 18:44:26
故意剝奪伊朗隊勝利!伊朗裔美國專家起訴國際足聯,索賠10億美元

故意剝奪伊朗隊勝利!伊朗裔美國專家起訴國際足聯,索賠10億美元

全景體育V
2026-07-02 21:38:20
成都一女子不洗手抱孫子,兒媳怒斥不衛生,兒子一拳打面中,母親揚言要兒子坐牢,兒子卻說:她活該!6年后現狀曝光...

成都一女子不洗手抱孫子,兒媳怒斥不衛生,兒子一拳打面中,母親揚言要兒子坐牢,兒子卻說:她活該!6年后現狀曝光...

背包旅行
2026-07-02 14:33:11
中國臺灣演員陳昊森承認與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

中國臺灣演員陳昊森承認與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

極目新聞
2026-07-02 22:47:55
加息,突變!美國重磅數據出爐!美股、黃金、比特幣全線拉升

加息,突變!美國重磅數據出爐!美股、黃金、比特幣全線拉升

證券時報
2026-07-02 21:53:03
扎哈羅娃:馮德萊恩是個“出色的騙子”

扎哈羅娃:馮德萊恩是個“出色的騙子”

參考消息
2026-07-02 14:14:08
2026-07-03 02:28:49
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4864文章數 37483關注度
往期回顧 全部

科技要聞

馬斯克不承認,但SpaceX就該造AI手機

頭條要聞

商戶在西安賽格商場墜亡 好友:他曾變賣門店發工資

頭條要聞

商戶在西安賽格商場墜亡 好友:他曾變賣門店發工資

體育要聞

韓國人,為什么恨透了洪明甫?

娛樂要聞

眾星祝福祖國,曾沛慈原形畢露?

財經要聞

千億茶市場無贏家:瀾滄巨虧 八馬停"蹄"

汽車要聞

有純電有增程 還有二代VLA支持 小鵬MONA L03預售價14.38萬起

態度原創

房產
教育
時尚
數碼
旅游

房產要聞

稀缺預警!海岸線200米+限墅令下,海南「絕版硬通貨」來了!

教育要聞

初二期末只在校內第120名、第125名,四年后在全省站到了狀元榜眼

這個夏天,你一定吃過她們的瓜

數碼要聞

卓威同步發布XQ2766X顯示器:27" QHD 360Hz TN

旅游要聞

135公里鐵絲網圍泰山,論證過必要性了嗎

無障礙瀏覽 進入關懷版