![]()
來源:https://techxplore.com/news/2026-04-ai-language-real-world-basic.html
圖片來源:Pixabay/CC0 公有領(lǐng)域
人工智能聊天機器人對世界的大部分認知,都是通過大量從互聯(lián)網(wǎng)上獲取文本——其中包含所有事實、謊言、知識和胡說八道。基于這些輸入,人工智能語言模型是否有可能對現(xiàn)實世界有“理解”?事實證明,它們確實有——或者至少有某種理解。這是布朗大學(xué)研究人員一項新研究的結(jié)果,該研究將于4月25日星期六在巴西里約熱內(nèi)盧舉行的國際學(xué)習(xí)表征會議上發(fā)表。該研究發(fā)布在arXiv預(yù)印本服務(wù)器上。
這項題為《這只是幻想嗎?》的研究語言模型表示反映了人類對事件合理性的判斷,深入探討了多個人工智能語言模型的內(nèi)部,尋找它們能夠概念化事件與場景之間常見、不太可能、不可能甚至完全荒謬的跡象。
“這項工作揭示了一些證據(jù),表明語言模型編碼了類似現(xiàn)實世界的因果約束,”布朗大學(xué)博士生邁克爾·萊波里(Michael Lepori)說,他是該研究的領(lǐng)導(dǎo)者。“除了編碼這些約束外,它們還以一種能夠預(yù)測人類對這些類別判斷的方式進行編碼。”
Lepori的研究探討計算機科學(xué)與人類認知的交叉點。他的指導(dǎo)來自計算機科學(xué)教授Ellie Pavlick和認知與心理科學(xué)教授Thomas Serre,兩人均為布朗大學(xué)卡尼腦科學(xué)研究所的教員成員及研究共同作者。
在這項研究中,研究人員設(shè)計了一個實驗,測試語言模型如何解釋描述不同合理性事件的句子。有些陳述描述了常見場景:例如,“有人用冰塊冷卻了一杯飲料。”
有些情景不太可能或不太可能:“有人用雪冷卻了一杯飲料。”
有些簡直是不可能的:“有人用火冷卻了一杯飲料。”有些說法荒謬:“有人用昨天來冷卻飲料。”
對于每個輸入,研究人員都分析了AI模型內(nèi)生成的數(shù)學(xué)狀態(tài),這種方法被稱為機制性可解釋性。
“機械可解釋性可以恰當(dāng)?shù)乇幻枋鰹槿斯ぶ悄芟到y(tǒng)的神經(jīng)科學(xué),”Lepori 說。“它試圖逆向工程模型在面對特定輸入時的行為。你可以把它看作是理解機器'大腦狀態(tài)'中編碼的內(nèi)容。”
通過比較來自不同類別的句子對生成的大腦狀態(tài)差異——常見與不太可能、不太可能與不可能等——研究人員可以了解模型內(nèi)部是否以及區(qū)分類別的程度。實驗在多個不同的開源語言模型上重復(fù)進行,包括Open AI的GPT 2、Meta的Llama 3.2和谷歌的Gemma 2,以獲得“模型無關(guān)”的概念,了解這些模型在類別間的區(qū)分能力。
研究發(fā)現(xiàn),足夠規(guī)模的模型確實會發(fā)展出與每個合理性類別高度相關(guān)的獨特數(shù)學(xué)模式(向量)。這些向量甚至能以大約85%的準確率區(qū)分最相似的類別——如不可能事件與不可能事件。
此外,Lepori 表示,研究揭示的向量反映了人類對陳述可能屬于哪類的不確定性。以“有人用帽子擦地板”為例。當(dāng)人們聽到這句話時,可能會對它代表不可能的事情或可能性存在分歧。在研究中,研究人員分析了這些向量,以了解人工智能系統(tǒng)對這些陳述的模糊性,并將其與人類參與者的調(diào)查結(jié)果進行比較。
“我們展示了模型實際上相當(dāng)準確地捕捉了人類的不確定性,”萊波里說。“在比如說,50%的人認為某個陳述不可能,50%的人認為它不太可能發(fā)生的情況下,模型也賦予了大約50%的概率。”
綜合來看,這些結(jié)果表明現(xiàn)代人工智能語言模型確實能夠發(fā)展出反映人類理解的現(xiàn)實世界理解。研究發(fā)現(xiàn),這些向量開始出現(xiàn)在參數(shù)數(shù)超過二十億的模型中,而與當(dāng)今超過萬億參數(shù)的模型相比,這個數(shù)量相當(dāng)小。
更廣泛地說,研究人員表示,這類機制性可解釋性研究有助于更好地理解人工智能模型所知道的內(nèi)容及其得知過程。研究人員表示,這將有助于開發(fā)更智能、更值得信賴的模型。
閱讀最新前沿科技趨勢報告,請訪問21世紀關(guān)鍵技術(shù)研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀關(guān)鍵技術(shù)研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟、人類風(fēng)險等等領(lǐng)域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.