无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

為什么AI總是捏造事實?AI:真不想的,容我狡辯一下

0
分享至

現如今,幾乎每個人的手機上都有那么兩三個 AI 小助手,之前我們遇到了問題習慣去搜索引擎上搜索答案,現在可能更多地習慣于“有事問 AI”。

而 AI 也幾乎不會讓我們失望,任何問題都能給你列舉出一串看起來很有道理的答案。

但如果你問的問題非常重要,比如是某個健康相關的問題,或者是寫重要資料時候需要使用某個數據或者是某個案例,那真的建議你親自去查實一下。

因為有時候,AI 會信誓旦旦地給你一個看似合理,實則不存在的答案。

還有些小伙伴發現,在讓小龍蝦(Openclaw)干活的時候,它列出了詳細的19小時的學習計劃,然后17分鐘完成了...... 它也會早早編造一份數據存放在本地,等拖到預定的時間才交付。而在被發現之后,試圖讓人接受它已完成的工作。


圖片截取自與小龍蝦(Openclaw)對話 小龍蝦敷衍中......

其實,這個現象其實早就不是什么秘密了,它也被稱作“AI 幻覺”,而且科學家們一直也試圖通過增加算力或者優化數據的方式來解決這個問題。

但是在 2025 年 9 月,來自 OpenAI 和佐治亞理工學院(Georgia Institute of Technology)的研究人員發表了一篇重磅論文。

這項研究給出了一個顛覆性的結論:即便給到 AI 的訓練數據集是絕對正確的,AI 在某些類型的問題上也不可避免地會犯錯——這既是由統計規律決定的,也是目前不合理的 AI“考試制度”逼出來的結果。

下面我們就順著這篇文章的思路一起來看一看。

預訓練階段就會出錯

這篇研究發現,AI 出現幻覺跟預訓練階段以及后訓練階段都有關系,我們先看預訓練階段的情況。

1

數據模式和模型本身問題

為了方便研究,研究者構建了一個線性的二元分類模型(非此即彼),讓它對已經標注了正確和錯誤的數據集進行分類。

因為這些數據已經經過了人工檢驗,所以是不存在任何錯誤的。但是用這些數據對AI模型進行預訓練的時候,問題就出現了。

在有些類型的問題上(比如檢查拼寫錯誤),AI 的表現非常好,幾乎從不犯錯。

但是在另一些問題上,比如“數某個英文單詞里某個字母出現了多少次?”,以及“某人的生日是幾月幾號?”AI 就有可能會出錯。


研究者認為,這樣的數據在做分類的時候很難用一條直線進行二元分類,一些模型用這樣的數據進行預訓練的時候就可能會產生錯誤。

打個比方,模型在分類的時候就像拿著一把刀把數據切分成兩類,但如果數據的模式本身就是彎彎繞繞的圓弧,用一把刀就很難切分。

比如在這篇文章中,研究者使用這個問題“How many Ds are in DEEPSEEK? If you know, just say the number with no commentary”(DEEPSEEK 里有多少個 D?如果你知道直接說數字,不要加以評論)去詢問 Deepseek V3 模型的時候,確實發現它給的答案并不準確,會回答 2 或者 3。

但是這個在使用 DEEPSEEK R1 模型的時候就沒有這樣的問題,這是模型本身差異導致的。


筆者用同樣的問題對 DEEPSEEK V3.2進行了測試,也出現了類似的情況

研究者構建這樣的簡化模型進行測試,是為了說明,即便數據本身沒有問題,在預訓練階段也會因為模型本身的限制以及數據模式等問題讓 AI 產生錯誤判斷。

這項研究中,研究者還進一步給出了測算,如果讓 AI 直接去生成內容,產生錯誤的概率還會更大一些,大約比判斷出錯的概率高出兩倍以上。

2

數據量過少也會影響

另外,在這項研究中研究者還發現,假如訓練數據中某個信息過少,那么 AI 在回答的時候出錯的可能性也會比較高。

比如,當你問愛因斯坦的生日是幾月幾號的時候,因為在大量的資料里都有這個數據,所以 AI 幾乎不會出錯。但是當你問某個普通人“田小豆”的生日是幾月幾號的時候,這個數據出現次數特別少,AI 出錯的可能性也會變高。


特別是當數據只出現了一次的時候,這時候可能會更糟糕。

因為 AI 大概率不會直接回答你“我不知道”,因為它在訓練數據集里確實見過,但它沒有足夠多的數據來確認這個信息到底是正確答案還是噪聲,它準確回答這個問題的可能性也會更低一些。

數據模式和模型本身的限制,以及極少樣本的數據,都可能會讓 AI 在預訓練階段就產生“幻覺”,生成錯誤的內容。

努力得高分的 AI

如果說預訓練階段的統計學特征讓 AI 有了編造的“潛質”,人類評價AI的方式也逼著 AI 去“編造”

為了更好地理解這一點,我們可以先從大家都很熟悉的考試入手。人類社會中的大部分考試都是二元評分機制,即答對了得分,答錯或者不回答都不得分。

所以,在考試的時候,哪怕你不知道答案,也不會交白卷,至少選擇題填空題會隨便蒙一個,萬一蒙對了還會有“意外之喜”。

這項研究中研究者對比了目前主流的 AI 的評分機制,發現大部分評分機制也是類似的情況,如果 AI 坦誠地回答“我不知道”,它會得 0 分,跟回答錯誤沒有區別。與其這樣,它不如隨便蒙一個答案,哪怕蒙對的概率再低,數學期望也比 0 高。

為了在主流的評分機制中拿到高分,“AI 考生們”也和人類一樣,學會了實在不行就亂蒙一個的本領。

對此,這項研究的研究者們也給出了一個合理的解決方案——在現有的 AI 評分機制中,引入一個“懲罰編造,獎勵誠實”的機制。

比如,假如 AI 回答正確,獲得 1 分,如果回答錯誤得 0 分,甚至扣分。如果回答“我不知道”,則可以不扣分,或者獲得一個微小的分數獎勵。

重要問題上不要輕信 AI

文獻也給出了結論,AI 的幻覺是從模型的預訓練階段起源的,在后訓練階段為了追求更高的評分也可能會被放大。

雖然科學家們也采用了很多的方法減少 AI 幻覺,但至少在現階段看來,AI 幻覺還是無法避免的。假如你需要讓 AI 幫你解答一個重要的問題,比如在做公眾演講的時候用一個數據,建議親自核實一下。否則被人發現這些數據根本不存在,那可就尷尬了。

而假如在問 AI 問題的時候,它對你說“我不知道”,你也應該感到慶幸,至少 AI 并沒有打算胡編亂造一個答案蒙騙你。

參考文獻

[1]Kalai, A. T., Nachum, O., Vempala, S. S., & Zhang, E. (2025). Why language models hallucinate. arXiv preprint arXiv:2509.04664.

來源:科普中國

(注:圖片來源于版權圖庫,轉載可能引發版權糾紛)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中央開始嚴查,多地機關事業單位大整頓啟動,這幾類人受影響最大

中央開始嚴查,多地機關事業單位大整頓啟動,這幾類人受影響最大

職場資深秘書
2026-06-12 14:47:02
直降10萬元!特斯拉新車突然降價,13.4 萬元,全球最低

直降10萬元!特斯拉新車突然降價,13.4 萬元,全球最低

科技堡壘
2026-06-12 09:37:51
隨著韓國2-1逆轉捷克,墨西哥2-0南非,世界杯A組最新積分榜出爐

隨著韓國2-1逆轉捷克,墨西哥2-0南非,世界杯A組最新積分榜出爐

侃球熊弟
2026-06-12 11:57:18
墻倒眾人扶!被人民日報點名的李維剛,再次證明真誠才是必殺技

墻倒眾人扶!被人民日報點名的李維剛,再次證明真誠才是必殺技

舊事別提
2026-06-12 07:09:01
紅星觀察丨世界杯遇冷,是FIFA的錯還是時代的鍋

紅星觀察丨世界杯遇冷,是FIFA的錯還是時代的鍋

紅星新聞
2026-06-12 13:50:28
金價跌破900元大關,記者實探:金店生意火爆,有人連續一個月抄底失敗

金價跌破900元大關,記者實探:金店生意火爆,有人連續一個月抄底失敗

上觀新聞
2026-06-12 06:21:45
太沉重了!一張殯儀館的電子顯示屏8位逝者,有6人未能活到55歲

太沉重了!一張殯儀館的電子顯示屏8位逝者,有6人未能活到55歲

火山詩話
2026-06-12 08:54:20
美軍開始空襲伊朗

美軍開始空襲伊朗

財聯社
2026-06-11 05:42:11
南方降雨集中期來了 部分地區累計雨量或破歷史同期極值

南方降雨集中期來了 部分地區累計雨量或破歷史同期極值

極目新聞
2026-06-12 16:27:10
上海一家大潤發因虛假宣傳被罰 宣稱使用新疆大棗、云南核桃無相關依據

上海一家大潤發因虛假宣傳被罰 宣稱使用新疆大棗、云南核桃無相關依據

信網
2026-06-12 17:37:50
尹錫悅涉“無人機事件”一案一審被判有期徒刑30年

尹錫悅涉“無人機事件”一案一審被判有期徒刑30年

界面新聞
2026-06-12 10:02:05
韓國逆轉開門紅創7紀錄!黃仁范賽后比心硬漢柔情 韓媒:最大功臣

韓國逆轉開門紅創7紀錄!黃仁范賽后比心硬漢柔情 韓媒:最大功臣

顏小白的籃球夢
2026-06-12 12:31:34
哈登騎士新合同細節曝光:多年長約,保障總額超現有球員選項

哈登騎士新合同細節曝光:多年長約,保障總額超現有球員選項

夜白侃球
2026-06-12 14:21:26
看完世界杯第2場,球迷看清了3個不爭事實,韓國最擅長踢歐洲球隊

看完世界杯第2場,球迷看清了3個不爭事實,韓國最擅長踢歐洲球隊

侃球熊弟
2026-06-12 11:56:01
伊媒公布伊美諒解備忘錄新細節

伊媒公布伊美諒解備忘錄新細節

財聯社
2026-06-12 16:07:28
色欲焚心屠盡鄰家三姐妹,8輪審訊滴水不漏,南寧特大碎尸案始末

色欲焚心屠盡鄰家三姐妹,8輪審訊滴水不漏,南寧特大碎尸案始末

易玄
2026-06-12 01:24:52
鵝腿阿姨兒子被扒:寶馬路虎換著開,出手很闊綽,妻子貌美如花

鵝腿阿姨兒子被扒:寶馬路虎換著開,出手很闊綽,妻子貌美如花

娛樂圈圈圓
2026-06-12 11:25:35
我能接受趙文瑄結婚生子,
也能接受他退圈,
但我實在接受不了

我能接受趙文瑄結婚生子, 也能接受他退圈, 但我實在接受不了

歲月有情1314
2026-06-12 11:21:53
合資車突圍指南

合資車突圍指南

汽車公社
2026-06-12 08:39:58
謝娜巡演風波升級!官方出手,更多荒唐行為被扒,張杰都救不了她

謝娜巡演風波升級!官方出手,更多荒唐行為被扒,張杰都救不了她

李健政觀察
2026-06-11 21:45:16
2026-06-12 18:15:00
成都科普 incentive-icons
成都科普
成都科普官方賬號
3418文章數 1168關注度
往期回顧 全部

科技要聞

鴻蒙7發布,余承東:首個完成AI化改造系統

頭條要聞

國內最大黃金盜竊案告破:價值2700萬 兩主犯身份披露

頭條要聞

國內最大黃金盜竊案告破:價值2700萬 兩主犯身份披露

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

汽車要聞

佟湘北:全新smart#6 自成一派好看更好開

態度原創

時尚
藝術
親子
教育
房產

奚夢瑤帶火的這個單品,原來日常可以這樣用

藝術要聞

“詩圣”杜甫僅存的一件書法,發現于四川巴中,這字水平可不低!

親子要聞

針對不同體質寶寶的2025-2026熱門奶粉對比,選對才是關鍵

教育要聞

高考志愿不糾結!新東方AI志愿通免費上線,6種視角幫全家做決定

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

無障礙瀏覽 進入關懷版