網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

AI不會說"我不知道"，這才是最可怕的

2026-06-10 10:36:29　來源: 牛角說

吉林舉報

分享至

最近經(jīng)常刷到豆包一本正經(jīng)胡說八道的段子。

比如昨天高考，有網(wǎng)友問了豆包兩個問題，豆包給出了特別溫暖人心的答案。

豆包不僅在胡說八道時理直氣壯，而且認錯的態(tài)度還特別誠懇，秒慫滑跪。

比如有網(wǎng)友安排祖國人問豆包，對面那仨人（孫悟空、楊戩、哪吒）戰(zhàn)斗力如何，豆包告訴祖國人，他們都是小卡拉米，隨便打。

鏡頭一轉(zhuǎn)，豆包蹲在祖國人靈前懺悔，對不起是我搞錯了……

但是，千萬別把這些段子當笑話看。

AI的胡說八道只有在你的認知范圍內(nèi)是笑話，可要是答案脫離了你的認知范圍之外，你無法辨別真?zhèn)危强删筒皇切υ捔恕?/p>

去年我寫一篇論文，讓AI給我找?guī)灼獏⒖嘉墨I，它一口氣給我羅列了5篇論文，角度新穎，內(nèi)容詳實。

還好我留了個心眼，去網(wǎng)上檢索了一下，結(jié)果這5篇論文，只有一篇是真的，還有一篇標題和作者是真的，內(nèi)容是假的。剩下三篇全是AI瞎編的。

我要是真信了AI，那這篇文章就砸了。

一本正經(jīng)的胡說八道當然不只是出在豆包身上，而是人工智能的通病，這種現(xiàn)象還有個專有名詞叫做“AI幻覺”。

關(guān)于AI產(chǎn)生幻覺的原因，專欄作家李南南總結(jié)說：大模型是基于海量數(shù)據(jù)訓練的，這些數(shù)據(jù)中原本就有垃圾信息。比如，醫(yī)學、金融等領(lǐng)域的過時論文，都會導致大模型輸出錯誤結(jié)論。而且大模型的語料是有時間節(jié)點的，有些大模型的訓練數(shù)據(jù)滯后，對于最新發(fā)生的事情就會胡編。

對于AI幻覺，很多人會有一個困惑，為啥AI就不能直接說“我不知道”呢？

這源于大語言模型的訓練方式。因為訓練數(shù)據(jù)里，“我不知道”出現(xiàn)的場景太少。人類現(xiàn)實對話中，我們更傾向于給出答案，而不是承認無知。

AI有樣學樣——它把“給出回應(yīng)”當成了比“給出正確回應(yīng)”或“我不知道”更高的優(yōu)先級。主打一個有問必答，對不對別管。

另外，AI沒有元認知——它不知道自己知道什么、不知道什么。它不像你，遇到盲區(qū)會心虛、會猶豫。AI的輸出過程是黑箱，連它自己（如果它有“自己”的話）也說不清某個詞是回憶起來的，還是編出來的。

而這種“理直氣壯”又增強了AI的說服力，畢竟在人類社會，理直氣壯的背后往往是胸有成竹，但AI從來不知道什么叫心虛。

了解了AI幻覺的成因，解決辦法也就呼之欲出。對普通用戶來說，就記住一條：AI是工具，不是結(jié)果。

聊閑天、寫草稿、找靈感，用它很合適。但涉及醫(yī)療、法律、投資、學術(shù)引用這些，必須交叉驗證。它給的法條、論文、數(shù)據(jù)，你得自己去源頭查一遍。

然而這些工作恰恰是很多人不愿去做的。

人們越來越習慣把記憶和判斷“外包”給設(shè)備。電話號碼不記了，交給手機；行車路線不記了，交給導航；現(xiàn)在連知識判斷也想交給AI。

這種“認知卸載”一旦形成依賴，人就會逐漸喪失“自己查證”的能力和意愿——不是不想，而是不知道該怎么查、查什么、信什么。

AI幻覺之所以危險，不在于它騙了人，而在于它讓人停止了自己思考的過程。

哪怕AI這次碰巧說對了，人也只是得到了答案而不是理解了答案。長期下來，人會變成信息的消費者，而不是知識的生產(chǎn)者。

這不是道德缺陷，是設(shè)計層面的不對稱——AI被優(yōu)化來“給出令人滿意的回答”，而人沒有被訓練來“識別令人滿意的謊言”。

要破局，不單要靠人更努力或更警惕，還得改變?nèi)藱C交互的規(guī)則。

比如強制AI標注不確定性、要求它給出信息來源、在關(guān)鍵領(lǐng)域設(shè)置“人類必須復核”的門檻。讓AI的“自信”變得可見、可質(zhì)疑，才能打破這個幻覺的閉環(huán)。

而在此之前，我們始終要提醒自己——千萬別把AI當成人，尤其別把它當成你自己。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.