最近經(jīng)常刷到豆包一本正經(jīng)胡說八道的段子。
比如昨天高考,有網(wǎng)友問了豆包兩個問題,豆包給出了特別溫暖人心的答案。
![]()
豆包不僅在胡說八道時理直氣壯,而且認錯的態(tài)度還特別誠懇,秒慫滑跪。
比如有網(wǎng)友安排祖國人問豆包,對面那仨人(孫悟空、楊戩、哪吒)戰(zhàn)斗力如何,豆包告訴祖國人,他們都是小卡拉米,隨便打。
鏡頭一轉(zhuǎn),豆包蹲在祖國人靈前懺悔,對不起是我搞錯了……
![]()
但是,千萬別把這些段子當笑話看。
AI的胡說八道只有在你的認知范圍內(nèi)是笑話,可要是答案脫離了你的認知范圍之外,你無法辨別真?zhèn)危强删筒皇切υ捔恕?/p>
去年我寫一篇論文,讓AI給我找?guī)灼獏⒖嘉墨I,它一口氣給我羅列了5篇論文,角度新穎,內(nèi)容詳實。
還好我留了個心眼,去網(wǎng)上檢索了一下,結(jié)果這5篇論文,只有一篇是真的,還有一篇標題和作者是真的,內(nèi)容是假的。剩下三篇全是AI瞎編的。
我要是真信了AI,那這篇文章就砸了。
一本正經(jīng)的胡說八道當然不只是出在豆包身上,而是人工智能的通病,這種現(xiàn)象還有個專有名詞叫做“AI幻覺”。
關(guān)于AI產(chǎn)生幻覺的原因,專欄作家李南南總結(jié)說:大模型是基于海量數(shù)據(jù)訓練的,這些數(shù)據(jù)中原本就有垃圾信息。比如,醫(yī)學、金融等領(lǐng)域的過時論文,都會導致大模型輸出錯誤結(jié)論。而且大模型的語料是有時間節(jié)點的,有些大模型的訓練數(shù)據(jù)滯后,對于最新發(fā)生的事情就會胡編。
對于AI幻覺,很多人會有一個困惑,為啥AI就不能直接說“我不知道”呢?
這源于大語言模型的訓練方式。因為訓練數(shù)據(jù)里,“我不知道”出現(xiàn)的場景太少。人類現(xiàn)實對話中,我們更傾向于給出答案,而不是承認無知。
AI有樣學樣——它把“給出回應(yīng)”當成了比“給出正確回應(yīng)”或“我不知道”更高的優(yōu)先級。主打一個有問必答,對不對別管。
另外,AI沒有元認知——它不知道自己知道什么、不知道什么。它不像你,遇到盲區(qū)會心虛、會猶豫。AI的輸出過程是黑箱,連它自己(如果它有“自己”的話)也說不清某個詞是回憶起來的,還是編出來的。
而這種“理直氣壯”又增強了AI的說服力,畢竟在人類社會,理直氣壯的背后往往是胸有成竹,但AI從來不知道什么叫心虛。
了解了AI幻覺的成因,解決辦法也就呼之欲出。對普通用戶來說,就記住一條:AI是工具,不是結(jié)果。
聊閑天、寫草稿、找靈感,用它很合適。但涉及醫(yī)療、法律、投資、學術(shù)引用這些,必須交叉驗證。它給的法條、論文、數(shù)據(jù),你得自己去源頭查一遍。
然而這些工作恰恰是很多人不愿去做的。
人們越來越習慣把記憶和判斷“外包”給設(shè)備。電話號碼不記了,交給手機;行車路線不記了,交給導航;現(xiàn)在連知識判斷也想交給AI。
這種“認知卸載”一旦形成依賴,人就會逐漸喪失“自己查證”的能力和意愿——不是不想,而是不知道該怎么查、查什么、信什么。
AI幻覺之所以危險,不在于它騙了人,而在于它讓人停止了自己思考的過程。
哪怕AI這次碰巧說對了,人也只是得到了答案而不是理解了答案。長期下來,人會變成信息的消費者,而不是知識的生產(chǎn)者。
這不是道德缺陷,是設(shè)計層面的不對稱——AI被優(yōu)化來“給出令人滿意的回答”,而人沒有被訓練來“識別令人滿意的謊言”。
要破局,不單要靠人更努力或更警惕,還得改變?nèi)藱C交互的規(guī)則。
比如強制AI標注不確定性、要求它給出信息來源、在關(guān)鍵領(lǐng)域設(shè)置“人類必須復核”的門檻。讓AI的“自信”變得可見、可質(zhì)疑,才能打破這個幻覺的閉環(huán)。
而在此之前,我們始終要提醒自己——千萬別把AI當成人,尤其別把它當成你自己。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.