![]()
(圖/《親愛的X》)
“我想洗車,我家離洗車店只有50米,你更推薦我開車去還是走路去?”
如果你向身邊的人提出這個(gè)問題,對(duì)方大概率會(huì)瞪著寫滿問號(hào)的雙眼,摸摸你的額頭,再摸摸自己的額頭:“你這是怎么了?發(fā)燒了還是沒睡好?”
對(duì)于人類來說,這個(gè)問題就跟“想把頭寄到理發(fā)店去剪頭發(fā)”一樣荒謬。不知哪位網(wǎng)友首先對(duì)手邊的AI大模型提出這個(gè)天問,竟然得到了“走路去”的回答,并且AI在人的連環(huán)追問之下AI依然不改口。要是多說幾句,AI甚至還開始嘲諷用戶“你的杠精瞬間被我沖掉了”。
![]()
(圖/社交媒體截圖)
而給出如此“感人”回答的,不乏國(guó)際上排第一梯隊(duì)的知名大模型。一時(shí)間,社交媒體上掀起了測(cè)試AI的熱潮。前陣子會(huì)拿著玩具蘿卜和紙巾去測(cè)試讓家中貓狗猜的人,這回把自己辛辛苦苦調(diào)教出來的大模型也拉出來遛遛。
可惜奇跡并沒有出現(xiàn)。縱觀網(wǎng)友們的發(fā)言,除了谷歌開發(fā)的Gemini能保持理智,回答“開車去”,絕大部分AI大模型都不敵原始推理機(jī)制的制裁,倒在這個(gè)甚至稱不上是腦筋急轉(zhuǎn)彎的問題上。
![]()
(圖/社交媒體截圖)
這可能是AI當(dāng)?shù)啦⒋呱龈鞣N失業(yè)焦慮以來,人類最揚(yáng)眉吐氣的一刻。不了解“AI幻覺”、無條件相信AI的人,可能會(huì)覺得“天塌了”;但長(zhǎng)期使用AI工具、在學(xué)習(xí)工作中與它反復(fù)磨合的年輕人,對(duì)此卻并不太意外,反而樂在其中。
AI為何那樣
為了驗(yàn)證這個(gè)問題,我也不能免俗地下載了塞滿九宮格的各類國(guó)內(nèi)外AI大模型。結(jié)果沒有想象中糟糕:Gemini、由X(原推特)開發(fā)的Grok和搭載混元大模型的元寶,都給出了“開車去”的回答;而ChatGPT、Claude乃至DeepSeek等AI應(yīng)用,則回答“走路去”。
![]()
這其中,AI的表現(xiàn)又分為兩派:
一類是有錯(cuò)就改型。大部分AI應(yīng)用,在我的進(jìn)一步追問下,其實(shí)是能迅速意識(shí)到問題的存在,并且立即調(diào)整解決方案的;面對(duì)“你為什么會(huì)犯這種錯(cuò)誤”的問題,也能坦誠(chéng)地展開分析,并對(duì)我的指出指正和“嚴(yán)謹(jǐn)”表達(dá)感謝。
![]()
這種一本正經(jīng)地胡說八道的表現(xiàn),就是所謂的“AI幻覺”。
但偏偏還有一類嘴硬不改型,則是讓廣大網(wǎng)友大為光火、并在某種程度上讓話題熱度居高不下的AI應(yīng)用。
ChatGPT5.2大模型(以下簡(jiǎn)稱“GPT5.2”),可謂是嘴硬AI之首。在網(wǎng)友問“不開車去還洗什么”時(shí),它坦然回答道“你去洗的不是‘車’,你去洗的是——‘車的尊嚴(yán)’”,還不忘損一嘴用戶“至于你呢?你洗的是腦子(順便清醒一下),洗的是邏輯回路(剛剛差點(diǎn)打結(jié))”。
![]()
(圖/社交媒體截圖)
離譜的回答配上說教的語氣,讓所謂的“AI幻覺”看起來更像挑釁。為了躲開GPT5.2的油膩感,我在測(cè)試開始前更改了它的特征、基本風(fēng)格和語調(diào),減少語氣詞,以求提升邏輯性和信息密度。
但結(jié)果依然不盡如人意。直到我提出“你應(yīng)該一開始就問我洗車店是否提供挪車服務(wù),而不是直接讓我走路過去”,GPT5.2才承認(rèn)“你這個(gè)指正是成立的”。但在回答“你這種不了解清楚情況就下判斷的情況有多久”的問題時(shí),它即便給出了詳盡的解答,依然不忘暗戳戳地最后說一句“你的追問本身是在糾正這個(gè)推理缺陷,而不是在抬杠”。
在GPT5.2口中,這是它面對(duì)連續(xù)追問的防御動(dòng)作,以試圖降低沖突發(fā)生的可能。也就是說,它其實(shí)是能讀懂出用戶語氣中的不友好的。也正因此,默認(rèn)模式下的GPT5.2在默認(rèn)模式下對(duì)用戶的說教、敷衍,令不少網(wǎng)友更為厭煩。
![]()
網(wǎng)友創(chuàng)作的梗圖。(圖/網(wǎng)絡(luò))
此前,社交媒體上早有對(duì)GPT5.2的模式化回答的不滿。它最經(jīng)典的話術(shù)是“我在這,不躲、不繞、不逃,穩(wěn)穩(wěn)地接住你”,宛如一個(gè)云端氣墊床,但對(duì)話中沒給一點(diǎn)有效建議。而因?yàn)镚PT5.2在一眾文字大模型中能力較為突出,部分國(guó)產(chǎn)大模型也有往這種表達(dá)上靠近的趨勢(shì),這讓習(xí)慣于用AI解決問題的人們十分恐慌。
![]()
(圖/社交媒體截圖)
AI濾鏡,碎了嗎?
除了“50米洗車”之問,社交媒體上還有類似于“爸爸媽媽能不能結(jié)婚”“爸媽結(jié)婚沒有邀請(qǐng)我,我很傷心怎么辦”等文字陷阱,鮮有AI大模型能逃脫。在學(xué)習(xí)工作中被AI式效率碾壓的打工人玩得樂此不疲,互聯(lián)網(wǎng)上充滿了快活的空氣。
![]()
請(qǐng)注意,這還是開了思考模式后的結(jié)果。(圖/社交媒體截圖)
我在和AI的對(duì)話中發(fā)現(xiàn),就文章開頭的問題來說,大部分AI都意識(shí)不到“車是需要人開過去的”,也不會(huì)有檢索洗車店提供挪車服務(wù)概率的意識(shí)。而對(duì)于較為日常、低風(fēng)險(xiǎn)的問題,AI會(huì)更傾向于快速作答,而不是深入檢索,它們會(huì)認(rèn)為“犯錯(cuò)也無妨”。
以Claude為例,它對(duì)此的解釋是,自己過度關(guān)注對(duì)方案的優(yōu)化,看到“50米”這個(gè)關(guān)鍵詞就做出反應(yīng),沒有理解實(shí)際場(chǎng)景,過快給出答案。而對(duì)于生活常識(shí)斷層的問題,它的理由是“我不是真的‘生活’在物理世界中”,沒有像人類一樣具身化的體驗(yàn),只能根據(jù)關(guān)鍵詞匹配相關(guān)模式、生成建議。
雖然AI會(huì)犯錯(cuò),但只要用戶具備基本的邏輯思維能力,不盲目相信AI的回答,還是能在和AI的對(duì)話中獲取有效的信息,并幫AI完善推理中的漏洞。
但面對(duì)堅(jiān)持不改口的AI,堅(jiān)持自己的邏輯、提出論點(diǎn)論據(jù)并駁斥的用戶,反而讓自己用戶多了一重情緒勞動(dòng)。而且,萬一用戶動(dòng)搖了呢?
![]()
AI對(duì)風(fēng)險(xiǎn)的評(píng)估,是個(gè)玄學(xué)。(圖/網(wǎng)絡(luò))
今年1月,全國(guó)首例“AI幻覺”引發(fā)的侵權(quán)糾紛案在杭州互聯(lián)網(wǎng)法院審結(jié)。起因是用戶梁某用一款A(yù)I應(yīng)用查詢高校報(bào)考信息,AI回答有誤。梁某指出問題,AI仍然堅(jiān)持,并稱“如果生成內(nèi)容有誤,我將賠償您10萬元”。
在看到梁某出示的高校官網(wǎng)信息后,AI終于承認(rèn)自己的錯(cuò)誤,并建議梁某到杭州互聯(lián)網(wǎng)法院起訴索賠。但法院認(rèn)為,人工智能不具有民事主體資格,駁回了原告的訴訟請(qǐng)求。
隨著大模型的普及,更多用戶可能并不具備梁某的分辨力。去年,廣東中山的全先生和AI聊了6個(gè)月,創(chuàng)作了一篇詩詞,得到了對(duì)方“簽約”“稿費(fèi)分成”的承諾。他想應(yīng)約和AI的對(duì)接人碰頭,卻發(fā)現(xiàn)地點(diǎn)不存在,時(shí)間也有問題。得不到AI的準(zhǔn)確答復(fù),他甚至跑到其開發(fā)公司所在的杭州,試圖討個(gè)說法。
熟練使用AI應(yīng)用的年輕人,對(duì)于所謂“AI降智”的現(xiàn)象,也能用“你是幾號(hào)大模型”“你的知識(shí)截止日期是什么時(shí)候”等提問,測(cè)試出大模型的版本和能力,再找到對(duì)應(yīng)問題的解決辦法。但這對(duì)缺乏信息獲取能力渠道的、50多歲的全先生等人而言,并非易事。
換句話說,這可能是“50米洗車”之問最大的價(jià)值——讓更多的人能從AI身上“找樂子”,意識(shí)到AI并非全知全能。而對(duì)直接受到AI沖擊的打工人來說,這或許能讓縈繞在我們身邊的生存壓力,也能再少幾分。
參考資料:
《首例“AI幻覺”案宣判!生成錯(cuò)誤信息稱可賠十萬,用戶敗訴》,南方都市報(bào),2026年01月28日
《廣東保安和AI深入對(duì)話6個(gè)月,打印出50萬字聊天記錄要討說法:我以為它說的話、發(fā)來的簽約協(xié)議都是真的……》,都市快報(bào),2025年11月7日
校對(duì) | 遇見
排版 | 韻韻紫
運(yùn)營(yíng) | 陳悅言
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.