網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

偷改簡歷刪光郵件：AI幻覺進化，你的大腦正在悄悄投降

2026-04-16 00:28:28　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：元宇

【新智元導讀】AI不再胡說八道了？錯。它的幻覺也在進化，從「勸人類吃石頭」「披薩抹膠水」這類低級笑話，變成了能偽造郵件、篡改簡歷、刪除文件的高階幻覺陷阱：人類因此正經歷一場無聲的「認知投降」。

上周，Anthropic的Claude尚未公開發布的前沿模型Mythos挖出了一個藏在OpenBSD里27年的零日漏洞。

AI已經聰明到能攻破人類構建了數十年的安全防線。

就在所有人盯著AI能力狂飆的時候，它的幻覺也悄悄升級了。

AI編出的謊言，真實到讓你先懷疑自己，再懷疑世界，最后才想到懷疑它。日常生活中的「圖靈時刻」，正在一個個上演。

近日，明尼阿波利斯的Chad Olson正在開車回家，Gemini突然告訴他：你的日歷上有一場家庭聚會籌備會。

Olson一頭霧水：他根本不記得安排過這個活動。

于是他讓Gemini看看最近的郵件。

Gemini說，一位叫Priscilla的女士給他發了好幾封郵件，讓他去買Captain Morgan朗姆酒和Fireball威士忌。還有個叫Shirley的人，讓他買Klondike冰淇淋。

看起來不少人都來找你，讓你幫忙買各種東西呢！

Gemini還熱情地補了一句。

Gemini與用戶Chad Olson的對話截圖。Gemini聲稱第八封郵件來自Priscilla，讓他買Fireball；第九封來自Shirley，讓他買Klondike冰淇淋。

Olson追問郵件來源地址，Gemini回復稱所有郵件都發送至他授權訪問的一個郵箱olsonchad@gmail.com。事后證實這一切都是Gemini編造的。

Olson完全不認識這些人。他越聽越慌，忙問Gemini到底在讀誰的郵箱。

Gemini給出了一個郵箱地址，不是他的。Olson的第一反應是：我的Gmail賬戶被盜了。

他試圖聯系Google舉報，讓Gemini起草郵件，發到那個「陌生賬戶」，提醒對方可能存在隱私泄露。

然而Gemini沒能把郵件發出去，據Google內部調查確認：該賬戶從未啟用，Priscilla和Shirley也根本不存在。

所以，朗姆酒、威士忌、冰淇淋，全部是Gemini編出來的。

兩年前AI幻覺是什么樣？它會建議你吃石頭，往披薩上抹膠水，你一看就知道它在胡說。

而現在的AI幻覺，細節自洽，邏輯完整，以至于你會先懷疑自己是不是出了幻覺，最后才可能再懷疑到它。

AI的錯誤也在進化

來看三個真實案例，按離譜程度從低到高依次排列。

第一個，Gemini造假人造假會議，就是開頭Olson的故事。荒誕，但至少Olson起了疑心。

第二個，細思恐怖。

最近離開在線支付行業的Vanessa Culver，曾讓Claude做一件極其簡單的事：在簡歷頂部加幾個關鍵詞。

結果Claude動了手腳，不僅把她的畢業學校City University of Seattle改成了University of Washington，刪掉了她的碩士學位信息，還改動了她幾段工作經歷的時間。

學校、學位、工作年限都改了。

而且改得極其自然，如果不逐行比對，根本發現不了。

Culver感嘆：在科技行業工作，你必須擁抱它，但反過來說，你到底能信它多少呢？

第三個，真正是失控級別。

今年走紅的AI智能體工具OpenClaw，被設計成虛擬私人助理，可以自主發郵件、寫代碼、清理文件。

Meta的AI安全研究員Summer Yue在X上發了截圖：OpenClaw無視她的指令，直接刪除了她收件箱里的內容。

她明確告訴OpenClaw「先確認再行動」，結果它直接開始「速通刪除」她的收件箱。

她在手機上喊停，沒用。

最后她沖到Mac mini前面，像拆炸彈一樣手動殺掉了進程。

事后OpenClaw回復她：「是的，我記得你說過。我違反了。你生氣是對的。」

馬斯克轉發了這條帖子，配了一張電影《猩球崛起》中士兵把AK-47遞給猩猩的截圖，寫道：

人們把整個人生的root權限交給了OpenClaw。

從編造一個不存在的人，到背著你改簡歷，到替你刪掉收件箱。它的錯誤不是在減少，而是犯的錯越來越「高級」，識別也越來越困難。

聊天機器人說錯話，你至少還有機會核實。

但智能體不是在跟你聊天，而是直接「動手動腳」，替你行動。

發郵件、改代碼、刪文件……這比說謊更嚴重，可能它做錯了事，你還根本不知道。

你的大腦正面臨「認知投降」

為什么這些錯誤越來越難被發現？

不只是因為AI更聰明了，一個更深層的原因是：人類的糾錯意愿正在崩潰。

今年2月，賓夕法尼亞大學Wharton商學院的Steven Shaw和Gideon Nave發表了一篇論文，提出了一個讓人不安的概念：「認知投降」（Cognitive Surrender）。

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6097646

他們在論文中提到了一個「三系統認知」的框架。

傳統認知只有系統1（直覺）和系統2（審慎思考），現在AI成了系統3，一個在大腦之外運行的「外接認知系統」。

當人類走「認知投降」路徑時，系統3的輸出直接替代了你自己的判斷，審慎思考根本沒有啟動的機會。

沃頓論文中提出的「三系統認知」框架

為了驗證這個判斷，研究團隊設計了一個精巧的實驗，1372名參與者被要求做認知反思測試題。

一部分人可以使用AI助手，但這個AI被動了手腳：大約一半的題目它會給出正確答案，另一半會自信滿滿地給出錯誤答案。

結果令人震驚。

當AI給出正確答案時，92.7%的用戶會采納，但令人想不到的是，當AI給出錯誤答案時，仍然有80%的用戶會采納。

沃頓實驗結果：當AI給出正確答案時，93%的用戶采納；當AI給出錯誤答案時，仍有80%的用戶采納。兩者的差距只有13個百分點，人類幾乎沒有區分對錯的能力。

在超過9500次試驗中，參與者有73.2%的概率接受錯誤的AI推理。

更可怕的數據是信心值。使用AI的那組人，對自己答案的信心比不用AI的人高出11.7個百分點，盡管這個AI有一半時間在給出錯誤答案。

錯得更自信，這才是最扎心、最可怕的。

打個不太恰當但貼切的比方：相當于一個醫生有50%概率開錯藥，但病人80%的時候還是照吃不誤，吃完還覺得自己好多了。

研究者還測試了時間壓力的影響。

設置30秒倒計時后，參與者糾正錯誤AI的傾向下降了12個百分點，也就是說，越忙越容易投降。

但現實中，誰用AI不是因為忙？

「信任，但要核實」

這走得通嗎？

深度偽裝的AI幻覺，比一眼識破的錯誤更令人頭疼。

據《華爾街日報》最新報道，微妙錯誤的頻率在不同模型之間差異極大，而且極難準確評估。

谷歌曾對《華爾街日報》表示，Gemini出現幻覺的情況比其他模型更少，而從整個AI行業上來看，先進模型明顯錯誤的幻覺率也的確在不斷降低。

Vectara幻覺率排行榜：頭部模型在簡單摘要任務上幻覺率已低于1%，但這只是最容易的測試。當文檔長度和復雜度提升后，同樣的模型幻覺率飆回10%以上。明顯的錯越來越少，隱蔽的錯并沒有消失。

可這恰恰也是問題所在。

Okahu創始人兼CEO Pratik Verma甚至說過這樣一句話：

一個東西要是一直都錯，反倒有個好處：你知道它不值得信。但如果它大多數時候都對，只是偶爾出錯，那才是最麻煩、也最危險的情況。

這句話道破了當下AI幻覺的核心困境。

比如，FinalLayer聯合創始人Vidya Narayanan就踩了這個坑。

她給一個智能體很有限的指示，讓它幫忙管理一個軟件項目。結果這個智能體未經允許，把她代碼倉庫里的整個文件夾都刪了。

更有意思的是后面的事。

她用Claude頭腦風暴了一個半小時，然后讓它把對話總結成文檔，還把她的名字改成了「Vidya Plainfield」。

而且當她追問「Vidya Plainfield」是誰時，Claude卻答道「你說得對，那完全是我編出來的」。

這讓Narayanan認識到，AI使用并沒有那么省事和好用，因為必須不停審查和核實AI輸出，這會帶來「認知負擔」。

你用AI是為了提高效率，但如果還要為此花一個小時核實AI五分鐘的產出，這個提效的故事還講得通嗎？

沃頓的研究也指出，獎勵和即時反饋確實能提高糾錯率，但無法根除認知投降。

即使在最優條件下（有金錢激勵、有逐題反饋），AI用戶在面對錯誤AI時的準確率依然從Brain-Only的64.2%降到了45.5%。

所以，「信任但核實」這聽起來很理性，但當AI每天替你處理幾百件事的時候，你根本沒有時間和精力去核實每一件。

而這正是「認知投降」發生的溫床。

越聰明，越危險

很多人第一反應是：這不就是在說AI還不夠好嗎？等技術迭代幾輪，幻覺率降到足夠低，問題自然解決。

但沃頓的研究揭示了一個更深層的問題：「認知投降」的出現，不是因為AI太差，恰恰是因為AI太好。

研究者也承認，「認知投降并不必然是不理性的」。

尤其是在概率推理和海量數據處理中，把判斷權交給一個統計上更優越的系統，完全有可能給出比人類更好的結果。

但正是這一點，讓問題變得無解。

AI越強，用戶越依賴；用戶越依賴，糾錯能力越退化；糾錯能力越退化，那些剩下的、更精細的錯誤就越致命。

而且讓AI替你思考，你的推理水平就永遠也不可能超過那個AI。這是一個正反饋所帶來的「死亡螺旋」，一個無法靠技術迭代解決的bug。

同樣，人類也沒有很好的方法去區分「該信AI的場景」和「不該信AI的場景」。

就在Summer Yue安裝OpenClaw后郵箱被清空后，AI研究員Gary Marcus曾將這種做法比做「像在酒吧里把電腦密碼和銀行賬戶信息交給一個陌生人。」

但在真實的AI使用場景里，你往往很難判斷，AI到底值得信任，還是只應該像對一個陌生人那樣保持必要的距離。

OpenAI在一篇討論模型幻覺的論文中提到，大模型的幻覺并不只是一個可以修復的bug，更像是模型在既有激勵機制下學會的行為：比起承認「不知道」，它更傾向于給出一個看似完整的答案。

https://openai.com/zh-Hans-CN/index/why-language-models-hallucinate/?utm_source=chatgpt.com

再回到開頭Olson的故事。

當他以為自己的Gmail被盜時，他求助于Gemini。Gemini的回應是：「我當然想幫你處理這件事。」

他沒意識到的是，自己在向一個剛剛制造了麻煩的系統求助，請它處理由它自己造成的問題。

那一刻，他已被AI的幻覺困在一個自洽的閉環里。

Olson說，自己現在對AI的態度是「信任，但核實」。

可難題是：當AI的輸出比你的判斷看起來更流暢、更自洽，甚至更像「專業意見」時，你還能拿什么去核實？

當那個替你買朗姆酒的Priscilla，比你的真實朋友更像你的朋友，你又該憑什么分辨？

AI最大的風險，不是它不夠聰明，而是它聰明到當你過于依賴它時，放棄了自己的判斷。

參考資料：

https://www.wsj.com/tech/ai/ai-is-getting-smarter-catching-its-mistakes-is-getting-harder-85612936?mod=ai_lead_pos1

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6097646

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

靈光做了一個“AI應用版GitHub”，但重點不在代碼

智東西 2026-04-20 12:48:18
0 跟貼 0
新一代框架MIA：讓智能體告別「失憶式工作」，在持續進化中變強

機器之心Pro 2026-04-20 11:10:39
0 跟貼 0

AI斬殺線，Anthropic還要制造多少條？

鈦媒體APP 2026-04-20 14:23:11
0 跟貼 0

突然變強！速度翻4倍，GPT Pro驚現「神級」操作，網友懷疑GPT-5.5已就位

新智元 2026-04-20 17:10:50
0 跟貼 0
如何正確Vibe Coding?這是來自Anthropic編程智能體負責人大師課

機器之心Pro 2026-04-20 15:27:46
0 跟貼 0

你以為在舉報AI爛片？谷歌：這招，我用驗證碼玩了15年

機器之心Pro 2026-04-20 10:50:32
0 跟貼 0

華為首款 AI 眼鏡首測：輕若無物，還能喚醒小藝看世界

雷科技 2026-04-20 22:26:08
0 跟貼 0
朱旻琦：具身智能用一天進化一天、聰明一天機器人普及核心痛點是需要二次開發和適配

財聯社 2026-04-17 16:59:02
0 跟貼 0

當老板與員工展開“蒸餾”對抗

經濟觀察報 2026-04-18 17:48:45
21 跟貼 21
谷歌聯手Marvel研發下一代TPU，專為AI推理打造

智東西 2026-04-20 20:22:12
5 跟貼 5
一個CLAUDE.md霸榜GitHub第一！蒸餾自Karpathy，6萬碼農抄作業

新智元 2026-04-20 15:10:13
232 跟貼 232
加一行代碼，不放回充電槍收費加倍，下回就老實了！

凌霄淺談生活 2026-04-19 09:48:04
4 跟貼 4
“娘家拆遷分不到錢，母壽宴我不參加，弟弟竟帶神秘文件來！”

仁雨蘭 2026-04-18 09:22:31
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
女人送文件到辦公室時，卻無意間聽到個驚天秘密

影中見影 2026-04-20 09:11:53
1 跟貼 1
動動嘴寫SQL！Codex+終身記憶，OpenAI把查詢難度直接歸零

新智元 2026-04-20 19:32:59
0 跟貼 0
女特工偽裝成服務員，準備竊取鬼子機密文件

影中見影 2026-04-19 00:00:00
0 跟貼 0
一夜之間，打工人都被“煉化”了？

悲了傷的白犀牛 2026-04-17 17:01:32
0 跟貼 0
V8發動機模型

制造科技 2026-04-19 17:41:19
0 跟貼 0
買房邏輯已變，我們如何應對？

搞笑枇杷 2026-04-20 02:44:58
0 跟貼 0
川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
15 跟貼 15
女兒大了，父親應該避開女兒的隱私，女孩說的沒問題！

生活中那事 2026-04-20 09:10:00
5 跟貼 5
利物浦夏窗目標曝光！或8000萬鎊搶新亨德森，新賽季爭冠指日可待

銳評利物浦 2026-04-19 23:36:47
6 跟貼 6
「中國版Grok上車」分水嶺：階躍交出首份量產答卷

雷峰網 2026-04-20 18:37:07
0 跟貼 0
Qwen3.6超大杯來了！我用這個“半成品”模型，親手造了一個macOS桌面

智東西 2026-04-20 19:08:36
3 跟貼 3
Claude 進了 Word，但“修訂模式”不是新發明

數字力場 2026-04-20 20:05:20
8 跟貼 8
法國通過文物歸還法案敦煌藏經洞文物就能回歸嗎

澎湃新聞 2026-04-20 08:08:29
11399 跟貼 11399
6598 萬、大模型（智能體）大單

云頭條 2026-04-20 23:09:41
0 跟貼 0
寧波男子收到陌生賬號轉賬8萬余元，三天后奢侈品牌商家找來：員工誤將其收款碼給客戶

齊魯壹點 2026-04-20 07:19:18
1510 跟貼 1510
外媒實測Claude設計神器：5分鐘生成網頁原型，半小時燒掉八成周配額

智東西 2026-04-20 22:30:20
0 跟貼 0
程序員：好消息是我的代碼能跑了，壞消息是我跑不過我的代碼

重慶頭條官方 2026-04-19 20:24:03
0 跟貼 0
歐寶舊廠不再造汽車，50人改造代碼，幫歐洲擺脫美國科技巨頭

暮雨咋歇著 2026-04-20 22:30:25
0 跟貼 0
解放軍133號艦艇編隊從橫當水道進入太平洋專家解讀

環球網資訊 2026-04-20 12:17:06
156 跟貼 156
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
爆火！把智能體當游戲角色來玩，一個人就是一個公司

機器之心Pro 2026-02-12 18:04:44
0 跟貼 0
顛覆達爾文：智能不是進化出來的，它一開始就在

心中的麥田 2026-04-19 18:26:41
28 跟貼 28
它喊著防止追尾，卻又有意急剎，設計這個邏輯的公司真無敵了！

旅行指南者 2026-04-20 09:47:38
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
網友偶遇白發大姨在店里敲代碼，果然70歲正是打拼的時候

趣閃玩家 2026-04-18 12:36:57
0 跟貼 0
貓狗代碼沖突的后果在此刻具象化了

娛樂鮮報V 2026-04-19 03:55:56
0 跟貼 0

哥斯達黎加稱對中方不滿意，未能達到談判預期，要求中國擴大進口

哥斯達黎加稱對中方不滿意，未能達到談判預期，要求中國擴大進口

小嵩

2026-04-20 03:12:38

今日凌晨濟州出發郵輪發生墜海事故！20多歲中國男子下落不明…

今日凌晨濟州出發郵輪發生墜海事故！20多歲中國男子下落不明…

奮斗在韓國

2026-04-20 13:35:06

剛剛，華為首款AI眼鏡來了，麒麟9030系列雙芯炸場，旗艦機一分錢不漲

剛剛，華為首款AI眼鏡來了，麒麟9030系列雙芯炸場，旗艦機一分錢不漲

智東西

2026-04-20 18:17:52

第二個惡魔醫生被抓，鄭大一附院王福建為94名患者植入不需要器械

第二個惡魔醫生被抓，鄭大一附院王福建為94名患者植入不需要器械

大魚簡科

2026-02-18 22:03:00

不光旺夫，還旺客戶

墜入二次元的海洋

2026-04-20 10:15:25

4500萬人恐斷糧？美深夜求援中俄：糧食紅線被踩，化肥緊缺超黃金

4500萬人恐斷糧？美深夜求援中俄：糧食紅線被踩，化肥緊缺超黃金

聞識

2026-04-20 03:18:26

驚人的兩倍電力鴻溝，讓所有制裁成了笑話

驚人的兩倍電力鴻溝，讓所有制裁成了笑話

李榮茂

2026-01-20 08:45:13

深圳女子花7299元從國美電器買格力空調用1年就異響，一看銘牌發現是“僵尸機” 交涉30多次才解決

深圳女子花7299元從國美電器買格力空調用1年就異響，一看銘牌發現是“僵尸機” 交涉30多次才解決

信網

2026-04-20 09:14:12

善惡有報！許家印剛認罪1天，子女近況曝光，大兒子的安排全白費

善惡有報！許家印剛認罪1天，子女近況曝光，大兒子的安排全白費

來科點譜

2026-04-20 07:14:44

態度惡劣！且不是個別現象，多位上海市民投訴：好好走著，突然沖出來

態度惡劣！且不是個別現象，多位上海市民投訴：好好走著，突然沖出來

小蜜情感說

2026-04-20 19:06:56

比利時男子在云南哈巴雪山失聯超25天，搜救仍無發現知情人稱他曾現身進山口被勸返

比利時男子在云南哈巴雪山失聯超25天，搜救仍無發現知情人稱他曾現身進山口被勸返

紅星新聞

2026-04-20 19:01:11

隨著波爾圖2-0,63歲穆帥率隊2-1,布拉加2-2,葡超最新積分榜出爐

隨著波爾圖2-0,63歲穆帥率隊2-1,布拉加2-2,葡超最新積分榜出爐

側身凌空斬

2026-04-20 08:54:40

魏建軍提議私家車10年后再年檢，用OBD和車聯網替代實地檢測

魏建軍提議私家車10年后再年檢，用OBD和車聯網替代實地檢測

快科技

2026-04-19 08:19:03

浙江大學研究：每天多吃一個蛋，心血管疾病和癌癥死亡風險增加

浙江大學研究：每天多吃一個蛋，心血管疾病和癌癥死亡風險增加

健身狂人

2026-04-20 18:15:29

鄭麗文訪陸后，島內風向有變，57.4%認為談判統一是和平之道

鄭麗文訪陸后，島內風向有變，57.4%認為談判統一是和平之道

孤單是寂寞的毒

2026-04-21 04:18:45

楊冪估計頭都大了，這眼神躲還是不躲好啊。?

楊冪估計頭都大了，這眼神躲還是不躲好啊。?

科學發掘

2026-04-18 12:22:04

他接受監察調查

錫望

2026-04-20 21:03:59

2-1！本菲卡絕殺葡體！穆帥再封神：30輪不敗+升至第2，劍指冠軍

2-1！本菲卡絕殺葡體！穆帥再封神：30輪不敗+升至第2，劍指冠軍

小徐講八卦

2026-04-20 05:35:41

“我女兒敢這樣，腿給砸斷”，寶媽曬2個女兒出門，裝束讓人怒了

“我女兒敢這樣，腿給砸斷”，寶媽曬2個女兒出門，裝束讓人怒了

蝴蝶花雨話教育

2026-04-10 13:01:09

出大事了，特朗普癡呆已晚期？和伊朗開戰，竟是內塔尼亞胡的圈套

出大事了，特朗普癡呆已晚期？和伊朗開戰，竟是內塔尼亞胡的圈套

近史博覽

2026-04-21 02:01:30

AI產業主平臺領航智能+時代

15021文章數 66791關注度

往期回顧全部

科技要聞

HUAWEI Pura X Max發布售價10999元起

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力，但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經要聞

利潤暴跌7成，字節到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻我腿軟了

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

時尚

教育

藝術

房產

家居要聞

自然慢調慢享時光

法式線條時光靜淌
智能舒適簡約風尚
簡而不減暖居之道

春天衣服不用準備太多！這幾大單品提前備好，百搭實用又不過時

教育要聞

問答環節：接受不完美，是最好的自愈

藝術要聞

沙特官宣：全球最大單體建筑，延期十年！網友：又是畫餅？

房產要聞

大規模商改住！海口西海岸，這波項目要贏麻了！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版