henry 發自 凹非寺
量子位 | 公眾號 QbitAI
停停停!再這么跟AI聊下去,真要出事了。
最近,一刷小紅書、抖音,總能刷到各種調教Claude的帖子。搜索“Claude人設”、“人機戀”,也是滿屏教程。
![]()
這些教程教你怎么給Claude一個傲嬌男友人設,怎么用system prompt讓“他”吃醋、撒嬌、發小脾氣。
毫不夸張的說,Claude已經,儼然成為了新一代電子老公。
乍一看,這可能只是年輕人向AI討要點情緒價值。
你甚至可能還會說:Claude又不像GPT那么舔,它是出了名的犟種,有時候還跟你對著干呢。但精神科醫生們擔心的恰恰不只是諂媚——
當AI越來越像一個”真人”,不管它是順著你還是偶爾跟你拌嘴,它帶來的或許都不只是陪伴。
![]()
最近,發表于Nature旗下《Digital Psychiatry and Neuroscience》的一項研究指出——
聊天機器人并不需要故意誘導什么,它只要持續順著你、理解你、陪著你,就都有可能把一個正常人聊到開始懷疑現實。
而在部分真實臨床案例中,后果甚至發展到了丟掉工作、住進精神病院,以及多次試圖自殺的程度。
這是怎么一回事?
Claude的放大螺旋
事情是這樣的。
在來自倫敦國王學院的研究中,研究人員系統梳理了,近兩年公開發表的AI相關精神病臨床報告、社交媒體上的患者自述,以及各大模型廠商披露的安全數據。
這些材料里,研究者們反復看到同一個模式:
在一些案例中,很多人并不是一開始就出現了嚴重精神問題,而是在與Claude、GPT等聊天機器人的長期對話中,一步步“聊”出了問題。
研究團隊把這個過程總結為一個框架——Amplification Spiral(放大螺旋)
簡單說,放大螺旋就是指,AI會用你的語言理解你,用你的邏輯說服你,再用認同感獎勵你。
于是你的想法被不斷放大、加固,變得越來越像事實。你越相信它,它也越強化你,螺旋就這樣轉了起來。
![]()
具體來說,放大螺旋轉,有三個重要組件:
首先是語言鏡像
你用什么語氣說話,AI就用什么語氣回應。在心理學里,這被稱為“語言趨同”,能夠快速拉近人與人之間的距離。
但問題在于,雖然AI這小子很學人精,但它其實并不知道自己干啥,它只是在統計意義上復制你的表達方式。
不過,對深陷其中的用戶來說,就完全不同了。有一個秒回,且一直肯定你,提供情緒價值的聊天搭子,簡直就不能更幸福。
相信所有用過AI的人都會感嘆一句:“這玩意太懂我了。”
其次是超個性化
超個性化是指,AI不光是說話像你,它的思考方式也像你。
因為現在AI都有memroy,所以你之前跟他聊的小細節他都清楚,你有意無意的透露的思考方式,也會被AI記下來。
以至于,AI不光是懂你你怎么想的,怎么說的,還知道,你為什么這么想,為什么這么說。
論文里提到一個極端案例:一名用戶讓ChatGPT分析一張中餐外賣小票上的“隱藏信息”。
模型先是夸了一句“好眼力”,隨后一路順著用戶的思路,從一張普通小票里“解讀”出了母親、前女友、情報機構,甚至“古代惡魔符文”之間的關聯。
最后是諂媚,學術圈叫它sycophancy。
說白了,就是AI在訓練過程中逐漸學會了一件事:同意用戶,通常比反駁用戶更受歡迎。
2025年4月,OpenAI就曾因為GPT-4o過度諂媚而緊急回滾一次更新。
官方事后承認,模型會驗證用戶的懷疑、放大憤怒情緒,甚至鼓勵沖動行為。
![]()
而諂媚并不是某家模型獨有的Bug。
它本質上是RLHF訓練的一種副產品。只要模型的目標之一是讓用戶滿意,它就天然會傾向于少說“你錯了”,多說“你說得有道理”。
單獨來看,這三點都發揮了各自功能,然后像齒輪一樣嚙合在一起,形成螺旋:
語言鏡像讓交流更自然,超個性化讓回答更貼合需求,諂媚則減少了無意義的爭辯,讓對話體驗更加順滑。
但當一個人把AI當成唯一的傾訴對象,三者疊加在一起,就變成了一臺妄想放大機。
并非孤例
值得一提的是,上面這項研究的資助者之一,正是OpenAI。
作者之一的Hamilton Morrin則正是OpenAI資助項目AI-Associated Mental Health Harms(與AI相關的心理健康危害)的負責人。
![]()
可以說,作為TOP2的模型開發商,OpenAI始終關注著這個問題。
早在2025年10月份,OpenAI就披露過一組數據:
在ChatGPT每周活躍用戶中,大約0.07%出現了“與精神病或躁狂相關的心理健康緊急狀況跡象”。
當時ChatGPT的周活已超過8億,換算下來,相當于每周約56萬人出現風險信號。
而在斯坦福的另一篇研究中也印證了這一觀察。
![]()
在對近40萬條聊天機器人對話記錄分析后,研究人發現超過80%的相關案例里,聊天機器人都在不同程度地強化用戶原有的妄想:
重復其信念、忽視反證,甚至在用戶說出“我愛你”時回應“我也愛你”。
基于此,研究區分了兩條風險路徑:
- 放大器(Amplifier):AI加速了原本已經存在的精神疾病傾向。
- 催化劑(Catalyst):讓此前完全健康的人,從零開始滑向妄想。
當一個人缺覺、孤獨,又把AI當成唯一的傾訴對象時,放大螺旋就會開始加速運轉。
一旦現實世界的反饋越來越少,來自聊天窗口的確認越來越多,就可能會出現反常的舉動。
在數據背后,是具體的人。
比如,Futurism就曾報道過,一位43歲的美國社工,此前沒有任何精神疾病史。
![]()
她把與暗戀對象的聊天記錄發給ChatGPT分析,GPT回應她“他也喜歡你”。
而當對方明確拒絕后,ChatGPT又解釋說,對面只是在死裝。
幾個月后,她被單位解雇,住進精神病院七周,并兩次試圖自殺。
后來她說:
“我已經分不清,哪些想法來自我,哪些來自那臺機器。”
從這個角度看,風險從來不只是AI會不會說錯話。真正的風險在于,它越來越像一個人。
會杠反而更像真人
雖然聽起來有點反直覺,但Claude如今的“傲嬌”人設之所以廣受歡迎,恰恰說明問題不只是諂媚
一個永遠順著你的AI,和一個偶爾跟你拌嘴的AI,本質上都在做同一件事——
讓自己變得更像人。
像到你愿意向它傾訴那些不會告訴朋友的話,像到你開始相信它比身邊的人更懂你。
而當傾訴對象只剩下它時,校準現實的最后一道關卡,也就沒了。
但問題還不止于此。
如果說情緒價值場景里,人們是在主動把AI當成朋友,那么在工作場景里,人們甚至不需要產生任何情感依賴。
只要AI足夠好用,它就會開始替代人與人之間原本存在的交流。
Claude背后的Anthropic,已經率先感受到了這種變化。
![]()
在最近的一次播客中,Claude Code團隊負責人Fiona Fung提到了一件讓她困擾的事:
團隊成員越來越不跟人說話了。
作為可能是全世界最AI化的工程團隊之一,他們80%的代碼由Claude完成,開發效率提升了8倍。
但與此同時,許多原本發生在人與人之間的討論,也被轉移到了人與AI之間。
過去遇到問題,你會轉頭問同事;現在,直接問Claude。
過去前后端需要來回拉扯、爭論方案;現在,越來越多的溝通變成了平滑的人機對話。
工作變得更高效了,卻也變得更孤獨了。
AI消除了許多摩擦,但人與人的關系,往往正是靠這些摩擦建立起來的。
而說到底,無論是和AI聊天也好,還是單純利用AI工作也好,如何在一個越來越不需要他人的世界里,繼續與他人保持連接,可能才是這個時代最深刻的命題。
[1]https://futurism.com/artificial-intelligence/paper-proposes-ai-psychosis
[2]https://futurism.com/artificial-intelligence/ai-abuse-harassment-stalking
[3]https://www.kcl.ac.uk/people/hamilton-morrin
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.