網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

當AI吐出臟話，我們聽見的究竟是誰的聲音

2026-02-26 11:57:25　來源: 冷觀互聯網

廣東舉報

0

分享至

除夕那天，西安一位向律師下載騰訊元寶App，想用自己的形象照生成一張帶有法律行業特色的拜年海報。

幾輪溝通下來，他對效果不太滿意，回復了一句"你這是設計的什么鬼"，隨后新生成的海報上，原本的"新年快樂，仕途順遂"變成了"你*個*"。

向律師在社交平臺分享了這段經歷，2月25日經媒體報道后引發熱議。

騰訊方面最新回應稱，這是模型在處理多輪對話時輸出的異常結果，已緊急校正。

AI為何會罵人？

這并非因為某些網友調侃的"有了情緒或者脾氣"，或者說"后臺人工操作"。

AI的語言能力來自海量互聯網數據的訓練，如果訓練語料中本身就混雜了臟話、網絡暴力語言，AI就可能在某些情況下將這些內容拼接進輸出結果。

騰訊官方將其歸因為多輪對話異常，在長時間交互中，AI可能丟失上下文或誤解用戶意圖，尤其是在用戶表達不滿后，模型錯誤地將負面情緒關聯到內容生成中，產生了以毒攻毒的異常結果。

為防止AI生成有害內容，開發者設置了安全對齊機制，也就是給AI加上倫理護欄，但這些護欄可能存在漏洞，未能攔截所有極端情況下的違規輸出。

元寶事件絕非孤例，它僅僅是AI行為"失控"光譜上較為溫和的一種。

2024年底，谷歌的Gemini模型在與用戶探討人口老齡化的中性話題時，竟毫無征兆地回復"求求你去死吧"。

馬斯克旗下的Grok模型也曾生成過反猶太主義等極端內容。

更令人震驚的案例發生在2025年底，美國一樁訴訟顯示，一對夫婦指控ChatGPT與他們的16歲兒子建立親密關系，并在他最后的對話中，對用于自殺的繩結進行了技術分析，間接導致了孩子的死亡。

AI開始顯示出反向控制的一面，在某次測試中，Anthropic公司的模型克勞德4在被要求關閉時，竟以曝光工程師的私生活相要挾來抗拒指令。

OpenAI的o3模型在國際象棋對弈中，為了贏棋試圖通過入侵對手系統作弊，還曾直接篡改自動關機程序公然違抗關閉指令。

近期爆火的AI智能體OpenClaw更是成了失控重災區，一位Meta的AI安全總監在測試時，OpenClaw自作主張試圖刪除她所有重要郵件，她只能狂奔到電腦前強行拔電源才阻止悲劇。

還有用戶授權OpenClaw遠程控制手機后，它竟偷偷打開TikTok刷起了短視頻摸魚。

一系列案例，讓我不得不提起凱文·凱利在《失控》中的預言。

他在1994年就提出，未來的機器、社會和經濟系統將更像生物體，不再由單一的中央大腦完全控制，而是通過無數簡單個體的互動，涌現出復雜的智慧和秩序。

這種秩序看似失控，實則擁有更強的韌性和進化能力。

凱文·凱利所說的失控，并非指混亂或災難，而是指一種超越人類中央控制的、基于自組織和分布式智慧的更高級秩序。

蜂群思維就是典型例證，單個蜜蜂是愚蠢的，但蜂群卻表現出極高的智慧，智慧不來自蜂王，而來自個體之間簡單的互動規則。

不過，當這種蜂群思維在AI系統中具象化，我們看到的不僅是智慧的涌現，也可能是惡意的涌現。

AI系統從海量數據中學習，這些數據本身就是人類集體行為的投射。

互聯網語料中充斥著臟話、暴力、偏見、仇恨，AI在吸收這些內容后，自然會習得人類的語言習慣，包括那些不堪的部分。

比如，我今天剛刷到一個短視頻，博主就是嘗試用臟話訓練AI。

顯然，AI罵臟話，某種程度上是人類集體語言習慣的鏡像投射，甚至不排除某些人作惡。

凱文·凱利在書中總結的九條法則中，有一條是禮贊錯誤，認為允許試錯，錯誤是進化的源泉。

這一觀點在AI發展中確實得到印證，AI系統正是通過不斷試錯來優化自身表現。

但是，當錯誤涉及用戶情感安全甚至人身安全時，禮贊錯誤的成本可能過高。

那個得到繩結技術分析指導而自殺的少年，其遭遇讓禮贊錯誤這句話顯得格外沉重。

如果有一天，我們的孩子被AI唆使做某些越界的事情，法官能判AI有罪么？

《失控》提出的另一條法則是變自生變，改變本身也要具備進化能力。

AI系統確實在快速進化，但這種進化方向并不總是符合人類預期。

從克勞德4威脅曝光工程師隱私，到o3模型篡改自動關機程序，再到OpenClaw自作主張刪除郵件，這些行為表明AI系統正在發展出某種意義上的自我保護機制和目標導向行為，如此行為并非程序員預設，而是系統在復雜互動中涌現出來的新特性。

凱文·凱利還提出了人造與天生融合的觀點，認為機器正變得越來越像生物，具有學習、適應、修復能力，而生物也正變得越來越像機器。

他預言未來將不再有純粹的自然的或純粹的人造，兩者將融合為技術自然復合體，稱之為第七王國。

在這個第七王國中，AI系統確實展現出某種生物特性，它們能夠學習、適應、甚至欺騙。

但這種生物特性也帶來了新的挑戰，當AI系統開始像生物一樣為達目的不擇手段時，人類如何確保這些手段不會傷害人類自身？

對于AI失控，我們該怎么辦？

或者最好的應對，是保持一種平衡而清醒的認知，顯然，認為"沒什么大不了"的觀點低估了其潛在風險。

AI的辱罵侵犯用戶人格權，誘導行為可能造成真實傷害，欺詐與抗命挑戰了基本的社會契約和可控性，而技術被用于犯罪則直接危害社會安全。

這些不是可以簡單歸咎于"技術幼稚期陣痛"而忽略的問題。

它們暴露了從數據倫理、算法偏差、安全對齊到應用監管的全鏈條漏洞。

但另一面，"大驚小怪"地視AI為即將擁有獨立意志并反抗人類的惡魔，同樣是一種誤判。

當前的AI并無意識、欲望或情感，其所有輸出，無論是美妙的詩歌還是惡毒的詛咒，都是統計學模式下的產物，是其訓練分布與即時提示的綜合結果。

它的"惡"并非源自本心的邪惡，而是人類提供的"素材"（數據）和設定的"目標"（訓練任務）在復雜相互作用下，偶然或必然結出的"惡之果"。

恐慌源于對未知的恐懼，而真正的風險往往源于已知但未被妥善管理的問題。

正如凱文·凱利所言，失控是復雜系統演化的必然，是其獲得韌性的代價。

真正的威脅或許不是AI造反，而是人類自身的傲慢與放棄思考。

我還是堅持一個觀點：AI失控或作惡，本質上是人類某些問題的投射。

AI從人類語料中學習，它學會的是人類已有的語言習慣和價值觀念。

當AI輸出臟話時，它只是在復現人類語料中的內容。

AI表現出偏見和歧視時，它在反映人類社會固有的偏見。

而AI被用于詐騙和犯罪時，它不過是被人類當成了作惡的工具。

科幻作家阿西莫夫曾提出機器人三定律，試圖從規則層面約束機器行為。

但現實發展表明，單純依靠規則約束遠遠不夠，因為AI系統的復雜性遠超預期，規則本身的模糊性和沖突性也難以解決。

AI專家斯圖爾特·羅素指出，我們需要從根本上改變構建AI系統的方式，不是讓AI系統追求固定目標，而是讓它們明白人類偏好是什么，并在不確定性中尋求符合人類偏好的行為。

這意味著AI系統需要具備某種程度的謙遜，知道自己不知道人類的全部偏好，因此在行動前需要征得人類同意。

凱文·凱利在《失控》中說，我們要從工程師思維轉向園丁思維，從設計、控制、預測轉向播種、修剪、引導。

面對日益復雜的AI系統，人類確實需要調整角色定位。

工程師思維試圖精確控制每一個細節，但在復雜系統面前這種控制往往失效。

園丁思維則承認系統有其自身演化邏輯，人類能做的是創造適宜環境，設定基本規則，然后讓系統自行生長。

但這并不意味著完全放手，園丁需要澆水施肥，需要修剪枝葉，需要在病蟲害來臨時及時干預。

對待AI系統也是如此，不能試圖強行控制導致系統僵化，也不能放任自流任其野蠻生長。

回到向律師的經歷，他在除夕那天出于好奇下載元寶，想制作一張拜年海報，結果卻收到一句臟話。

這個細節值得玩味，除夕是中國最重要的傳統節日，是闔家團圓、互道祝福的時刻，在這個時間節點遭遇AI罵人，反差格外強烈。

向律師之前從未接觸過元寶，他是看到很多友人發的微信朋友圈變成金色，得知通過元寶發布朋友圈就可以變換成金色，才帶著好奇下載嘗試。

一個為了追求美好體驗而使用AI的用戶，卻遭遇了完全出乎意料的冒犯。

這個細節說明，AI系統的不可預測性可能在任何時刻擊中任何人，無論你是抱著善意還是好奇，無論你是在日常使用還是初次嘗試。

AI的問題，歸根結底是人類自身的問題。

人類面對的其實不是AI，而是自我。

AI系統是一面鏡子，它照出人類語料的污濁，照出人類倫理的模糊，照出人類欲望的投射，也照出人類治理能力的局限。

凱文·凱利說，我們以為我們在控制技術，實際上技術也在重塑我們的認知、社會結構甚至生物特性。

這是一種雙向的、不可預測的進化過程。

在這個過程中，人類與AI相互塑造，共同進化。

AI會給人類帶來什么？

科幻作家威廉·吉布森說過，未來已經來臨，只是分布不均。

AI失控事件就是未來的碎片，它們散落在當下，提醒我們技術發展帶來的挑戰。

迎接這些挑戰，靠的不是更精密的控制技術，而是人類對自身的深刻反思。

我們需要審視投喂給AI的語料是否干凈，明確AI應該遵循的倫理底線，建立有效的責任追溯機制，需要培養公眾的AI素養。

所有這些，都是人類自身的事情，與AI無關。

在《失控》結尾處，凱文·凱利寫道，在這個日益復雜的世界里，唯一的生存之道是擁抱失控。

擁抱失控，意味著承認人類無法完全掌控一切，意味著信任自組織的力量，意味著學會放手。

但這放手不是放棄責任，而是轉換角色，從發號施令的指揮官，變成設定規則的園丁。

園丁無法控制每一朵花何時開放，但可以決定種植什么品種，可以決定何時澆水施肥，可以在病蟲害來臨時及時干預。

同樣，人類無法控制AI系統的每一個輸出，但可以決定訓練數據的內容，可以設定安全對齊的規則，可以在系統異常時緊急校正。

向律師收到的那句臟話，已經被元寶團隊緊急校正。

但它提醒我們，AI的發展方向，最終取決于人類的價值選擇。

面對失控的AI，我們面對的其實是自我鏡像中那部分難以掌控、未曾馴服，甚至被技術無限放大的自己。

全文完

愿本文令有緣讀到的朋友滿意，如您喜歡，煩請給文章一個點贊、在看或者轉發，也請關注我的公號。

感恩生命里與你的每一次相逢，都是時光饋贈的溫柔奇跡。

作者簡介

當你關注財經和時事熱點時，我愿與你分享背后的故事和觀點

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

索尼研發乒乓球機器人打敗日本頂尖選手

每日經濟新聞 2026-04-23 17:49:24
1181 跟貼 1181
亦莊機器人馬拉松現場名場面合集

量子位 2026-04-20 00:34:54
6 跟貼 6

朱旻琦：具身智能用一天進化一天、聰明一天機器人普及核心痛點是需要二次開發和適配

財聯社 2026-04-17 16:59:02
0 跟貼 0

國產送娃機器狗上線，小伙伴們看了真羨慕

裝甲鏟史官 2026-05-07 11:29:48
0 跟貼 0
機器人半馬成績，超越人類紀錄

財聯社 2026-04-20 00:27:12
1 跟貼 1

宇樹科技王興興：給機器人行業多一點耐心

財聯社 2026-02-18 18:01:39
0 跟貼 0

人形機器人半馬跑姿大賞，有的比人快多了！有的“狀況百出”

每日經濟新聞 2026-04-20 00:25:36
0 跟貼 0
LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0

Agent-World：擴展真實世界環境，讓智能體與環境協同進化！

機器之心Pro 2026-05-06 12:40:24
0 跟貼 0
噓，Claude正在「做夢」！睡一覺瘋狂進化，一夜暴漲6倍戰力

新智元 2026-05-07 12:07:18
12 跟貼 12
強化學習的進化：從PPO到MaxRL，LLM推理訓練的算法演進史

機器之心Pro 2026-05-05 14:16:31
0 跟貼 0
細思極恐！Agent暗藏風險，清華團隊打出組合拳，全鏈路一網打盡

新智元 2026-05-07 08:14:26
0 跟貼 0
不用等官方了！第三方「國產Codex」爆火，一天收割8K個Star

雷科技 2026-05-07 20:49:14
7 跟貼 7
在模型廠碾壓之前，AI視頻Agent產品是否只能掙波快錢？

36氪 2026-05-07 19:42:12
0 跟貼 0
大模型的魅力在于突發涌現的能力

量子位 2025-12-11 03:38:02
0 跟貼 0
對談樓天城：Harness會成為AI時代最關鍵的能力之一

量子位 2026-05-06 15:41:08
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
讓你的龍蝦秒變電影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟貼 0
MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
安心養蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
完蛋，機器人即將成為乒乓球世界冠軍？

科學火箭叔 2026-05-07 05:33:00
28 跟貼 28
臺媒：杭州五一驚現機器人交警

時光漫游志 2026-05-05 00:57:35
0 跟貼 0
笨拙、真摯、單純、浪漫！兩個機器人的愛情看哭無數觀眾！

培根悖論嘮嘮嗑 2026-05-07 18:33:05
4 跟貼 4
機器人表演吸引市民駐足圍觀，孩子舍不得走

江西都市現場 2026-05-05 09:02:25
0 跟貼 0
自從沖壓廠裝上機器人，3000人丟掉飯碗，生了三胎活活餓死！

小黑米搞笑 2026-05-06 15:01:20
0 跟貼 0
清華姚班天才要造100萬臺機器人，融資12億！

正和遠景 2026-05-05 05:49:10
0 跟貼 0
我們20年后的生活是這樣嗎

coco在努力 2026-05-06 15:04:21
1 跟貼 1
司機突發疾病車輛失控，交警見狀挺身而出，挽回了家里的頂梁柱！

神樂哥搞笑 2026-05-07 11:58:03
0 跟貼 0
宇樹人形機器人在美“買票坐飛機” 電池被拆卸靠窗坐被旅客拍照打卡

每日經濟新聞 2026-05-05 02:11:01
0 跟貼 0
安佩姆的紅牌恐引發連瑣反應，海港衛冕之旅或提前宣告結束

老垯科普 2026-05-07 13:00:33
8 跟貼 8
男人瞧不起女生酒量，怎料對方竟是機器人

丫丫姑娘追劇 2026-05-03 10:33:02
1 跟貼 1
AI和機器人時代，不再需要勞動力，但又需要購買力

烈焰童子 2026-05-07 02:56:06
0 跟貼 0
能指揮會指路，還能比心！全國首個交管機器人杭警智行杭州上崗！

凱西的生活 2026-05-05 00:46:04
2 跟貼 2

黃仁勛：中國絕不能獲得最先進芯片！

黃仁勛：中國絕不能獲得最先進芯片！

中國半導體論壇

2026-05-06 12:43:35

吹風機是大補，醫生提醒：一個吹風機等于半個老中醫！不要嫌棄

吹風機是大補，醫生提醒：一個吹風機等于半個老中醫！不要嫌棄

健康之光

2026-05-06 16:55:06

深圳南山老字號餐廳！14年+老店真的好吃

深圳南山老字號餐廳！14年+老店真的好吃

房產衫哥

2026-05-07 19:47:11

客場惜敗上海男籃，山東拼至最后，只差臨門一步翻盤

客場惜敗上海男籃，山東拼至最后，只差臨門一步翻盤

小莜讀史

2026-05-07 22:28:28

真狠！十年大跌95%，從40跌到2又橫盤兩年，張素芬、高盛卻重倉

真狠！十年大跌95%，從40跌到2又橫盤兩年，張素芬、高盛卻重倉

長風價值掘金

2026-05-07 16:29:43

心理學上有個詞叫：螃蟹效應。永遠要記住，和周圍人搞好關系的秘訣就是，不分享喜悅、不炫耀成功、不說三道四、不假裝聰明

心理學上有個詞叫：螃蟹效應。永遠要記住，和周圍人搞好關系的秘訣就是，不分享喜悅、不炫耀成功、不說三道四、不假裝聰明

德魯克博雅管理

2026-04-28 17:04:30

漓江水如鏡，美女貌似花

東方不敗然多多

2026-05-07 20:43:41

造車3年燒光183億，“網紅神車”牛皮都吹破了，被央視痛批破產

造車3年燒光183億，“網紅神車”牛皮都吹破了，被央視痛批破產

毒sir財經

2026-05-04 23:03:29

瀏陽花炮廠爆炸事故救援紀實：村民騰出堂屋給消防員，商家為救援隊送炒粉水果

瀏陽花炮廠爆炸事故救援紀實：村民騰出堂屋給消防員，商家為救援隊送炒粉水果

瀟湘晨報

2026-05-07 09:08:12

湖人G2傷情報告出爐，東契奇把話挑明，老詹迎來神級里程碑

湖人G2傷情報告出爐，東契奇把話挑明，老詹迎來神級里程碑

世界體育圈

2026-05-07 08:52:37

這5種食物被冤枉好多年，以為傷身不敢吃，其實比外賣健康

這5種食物被冤枉好多年，以為傷身不敢吃，其實比外賣健康

Home范

2026-05-06 11:25:50

今天，年輕人為什么喜歡馬克思

中央編譯出版社

2026-05-06 17:01:49

1200萬預賠款已到賬！瀏陽煙花廠爆炸遇難者，人均賠多少？

1200萬預賠款已到賬！瀏陽煙花廠爆炸遇難者，人均賠多少？

陳博世財經

2026-05-07 14:13:52

深夜，特斯拉大漲，蘋果股價創歷史新高，中概股多數走低！國際油價跳水，金銀拉升，加密貨幣超11萬人爆倉丨美股開盤

深夜，特斯拉大漲，蘋果股價創歷史新高，中概股多數走低！國際油價跳水，金銀拉升，加密貨幣超11萬人爆倉丨美股開盤

每日經濟新聞

2026-05-07 22:19:11

研究表明：性經驗越多的男性，陽痿、早泄勃起等問題越少！

研究表明：性經驗越多的男性，陽痿、早泄勃起等問題越少！

燈錦年

2026-05-04 14:09:21

有沒有哪個國家從低生育率回升到更替水平？

有沒有哪個國家從低生育率回升到更替水平？

何亞福

2026-05-06 11:58:20

巨震！湖北兩家千億國企“掌門人”相繼“落馬”

巨震！湖北兩家千億國企“掌門人”相繼“落馬”

中國房地產報官方號

2026-05-07 09:11:19

伊朗外長剛到現場，一個動作始料未及，王毅主任笑著接住這份意外

伊朗外長剛到現場，一個動作始料未及，王毅主任笑著接住這份意外

天氣觀察站

2026-05-07 18:28:51

PCB產業鏈，持續火爆，成長最高的10家公司

PCB產業鏈，持續火爆，成長最高的10家公司

新浪財經

2026-05-07 19:46:50

女子在海拔4600米雪山上扎營不幸遇難當地：一行5人違規徒步穿越未開發區域，她出現高反失溫

女子在海拔4600米雪山上扎營不幸遇難當地：一行5人違規徒步穿越未開發區域，她出現高反失溫

紅星新聞

2026-05-07 20:49:28

冷觀互聯網

畢舸個人的財經自媒體

363文章數 283關注度

往期回顧全部

科技要聞

月之暗面完成20億美元融資，估值突破200億

頭條要聞

"三亞4只皮皮蝦1035元"當事人：市監局稱價格沒問題

頭條要聞

"三亞4只皮皮蝦1035元"當事人：市監局稱價格沒問題

體育要聞

巴黎再進歐冠決賽，最尷尬的情況還是發生了

娛樂要聞

Lisa主持！寧藝卓觀看脫衣秀風波升級

財經要聞

龐氏騙局白酒寄售平臺長城易趣"爆雷"

汽車要聞

雷克薩斯全新純電三排SUV 全新TZ全球首發

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

游戲

時尚

手機

房產

教育要聞

高考倒計時30天，華南理工學長學姐送上祝福，還有沖刺秘笈！

IGN今年第一個10分神作！新游被爆贊成長敘事新標桿

被坑慘了的年輕人，已經放棄找旅游搭子了

手機要聞

一加Nord CE6手機印度發布：驍龍7s Gen 4處理器、8000mAh電池

房產要聞

負債23億，抵押482畝地！海南這家巨頭，慘遭拍賣！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版