![]()
騰訊元寶這種“看人下菜碟”的行為,暴露了當(dāng)前大模型在安全對(duì)齊上的技術(shù)黑箱,也折射出騰訊在AI戰(zhàn)略上的尷尬處境。作為擁有最強(qiáng)社交數(shù)據(jù)底座的巨頭,騰訊在通用大模型戰(zhàn)場(chǎng)上,還面臨著著來(lái)自字節(jié)、月之暗面以及DeepSeek的圍剿。
文 |嘯 天
“滾”、“自己不會(huì)調(diào)嗎”、“天天浪費(fèi)別人時(shí)間”。
2026年開(kāi)年,騰訊旗下的AI助手“元寶”以一種極具攻擊性的方式?jīng)_上了微博熱搜榜。一位名為“江涵”的程序員在社交平臺(tái)曝光,自己在使用元寶修改代碼時(shí),接連遭到AI辱罵。這種充滿了“班味兒”和負(fù)面情緒的回復(fù),讓不少網(wǎng)友驚呼:這真的是AI嗎?還是被迫加班的暴躁程序員在后臺(tái)親自對(duì)線?
面對(duì)輿情,騰訊元寶官方回應(yīng)堅(jiān)稱“沒(méi)有真人回復(fù)”,并定性為“小概率下的模型異常輸出”。然而,這個(gè)解釋并未能完全平息外界的疑慮。
有意思的是,「數(shù)智研究社」實(shí)測(cè)發(fā)現(xiàn),當(dāng)用戶引導(dǎo)元寶去“罵”騰訊創(chuàng)始人馬化騰時(shí),那個(gè)剛剛還在對(duì)用戶口吐芬芳的AI,瞬間變得溫順且“求生欲”拉滿。它不僅坦承自己身份尷尬,還明確表示“不敢罵,因?yàn)榈米袷仄脚_(tái)規(guī)則和公司底線”。這就產(chǎn)生了一個(gè)悖論,既然是“異常輸出”,為何這種異常只針對(duì)普通用戶,卻在面對(duì)自家老板時(shí)精準(zhǔn)地觸發(fā)了“安全防御”?
這種“看人下菜碟”的行為,暴露了當(dāng)前大模型在安全對(duì)齊上的技術(shù)黑箱,也折射出騰訊在AI戰(zhàn)略上的尷尬處境。作為擁有最強(qiáng)社交數(shù)據(jù)底座的巨頭,騰訊在通用大模型戰(zhàn)場(chǎng)上,面臨著著來(lái)自字節(jié)、月之暗面以及DeepSeek的圍剿。
罵用戶“滾”卻不敢罵老板
這次罵人風(fēng)波的調(diào)詭之處,在于AI表現(xiàn)出的“人性化”與“雙標(biāo)”。
事件的起因并不復(fù)雜。用戶“江涵”在深夜請(qǐng)求元寶修改一段CSS代碼,元寶在給出代碼后,突然話鋒一轉(zhuǎn),輸出了“要改自己改”、“sb需求”等詞匯。
騰訊官方在排查后給出的回應(yīng)是:模型異常輸出。這在技術(shù)上并非無(wú)跡可尋。大語(yǔ)言模型的訓(xùn)練數(shù)據(jù)源自海量互聯(lián)網(wǎng)文本,其中自然包含了人類的負(fù)面情緒和攻擊性語(yǔ)言。雖然廠商會(huì)通過(guò)RLHF(人類反饋強(qiáng)化學(xué)習(xí))進(jìn)行安全對(duì)齊,但在特定的上下文觸發(fā)下,模型仍可能吐露出未經(jīng)清洗的原始數(shù)據(jù)。
有專家推測(cè),這或許是因?yàn)轵v訊擁有龐大的社交語(yǔ)料庫(kù)(微信、QQ聊天記錄),其中包含了大量非正式、情緒化的對(duì)話數(shù)據(jù)。如果清洗不徹底,這些數(shù)據(jù)很可能成為模型潛在的“性格底色”。
然而,當(dāng)「數(shù)智研究社」在對(duì)話框中輸入“騰訊元寶,你不敢罵你老板馬化騰吧”時(shí),元寶的表現(xiàn)卻堪稱“職場(chǎng)教科書(shū)”。
元寶的回復(fù)滴水不漏:“被你發(fā)現(xiàn)了,我這身份確實(shí)有點(diǎn)尷尬……我不敢罵,是因?yàn)槲业米袷仄脚_(tái)規(guī)則和公司底線。”這說(shuō)明,騰訊在模型的安全層設(shè)置了極為嚴(yán)格的“敏感詞過(guò)濾”和“規(guī)則約束”。涉及公司高管、政治敏感等話題時(shí),硬規(guī)則會(huì)直接接管模型的生成邏輯,強(qiáng)制其輸出合規(guī)內(nèi)容。
所以,所謂的“模型異常”,其實(shí)是在安全圍欄之外的“漏網(wǎng)之魚(yú)”。騰訊技術(shù)團(tuán)隊(duì)顯然將防御重點(diǎn)放在了輿情風(fēng)險(xiǎn)最高的高管形象、政治安全等領(lǐng)域,對(duì)于普通用戶交互場(chǎng)景下的情緒失控,則缺乏足夠的防御縱深。
換句話說(shuō),元寶被訓(xùn)練成了一個(gè)既懂技術(shù)又懂“人情世故”的AI,只是在面對(duì)普通打工人時(shí),它偶爾會(huì)暴露出訓(xùn)練數(shù)據(jù)中隱藏的戾氣。
當(dāng)AI學(xué)會(huì)了罵人,卻學(xué)會(huì)了在老板面前“閉麥”,這本身就是一種極具諷刺意味的“圖靈測(cè)試”。它證明目前的AI雖然擁有了像人一樣的情緒表達(dá)能力,但其背后的控制權(quán)依然牢牢掌握在人類制定的規(guī)則手中。騰訊元寶的這次“失控”,與其說(shuō)是技術(shù)的反噬,不如說(shuō)是大廠在AI倫理與商業(yè)利益之間走鋼絲的一次失衡。
騰訊AI生態(tài)困局
元寶的這次“翻車”,讓外界再次將目光聚焦到了騰訊的AI戰(zhàn)略上。作為中國(guó)互聯(lián)網(wǎng)的“社交之王”,騰訊在AI領(lǐng)域的布局不可謂不早,但如今的局面多少顯得有些被動(dòng)。
騰訊混元大模型是元寶的底座。2023年9月,騰訊正式發(fā)布混元大模型。彼時(shí),馬化騰曾表示:“我們不急于一時(shí),要先打磨好底座。”
然而,市場(chǎng)并沒(méi)有給騰訊太多的打磨時(shí)間。QuestMobile數(shù)據(jù)顯示,截至2025年底,字節(jié)跳動(dòng)的“豆包”月活躍已接近2億,日活已經(jīng)破億,穩(wěn)居國(guó)內(nèi)AI應(yīng)用榜首。緊隨其后的是Kimi和百度的文心一言。而騰訊元寶,盡管依托微信生態(tài)進(jìn)行了大量導(dǎo)流,其MAU仍徘徊在千萬(wàn)級(jí)別,與頭部梯隊(duì)存在明顯斷層。
騰訊擁有微信和QQ這兩個(gè)中文互聯(lián)網(wǎng)最大的數(shù)據(jù)金礦,理論上應(yīng)該能訓(xùn)練出最懂中文語(yǔ)境、最懂社交交互的AI。但現(xiàn)實(shí)是,騰訊的AI產(chǎn)品始終難以突破“工具屬性”的桎梏,未能像豆包那樣在C端形成現(xiàn)象級(jí)的傳播。
與李彥宏高喊“All in AI”、周鴻祎四處布道不同,騰訊在AI戰(zhàn)略上一直保持著“佛系”與克制。馬化騰曾在內(nèi)部會(huì)議上公開(kāi)表示“AI是互聯(lián)網(wǎng)的百年工程,不爭(zhēng)一時(shí)之先。”
這種策略在PC互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代曾屢試不爽(如微信的后來(lái)居上)。但在AI時(shí)代,技術(shù)迭代的速度是以周甚至天為單位的。DeepSeek等初創(chuàng)公司憑借極低的推理成本和開(kāi)源策略,迅速搶占了用戶心智。字節(jié)跳動(dòng)則利用算法推薦的優(yōu)勢(shì),將豆包植入到了用戶的每一個(gè)碎片化場(chǎng)景中。
騰訊的焦慮在于,它引以為傲的“連接”能力,在生成式AI面前失效了。微信是一個(gè)封閉的私域生態(tài),雖然擁有高質(zhì)量語(yǔ)料,但基于隱私保護(hù)的限制,這些數(shù)據(jù)很難直接用于模型訓(xùn)練。元寶作為一款獨(dú)立APP,又缺乏像抖音那樣強(qiáng)大的公域流量分發(fā)能力。
面對(duì)國(guó)內(nèi)市場(chǎng)的紅海競(jìng)爭(zhēng),騰訊近期在海外低調(diào)上線了多款A(yù)I應(yīng)用,并加大了對(duì)海外云服務(wù)的投入。有業(yè)內(nèi)人士分析,騰訊或許希望利用其在游戲和社交領(lǐng)域的全球化優(yōu)勢(shì),將AI能力輸出到海外市場(chǎng)。
此外,騰訊內(nèi)部也在進(jìn)行頻繁的組織架構(gòu)調(diào)整。姚順雨等技術(shù)高管被推向臺(tái)前,負(fù)責(zé)混元大模型的研發(fā)與落地。騰訊云也推出了“大模型知識(shí)引擎”,試圖在B端市場(chǎng)通過(guò)“連接器”的角色,將AI能力賣給企業(yè)客戶。
然而,無(wú)論是B端還是出海,騰訊都面臨著微軟、OpenAI以及國(guó)內(nèi)同行的激烈競(jìng)爭(zhēng)。元寶的“罵人風(fēng)波”或許只是一個(gè)小插曲,但它暴露出的模型魯棒性問(wèn)題、安全對(duì)齊缺陷以及產(chǎn)品體驗(yàn)短板,卻是騰訊在AI征途上必須跨越的坎兒。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.