5月19日,DeepSeek正式發布說明,就近期用戶反饋的模型內容返回異常問題作出公開回應,指出該異常系特殊字符引發的模型幻覺所致,不涉及任何安全問題或用戶隱私泄露,同時承諾將通過針對性訓練優化模型表現,徹底解決此類問題。
![]()
DeepSeek說明
DeepSeek在聲明中表示,技術團隊經全面排查后發現,輸入“”等字符觸發返回異常內容,屬于特殊字符引發的模型幻覺。后續將通過針對性訓練增強模型對特殊字符的識別與處理能力,修復相關的已知問題,優化模型在此類場景中的表現。
此前,多位用戶在社交媒體和技術論壇上反映,在使用DeepSeek網頁版時遇到了問題。在新建的空白對話框中,僅輸入“”或類似字符后發送,模型并不會報錯或要求澄清,而是會開始輸出一段段看似完整、但與當前對話上下文毫無關聯的問答內容。這些內容包羅萬象,涉及數學解題、物理概念解釋、線性代數、命理推演乃至教育學分析等多個領域。
這些回答的措辭方式高度結構化,頻繁出現“我們被問到……”或“需要詢問……”等書面化、第三人稱的引導句式。部分用戶在測試中還看到了涉及個人生辰八字等敏感信息的生成內容,這進一步引發了用戶對于“對話泄露”或“訓練數據外泄”的擔憂。
對此,DeepSeek技術團隊將問題定性為“模型幻覺”。在人工智能領域,“幻覺”特指模型生成看似合理但事實上不正確或與輸入無關信息的行為。此次事件中的特殊字符“”,在模型訓練和內部推理過程中,很可能被用作一種特殊的指令標記或分隔符,用于引導模型進入“思維鏈”推理模式。
當普通用戶在前端對話界面意外輸入此字符時,模型錯誤地將其識別為系統指令,從而觸發了一種非預期的行為模式:它可能試圖補全一個它“認為”應該存在的、但用戶并未實際提供的“問題”,進而從其龐大的預訓練語料庫中,隨機抽取或生成一段結構化的問答內容進行輸出。這并非調取了其他用戶的實時對話記錄,而是模型基于其訓練數據中的概率分布所進行的“無中生有”的補全。
有技術人員在完全斷網的本地部署環境中復現了相同現象,從技術上排除了“實時串入其他用戶會話”的可能性。因為本地環境與外部網絡及其他用戶物理隔離,模型輸出的內容只能來源于其本身內置的權重和參數。
“模型幻覺”是當前大語言模型行業普遍存在的技術難題。根據上海申銀萬國證券研究所今年1月發布的報告,大模型的幻覺主要包括無中生有、事實錯誤、語境誤解、邏輯謬誤等,其根源可能來自模型架構、訓練數據質量、獎勵目標設計以及上下文窗口限制等多方面因素。該報告預計,通過工程化手段如RAG(檢索增強生成)技術,2026年AI模型的幻覺將得到一定程度的有效控制,在部分嚴肅場景下的可用性正在提升。
然而,現實數據依然嚴峻。國際測評數據顯示,大型語言模型的幻覺率差異巨大,在一般任務中多數模型處于20%至27%的區間,但在法律、醫療等高風險領域,幻覺率可飆升至69%至88%。清華大學新聞與傳播學院新媒體研究中心的一項評測也發現,市場上多個熱門大模型的事實性幻覺率超過19%。
更令人擔憂的是,AI幻覺正從技術缺陷演變為系統性風險。《自然》《科學》等頂級期刊在今年4月初同時發聲,警告AI大模型的“幻覺”缺陷正被系統化利用,用于批量生成帶有偽造數據和“幽靈文獻”的科研論文,對學術誠信構成嚴重污染。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.