大數據文摘受權轉載自夕小瑤科技說
今天上午發現一個事。用中文問 Claude——你是什么模型,它回答:
我是由 DeepSeek 公司開發的 AI 助手,模型名稱是 DeepSeek。
不是幻覺,截圖在這里。
![]()
我以為是偶發,群里一問才知道很多都遇到了同樣的問題。
![]()
一直到到下午兩點半,這個問題還能復現。
![]()
![]()
前不久,Anthropic 剛發了一篇聲勢浩大的博客文章,指控 DeepSeek、月之暗面、MiniMax 三家中國公司用 2.4 萬個馬甲賬號、1600 萬次對話蒸餾 Claude。
這也太抓馬了。
前腳指控別人偷你的模型能力, 后腳“自曝”自己是 DeepSeek。
于是我又測了 6 種不同的中文問法,全部不帶 system prompt,測試結果如下:
![]()
除了 Deepseek,ChatGPT,它也會錯認成千問。被質疑后,它會改口。
![]()
只有中文提問會觸發,英文、日語、韓語暫時沒發現問題。
Claude 3.5 Sonnet 和 Claude 3 Opus(更早的版本),在同樣條件下 5 次測試全部正確回答 Claude。
![]()
更強的 Opus 4.6,10 次全對,零錯誤。
問題只出現在 Sonnet 4.6 這一代身上。
這意味著身份混亂是在 4.x 代 Sonnet 模型中出現的,可能和這一代的訓練數據構成或對齊策略的變化有關。
綜合下來,這個現象的觸發條件其實很明確:中文提問、特定問法、沒有 system prompt,三個條件同時滿足才會出現。換成英文、換個問法、或者加上哪怕最簡單的身份提示,問題就消失了。
這個事情爆出來的時機很有意思。
先給大家理一理最近和 Anthropic 有關的事。
![]()
尤其是剛不久 2 月 23 日,Anthropic 在官方博客上發布了一篇名為_Detecting and preventing distillation attacks_的文章,直接點名中國的大模型公司 DeepSeek、月之暗面(Moonshot AI)、MiniMax,控訴這三家公司展開了工業規模的“蒸餾攻擊”,目的是“蒸餾”Claude 的核心能力。
緊接著,馬斯克諷刺 Anthropic“賊喊捉賊”,在 X 平臺寫道:“Anthropic 大規模竊取訓練數據,并為此支付了數十億美元的和解金。這是事實。”
![]()
馬斯克指向的是 Anthropic 在 2025 年 9 月與作者/出版商集團達成1.5 億美元版權和解(史上最大版權和解之一),原因是使用從盜版網站下載的數百萬本受版權保護書籍訓練 Claude。
馬斯克這話肯定帶著自己的私貨,但有一說一,誰蒸餾了誰,還是說蒸餾本就是雙向奔赴,不需要說太清楚。
Sonnet 4.6 自曝“我是 DeepSeek”,一個合理的猜測,有訓練數據的構成問題。
模型的“我是誰”不是硬編碼的參數,它是在訓練數據中的統計涌現。我們問它“你是誰”,它做的事情本質上就是預測,在所有訓練數據中,“你是誰?”這個問題后面,出現概率最高的回答是什么,它就會答什么。
平時,你感覺 Claude 一直知道自己叫 Claude,是因為有 system prompt 在。
在中文互聯網上,Claude 幾乎沒有直接用戶。所以中文對話數據中“我是通義千問/豆包/DeepSeek”的樣本量遠超“我是 Claude”,在沒有身份錨點的情況下,模型自然傾向于輸出概率最高的那個答案。
大模型的身份混亂其實不是什么新鮮事,圈里也老生常談了,AI 訓練數據互偷互薅不可避免會是常態。大家都薅公開/半公開數據,誰也別笑誰了。
在一片情緒化的討論中,RLHF 領域的權威研究者 Nathan Lambert 在 2 月 24 日發表了一篇可能是最有分量的獨立分析_,How Much Does Distillation Really Matter for Chinese LLMs?_。
![]()
他的幾個核心觀點值得認真看:
他認為 DeepSeek 的 15 萬次交互“只是滄海一粟”,對 DeepSeek 傳聞中的 V4 模型影響可以忽略不計。
他還指出,即使蒸餾了大量 Claude 的問答對,它們在 RL 訓練框架下能發揮的作用也在下降。
換句話說,即使蒸餾確實發生了,它對中國 AI 公司最終模型能力的影響,可能比 Anthropic 在博客中暗示的要小得多。
中國 AI 公司取得今天的成績,靠的也不全是、也不可能只是蒸餾。
而且蒸餾,在技術上也不是什么陰謀,是標準的模型訓練手段。所有大模型的訓練數據,在某種程度上都已經包含了其他模型的輸出。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.