“Anthropic犯有大規模竊取訓練數據的罪行,并且已經為其盜竊行為支付了數十億美元的和解金。這只是一個事實。”埃隆·馬斯克的這句指責,把Anthropic推到了聚光燈下。當網友回嗆說Grok的訓練數據也不干凈時,馬斯克干脆補了一刀:“是啊,但我們不會像Anthropic那樣對此表現得極度自鳴得意、偽善又虛偽。”而就在這番唇槍舌劍還沒涼透的時候,Anthropic自己又出手了——這次它把矛頭對準了阿里巴巴,一開口就是“迄今已知最大規模的蒸餾攻擊”。
事情要從一封遞交到美國參議院的信說起。6月10日,Anthropic致信南卡羅來納州共和黨參議員Tim Scott和馬薩諸塞州民主黨參議員Elizabeth Warren,指控阿里巴巴“公然”且“非法”地試圖提取其AI能力。信中給出的細節聽起來確實唬人:在4月22日至6月5日這短短一個多月里,阿里巴巴及其AI實驗室的運營方通過約2.5萬個欺詐賬戶,與Anthropic的模型進行了2880萬次對話。Anthropic把這稱為一次大規模的“蒸餾攻擊”——所謂蒸餾,就是用更強模型的輸出作為訓練信號,去喂養一個更輕量、能力稍弱的模型。簡單說,就是拿別人的大腦灌自己的模型。
![]()
Anthropic的發言人也在聲明中把調門拉得很高:“我們認為,打擊非法蒸餾威脅需要政府與產業界的協調行動,我們將繼續與國會和政府合作,保持美國人工智能的領先地位。”一副守護AI邊疆的正義姿態。然而,當批評者把Anthropic自己的案底翻出來時,場面就變得微妙了。這家公司曾被指爬取互聯網數據用于訓練,并不是什么未經世俗污染的純良實驗室。同樣是在這輪爭議里,馬斯克直接替它算了筆賬:已經為盜竊行為支付了數十億美元的和解金。也就是說,在“訓練數據來源是否干凈”這件事上,Anthropic的說教恐怕很難讓人肅然起敬。
更戲劇性的一幕出現在今年5月。Anthropic發布了旗艦模型Claude Opus 4.8,但模型上線沒多久,多個平臺的用戶就通過API測試發現了一個古怪的現象:當被問及自己的身份時,這個Opus 4.8竟然會自稱是阿里的通義千問或者DeepSeek。雖然這未必能直接證明“蒸餾”行為的存在,但結合Anthropic自己氣勢洶洶的指控,整件事的諷刺意味簡直沖出了屏幕。指責別人偷師,結果自己的新模型一開口就喊錯了名字,這背后的訓練數據到底染了誰家的墨水,恐怕只有Anthropic自己清楚。
把這場爭端拆開看,其實就是一幅當代AI競賽的速寫:誰都在拼命吸收數據,誰也都想守住自己的圍墻。當Anthropic向國會喊話要“保持美國AI領先”時,更像是在畫一條不太可能被遵守的規矩。因為在蒸餾技術已經半公開化的今天,指責別人的手不干凈,往往也會把自己的手暴露在陽光下。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.