網易首頁 > 網易號 > 正文申請入駐

急眼的Anthropic炒作蒸餾，背后是敘事權之戰

2026-06-27 23:53:39　來源: 周天財經

上海舉報

分享至

文 | 周天財經

周天財經原創出品

圍繞蒸餾的敘事戰，再起。

6月25日，外媒爆出，美國AI公司Anthropic指控阿里巴巴千問（Qwen）模型「蒸餾」其Claude模型。據路透社、《華爾街日報》，Anthropic已致信美國參議員及白宮官員，指控阿里在4月到6月期間，用25000個虛假賬號與Claude進行約2880萬次交互，試圖蒸餾Claude。

截至目前，Anthropic并沒有進一步拿出實在的證據，僅憑一紙信件，便對另一家公司口誅筆伐，掀起炒作浪潮，這一行徑，已經引發全球AI社區絕大多數開發者的斥責。

而這并不是Anthropic的首次出擊。早在今年2月，該公司發布博客稱，DeepSeek、Kimi、MiniMax 3家中國公司蒸餾Claude，與今日Anthropic對阿里的指控幾乎完全一樣。

DeepSeek等三家公司并未發聲，而阿里對此也無回應。但引人注意的是，就在這一新聞的前兩天（6月23日），阿里正式對美國國防部提起訴訟，要求將其從「中國軍事企業名單」中移除。

我試著深究里面的細節，覺得可以分為兩個部分來看。

首先看看蒸餾本身，先說結論，蒸餾不能等同于抄襲和竊取，這種行業最普遍的技術，已經徹底被Anthropic污名化了。

蒸餾（Distill）本身是AI行業公認的合法訓練技術，是由AI三巨頭之一、諾獎得主Geoffrey Hinton 2015年提出的技術方法，后成為行業基操。

蒸餾屬于是一種「向高手學習」的訓練方式：能幫助模型快速掌握某種回答風格、任務范式和基礎能力，也可以把大模型已經表現出來的一部分能力，較高效率地「壓縮」到小模型身上。因此，蒸餾的價值主要體現在提速、降本和能力遷移上，它能讓一個模型少走很多彎路，更快接近一個強模型已經達到的水平。

一個行業皆知的事實是，美國AI公司就經常互相蒸餾。無論OpenAI、Anthropic，還是Qwen/DeepSeek，模型訓練的pipeline大同小異。

特別是Anthropic就經常被業內人士指出，這家公司就到處蒸餾其他家的成果。

滑稽的情形是，前段時間，其Claude Opus 4.8發布，有開發者調用其官方API測試，用中文問「你是什么模型」，模型返回字段是claude-opus-4-8，但輸出回答卻說：我是通義千問（Qwen）。這在AI社區引發大量討論，紛紛猜測Claude蒸餾了中國模型。隨后，陸續有開發者測得Claude 4.8輸出「我是DeepSeek」等回答。

就連李開復也在2026年3月的一次采訪中直言：「大家可能前一陣聽到美國Anthropic抱怨一些中國公司蒸餾了它的模型，蒸餾本身也沒有違背什么規則，是不是有點小題大做了呢……Anthropic還欠我3000美元稿費。」

李開復這話所指的大背景是，Anthropic因為從盜版網站LibGen和PiLiMi上下載了約48.2萬本注冊版權書籍來訓練模型，而被作者們集體訴訟，最終Anthropic賠了15億美金來求得和解，這也是美國歷史上最大的單筆版權和解案。

這種版權侵權可比蒸餾嚴重多了，是法官的嚴肅判決。而Anthropic指控阿里，卻毫無實在證據，如今倒打一耙，從未如此具象化。

蒸餾不是一錘定音的一把絕招，AI專家Nathan Lambert就談到，蒸餾只是模仿，真正的能力來自強化學習的探索，而不僅僅是復制輸出。并且，Baseten公司模型訓練負責人查爾斯·奧尼爾（Charles O'Neill）表示，單靠知識蒸餾無法構建出頂尖的人工智能系統，這還需要其他幾項復雜的底層技術。

打一個最通俗的比方，蒸餾就像一個運動員通過看世界冠軍比賽錄像、模仿冠軍動作、甚至和冠軍陪練，來迅速理解高水平選手是怎么發力、怎么選擇節奏、怎么處理關鍵球的。這當然非常有幫助，甚至可能讓他在短時間內進步明顯。

但真正決定他能不能成為世界冠軍的，仍然是他自己的體能儲備、技術細節、戰術素養、心理穩定性、日常訓練強度，以及背后完整的教練團隊和訓練、康復體系。

也就是說，看冠軍錄像可以幫助你少走彎路，跟冠軍陪練可以幫助你提高速度，但你最終能不能奪冠，靠的肯定不只是「模仿」這一件事。

真正能把一個模型推到頂尖水平的，通常還包括一整套更底層、更復雜的能力建設過程，比如大規模預訓練所奠定的知識底座，高質量數據清洗所保證的學習材料，訓練配方所決定的穩定性與效率，強化學習所帶來的探索與自我修正能力，評估體系所提供的反饋閉環，以及工程優化、推理加速和部署能力所實現的最終落地效果。換句話說，蒸餾更像是「學經驗」；它能幫助模型學得更快，但未必能單獨決定模型能走多遠。

回過頭看，為何Anthropic對中國AI公司頻頻出手？答案顯而易見，中國AI不僅在性能榜單上奮起直追，在全球也越來越受到歡迎，全球最大的API三方平臺OpenRouter的大模型調用榜，就經常被千問、GLM、Kimi、DeepSeek等中國大模型霸占。對暫時領先的Anthropic而言，怎能不急眼？

說完蒸餾這事兒，再來聊聊今天產業競爭背后的屋內大象：地緣壓力。

在基礎大模型上，中國公司這兩年展現出了非常強的追趕能力：在算力并不占優、外部限制不斷增強的情況下，依然能通過更高的工程效率、更快的迭代節奏、更靈活的開源策略和更務實的應用導向，把模型能力迅速推近全球前沿。

這種逼近，本身就足以讓部分海外廠商感到不安。

同時，Anthropic這樣的公司，當前就處于復雜的安全審查、政府關系夾縫之中。它必須不斷回應來自政府、軍方的安全訴求。那么，主動強化「中國威脅」敘事，不僅能夠幫助其在政策語境中占據一個更有利的位置，也可能成為其向華盛頓安全體系、五角大樓遞交「可信度」的一種投名狀。

考慮到Anthropic被美軍廣泛用于戰場之中，作為一種「軍火」而深刻卷入政府補助和采購當中，可以說，Anthropic就是當代新的軍工復合體，并非象牙塔里的脆弱白蓮花。

我近期去了一趟美國，深入交流和觀察之后，感受頗多。

在美國期間，我注意到，渲染中國公司威脅論的節目在美國有不少信眾，比如舊金山的朋友就給我看一些美國百萬大V是如何質疑宇樹機器人回傳數據的（當然，我遇到的一位巴基斯坦裔百萬粉絲博主，則盛贊宇樹）

3D打印小巨頭拓竹，遭遇的是質疑其反開源的聲音，一項原本為了增進云服務穩定性的技術安排，到歐美開源社區的語境里，被解讀成巨頭反開源的敘事，甚至也被渲染成地緣政治話題。

無一例外，以上這些中國標桿科技企業，特征都是拿出了前沿產品，卻也都因為一些無足輕重的技術細節被惡意攻擊，指責威脅安全。

當敘事權不在自己手里，哪怕在細分市場已經做到了全球第一，也依然會爭論不斷，這是中國企業很長一段時間需要面對的煩惱。

還有個小插曲，在入境舊金山時，我還被帶到小黑屋里進行了一番審查，阿sir問出了我覺得是此行最佳的一句話：「你說你是tech blogger，那為什么你有很多年都沒再來過美國？在我看來，你應該年年都來才對」。

言下之意，我不呆在美國就寫不了科技，這就流露出一種歐美中心主義視角，他們就是眼神清澈地「看不見」很多趨勢。我回答他說：中國自己就有大量科技與創業公司，已經夠忙活好一陣的了。

一面放大威脅，一面貶低實力、漠視成果，這兩件自相矛盾的事兒是怎么融合在同一個指控之中的，令人費解，左右腦互搏程度之深，已經成為普遍的雙標現象了。

Call back到最近的蒸餾爭議，我們同樣需要清晰地認識到，今天的大模型競爭已經不再只是實驗室里的性能競爭、市場上的產品競爭，它同時還是一場定義權、解釋權競爭和合法性競爭。

可以預見的是，蒸餾爭議不會是一次偶發事件，圍繞蒸餾甚至更多技術細節的敘事戰，會層出不窮很長一段時間，阿里巴巴、拓竹、宇樹這些科技企業面臨的敘事壓力，還會在越來越多的前沿中國企業身上經歷一遍，長路漫漫，需要這一代人共同面對。

*本文如有提及上市公司，僅作為研究交流用途，不構成推薦股票或相關金融產品的建議。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.