![]()
文 | 周天財經
周天財經 原創出品
圍繞蒸餾的敘事戰,再起。
6月25日,外媒爆出,美國AI公司Anthropic指控阿里巴巴千問(Qwen)模型「蒸餾」其Claude模型。據路透社、《華爾街日報》,Anthropic已致信美國參議員及白宮官員,指控阿里在4月到6月期間,用25000個虛假賬號與Claude進行約2880萬次交互,試圖蒸餾Claude。
截至目前,Anthropic并沒有進一步拿出實在的證據,僅憑一紙信件,便對另一家公司口誅筆伐,掀起炒作浪潮,這一行徑,已經引發全球AI社區絕大多數開發者的斥責。
![]()
而這并不是Anthropic的首次出擊。早在今年2月,該公司發布博客稱,DeepSeek、Kimi、MiniMax 3家中國公司蒸餾Claude,與今日Anthropic對阿里的指控幾乎完全一樣。
DeepSeek等三家公司并未發聲,而阿里對此也無回應。但引人注意的是,就在這一新聞的前兩天(6月23日),阿里正式對美國國防部提起訴訟,要求將其從「中國軍事企業名單」中移除。
我試著深究里面的細節,覺得可以分為兩個部分來看。
首先看看蒸餾本身,先說結論,蒸餾不能等同于抄襲和竊取,這種行業最普遍的技術,已經徹底被Anthropic污名化了。
蒸餾(Distill)本身是AI行業公認的合法訓練技術,是由AI三巨頭之一、諾獎得主Geoffrey Hinton 2015年提出的技術方法,后成為行業基操。
蒸餾屬于是一種「向高手學習」的訓練方式:能幫助模型快速掌握某種回答風格、任務范式和基礎能力,也可以把大模型已經表現出來的一部分能力,較高效率地「壓縮」到小模型身上。因此,蒸餾的價值主要體現在提速、降本和能力遷移上,它能讓一個模型少走很多彎路,更快接近一個強模型已經達到的水平。
一個行業皆知的事實是,美國AI公司就經常互相蒸餾。無論OpenAI、Anthropic,還是Qwen/DeepSeek,模型訓練的pipeline大同小異。
特別是Anthropic就經常被業內人士指出,這家公司就到處蒸餾其他家的成果。
滑稽的情形是,前段時間,其Claude Opus 4.8發布,有開發者調用其官方API測試,用中文問「你是什么模型」,模型返回字段是claude-opus-4-8,但輸出回答卻說:我是通義千問(Qwen)。這在AI社區引發大量討論,紛紛猜測Claude蒸餾了中國模型。隨后,陸續有開發者測得Claude 4.8輸出「我是DeepSeek」等回答。
![]()
就連李開復也在2026年3月的一次采訪中直言:「大家可能前一陣聽到美國Anthropic抱怨一些中國公司蒸餾了它的模型,蒸餾本身也沒有違背什么規則,是不是有點小題大做了呢……Anthropic還欠我3000美元稿費。」
李開復這話所指的大背景是,Anthropic因為從盜版網站LibGen和PiLiMi上下載了約48.2萬本注冊版權書籍來訓練模型,而被作者們集體訴訟,最終Anthropic賠了15億美金來求得和解,這也是美國歷史上最大的單筆版權和解案。
這種版權侵權可比蒸餾嚴重多了,是法官的嚴肅判決。而Anthropic指控阿里,卻毫無實在證據,如今倒打一耙,從未如此具象化。
蒸餾不是一錘定音的一把絕招,AI專家Nathan Lambert就談到,蒸餾只是模仿,真正的能力來自強化學習的探索,而不僅僅是復制輸出。并且,Baseten公司模型訓練負責人查爾斯·奧尼爾(Charles O'Neill)表示,單靠知識蒸餾無法構建出頂尖的人工智能系統,這還需要其他幾項復雜的底層技術。
打一個最通俗的比方,蒸餾就像一個運動員通過看世界冠軍比賽錄像、模仿冠軍動作、甚至和冠軍陪練,來迅速理解高水平選手是怎么發力、怎么選擇節奏、怎么處理關鍵球的。這當然非常有幫助,甚至可能讓他在短時間內進步明顯。
但真正決定他能不能成為世界冠軍的,仍然是他自己的體能儲備、技術細節、戰術素養、心理穩定性、日常訓練強度,以及背后完整的教練團隊和訓練、康復體系。
也就是說,看冠軍錄像可以幫助你少走彎路,跟冠軍陪練可以幫助你提高速度,但你最終能不能奪冠,靠的肯定不只是「模仿」這一件事。
真正能把一個模型推到頂尖水平的,通常還包括一整套更底層、更復雜的能力建設過程,比如大規模預訓練所奠定的知識底座,高質量數據清洗所保證的學習材料,訓練配方所決定的穩定性與效率,強化學習所帶來的探索與自我修正能力,評估體系所提供的反饋閉環,以及工程優化、推理加速和部署能力所實現的最終落地效果。換句話說,蒸餾更像是「學經驗」;它能幫助模型學得更快,但未必能單獨決定模型能走多遠。
回過頭看,為何Anthropic對中國AI公司頻頻出手?答案顯而易見,中國AI不僅在性能榜單上奮起直追,在全球也越來越受到歡迎,全球最大的API三方平臺OpenRouter的大模型調用榜,就經常被千問、GLM、Kimi、DeepSeek等中國大模型霸占。對暫時領先的Anthropic而言,怎能不急眼?
說完蒸餾這事兒,再來聊聊今天產業競爭背后的屋內大象:地緣壓力。
在基礎大模型上,中國公司這兩年展現出了非常強的追趕能力:在算力并不占優、外部限制不斷增強的情況下,依然能通過更高的工程效率、更快的迭代節奏、更靈活的開源策略和更務實的應用導向,把模型能力迅速推近全球前沿。
這種逼近,本身就足以讓部分海外廠商感到不安。
同時,Anthropic這樣的公司,當前就處于復雜的安全審查、政府關系夾縫之中。它必須不斷回應來自政府、軍方的安全訴求。那么,主動強化「中國威脅」敘事,不僅能夠幫助其在政策語境中占據一個更有利的位置,也可能成為其向華盛頓安全體系、五角大樓遞交「可信度」的一種投名狀。
考慮到Anthropic被美軍廣泛用于戰場之中,作為一種「軍火」而深刻卷入政府補助和采購當中,可以說,Anthropic就是當代新的軍工復合體,并非象牙塔里的脆弱白蓮花。
![]()
我近期去了一趟美國,深入交流和觀察之后,感受頗多。
在美國期間,我注意到,渲染中國公司威脅論的節目在美國有不少信眾,比如舊金山的朋友就給我看一些美國百萬大V是如何質疑宇樹機器人回傳數據的(當然,我遇到的一位巴基斯坦裔百萬粉絲博主,則盛贊宇樹)
3D打印小巨頭拓竹,遭遇的是質疑其反開源的聲音,一項原本為了增進云服務穩定性的技術安排,到歐美開源社區的語境里,被解讀成巨頭反開源的敘事,甚至也被渲染成地緣政治話題。
無一例外,以上這些中國標桿科技企業,特征都是拿出了前沿產品,卻也都因為一些無足輕重的技術細節被惡意攻擊,指責威脅安全。
當敘事權不在自己手里,哪怕在細分市場已經做到了全球第一,也依然會爭論不斷,這是中國企業很長一段時間需要面對的煩惱。
還有個小插曲,在入境舊金山時,我還被帶到小黑屋里進行了一番審查,阿sir問出了我覺得是此行最佳的一句話:「你說你是tech blogger,那為什么你有很多年都沒再來過美國?在我看來,你應該年年都來才對」。
言下之意,我不呆在美國就寫不了科技,這就流露出一種歐美中心主義視角,他們就是眼神清澈地「看不見」很多趨勢。我回答他說:中國自己就有大量科技與創業公司,已經夠忙活好一陣的了。
一面放大威脅,一面貶低實力、漠視成果,這兩件自相矛盾的事兒是怎么融合在同一個指控之中的,令人費解,左右腦互搏程度之深,已經成為普遍的雙標現象了。
Call back到最近的蒸餾爭議,我們同樣需要清晰地認識到,今天的大模型競爭已經不再只是實驗室里的性能競爭、市場上的產品競爭,它同時還是一場定義權、解釋權競爭和合法性競爭。
可以預見的是,蒸餾爭議不會是一次偶發事件,圍繞蒸餾甚至更多技術細節的敘事戰,會層出不窮很長一段時間,阿里巴巴、拓竹、宇樹這些科技企業面臨的敘事壓力,還會在越來越多的前沿中國企業身上經歷一遍,長路漫漫,需要這一代人共同面對。
*本文如有提及上市公司,僅作為研究交流用途,不構成推薦股票或相關金融產品的建議。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.