網易首頁 > 網易號 > 正文 申請入駐

為了防中國模型,硅谷三巨頭連“復仇者聯盟”都整出來了?

0
分享至


前段時間,硅谷 AI 御三家 OpenAI 、 Anthropic 和谷歌十分罕見地,組成了”復仇者聯盟“。

根據彭博社的報道,平時恨不得卷死對方的哥仨,現在正通過一個”前沿模型論壇“分享信息,目的很明確,就是要聯手揪出那些對抗性蒸餾行為


不明白這個所謂的“對抗性蒸餾行為”是啥,沒關系,但世超想說,這一次,明顯是沖著國內大模型來的。

如果把時間線往回拉到今年 2 月份,沖突其實就已經擺上了臺面。

當時, Anthropic 甩出了一份調查報告,公開點名 DeepSeek、月之暗面和 MiniMax,說這三家公司弄了大概 2.4 萬個欺詐賬戶,跟 Claude 交互超過 1600 萬次,然后把套出來的精華數據全拿去訓練自家的模型去了。

在這份報告里,每家公司進行蒸餾的規模有多大、行動目標是啥,都寫得一清二楚。

就比如陣仗最大的 MiniMax ,一家就發起了超 1300 萬次交互,而且跟得很緊, Anthropic 新模型剛發布,他們就重新調整了流量方向。


DeepSeek蒸餾的規模相對小,只有超過 15 萬次的交互,但專門盯著思維鏈下手。

當然,把這些交互行為定義為“對抗性蒸餾”,純屬 Anthropic 的一面之詞,因為沒法兒證明人家用你的數據去訓練模型了。

不過,因為蒸餾破防的還不只 Anthropic 一家。

差不多時間,OpenAI 也跑到美國國會那邊告御狀,指控 DeepSeek 通過模型蒸餾技術,違規復制了他們的產品功能。

所以世超覺著,這次三家聯手可能是要動真格的了。

不過,在聊“反蒸餾”之前,我們可能得先弄清楚,這個讓巨頭們如坐針氈的“蒸餾”,到底是個啥技術?

其實這玩意兒也沒那么玄乎,大家都知道,模型訓練費算力、費數據還費時間,而蒸餾的邏輯是,即使你手頭的資源有限,只要找到一個名師帶帶你,同樣能在短時間內,訓練出一個跟老師有七八成像的學霸。


核心在于學習“軟標簽”,也就是大模型輸出的概率分布。

放在三年前,當時的 API 環境比現在寬松得多,名師不僅給你答案,還會吐出概率分布,方便搞科研。

但后面不知道咋回事兒,模型大廠們都紛紛把門焊死了,像 OpenAI 他們家的 API 就規定只能看到前 5 個概率最高的詞。

所以蒸餾的思路就變成了黑盒蒸餾、思維鏈蒸餾,包括 Anthropic 、 OpenAI 口中的蒸餾攻擊,很多說的都是思維、邏輯上的模仿。


這種蒸餾方式,就需要大量地調用API。

具體操作上,你得寫個腳本沒日沒夜地向老師提問,不光要拿到標準答案,還要看老師是怎么回答問題的,中間轉了幾個彎、避開了哪些坑,然后再把這些名師教案打包回家,反手喂給自家的模型。

用較低的成本,快速復刻頂級模型的能力,這就是蒸餾。


換句話說,硅谷 AI 三巨頭是在指責,咱們國內的模型廠商偷師。

但仔細一想,這事兒又處處透著詭異。

因為不管是結盟,還是公開指控,目前看下來都是他們幾家巨頭在那自說自話。

整個事情看下來讓人不得不懷疑,他們口中的“對抗性”蒸餾到底是不是一個偽命題,以及,合法蒸餾和對抗性蒸餾的界限又在哪里?

蒸餾這項技術在圈子里算不上什么行業機密,不過咱們大多數普通人接觸到這個詞,大概率還是因為去年初 DeepSeek 發布 R1 ,順帶吃瓜吃到的。

當時 R1 模型剛炸場不久,微軟和 OpenAI 就針對 DeepSeek 展開了調查,說是懷疑它非法竊取了 OpenAI 的數據來訓練模型。

話里話外都在點草,咱家孩子考試成績突然逆天,是因為抄了他們的答案。

可能因為 R1 正式露面前,有用戶在跟 DeepSeek V3 對話的時候,發現了一個很離譜的現象,如果你問它“你是什么模型”,它有時會回答自己是 ChatGPT 。。。所以才引來了不少外界的猜疑。


但這事兒, DeepSeek 后面專門在論文的補充材料里作了解釋,說是 DeepSeek-V3-Base 的預訓練數據完全來自互聯網,沒有刻意使用合成數據。


打那之后,蒸餾在業內就一直頗受爭議。

理論上,蒸餾是一項合法的技術, 一些模型公司也會自己蒸餾模型給企業客戶去做定制。

但“對抗性蒸餾”,也就是用戶利用服務或輸出開發競爭模型,在 OpenAI 、 Anthropic 等公司的用戶使用條款里,是普遍被禁止的。

理由很簡單,你開發一個頂級模型,大把大把地往里燒錢、燒卡,如果競爭對手只花了幾十萬美金調用 API ,就能偷學走七八分,這跟直接從你兜里搶錢沒區別。

為了保證自己的領先地位和商業利潤,巨頭們心里不平衡,想把這道門焊死,也是人之常情。

除此之外,在 Anthropic 的那份調查報告里,也提到了反蒸餾的另外一層考量。


正常情況下,模型在發布之前都要進行紅隊測試來評估風險,目的就是為了建立一套安全護欄,防止模型教人制造生物武器、編寫惡意代碼又或者是搞點種族歧視的言論。

問題在于,蒸餾不會蒸這些。

這就導致了非法蒸餾出來的模型,很可能成為一個隱患。

所以世超覺著,這次三巨頭跳出來聯合抵制,雖然有商業競爭上的私心,但在技術風險上確實也說得通。

但話又說回來, Anthropic 的這份報告把蒸餾抬到了威脅國家安全的角度,在時間點上,又很值得揣摩。

就在報告發出來的前腳,Anthropic正因為開不開后門的事情,跟五角大樓鬧得很僵。

所以一個猜測,當時他們選擇在 CEO 趕去五角大樓談判的前一天,發出來這么一份強調國家安全的報告,有沒有可能是想爭取一點談判空間?

當然了,后續大家伙兒也都知道,沒談攏。

諷刺的地方在于,這些舉著反蒸餾、反抄襲大旗的巨頭們,因為大肆在互聯網上抓數據,也沒少被官司找上門。

一向看熱鬧不嫌事大的馬斯克,在 Anthropic 的調查報告發出來沒多久,直接在 X 上嘲諷開大。說 Anthropic 才是那個大規模盜取數據、還為此賠了數十億美金的慣犯。


包括零一萬物CEO李開復也跳出來說,因為作品侵權,Anthropic 還欠他3000美金。

抓別人的作品來訓練數據的時候,你管那叫“人類知識共享”,現在輪到別人來學你了,你就管這叫“工業級攻擊”了?

說白了,到底算不算偷,怎么才算偷?在大模型領域里還屬于一片灰色地帶。

別鬧到最后,整成全員惡人了。

撰文:西西

編輯:江江&面線

美編:素描

圖片、資料來源

X、彭博社

Anthropic,Detecting and preventing distillation attacks


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
《新聞聯播》大換血!康輝李梓萌退居幕后,四代接班人已悄然就位

《新聞聯播》大換血!康輝李梓萌退居幕后,四代接班人已悄然就位

橙星文娛
2026-04-25 08:21:22
嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

阿訊說天下
2026-04-25 11:15:04
同是影視巨頭,為何萬達有人接盤,華誼卻無人相救?真相太扎心

同是影視巨頭,為何萬達有人接盤,華誼卻無人相救?真相太扎心

八斗小先生
2026-04-25 11:47:21
張蘭發聲!自己要扛起養孫女孫子的責任,內涵馬筱梅沒有旺三代!

張蘭發聲!自己要扛起養孫女孫子的責任,內涵馬筱梅沒有旺三代!

看盡落塵花q
2026-04-25 22:01:48
史玉柱現狀:離婚30多年未再婚,63歲仍不退休,女兒成為他的驕傲

史玉柱現狀:離婚30多年未再婚,63歲仍不退休,女兒成為他的驕傲

素衣讀史
2026-04-20 21:57:34
宋靄齡23歲兒子愛上40歲青樓二婚女私奔結婚,宋靄齡被氣渾身顫抖

宋靄齡23歲兒子愛上40歲青樓二婚女私奔結婚,宋靄齡被氣渾身顫抖

睡前講故事
2026-03-19 21:20:31
特朗普將在白宮舉行新聞發布會

特朗普將在白宮舉行新聞發布會

界面新聞
2026-04-26 09:47:38
晚宴槍擊現場細節曝光:部長急撤、記者趴地,特朗普未傷將發布講話

晚宴槍擊現場細節曝光:部長急撤、記者趴地,特朗普未傷將發布講話

新浪財經
2026-04-26 09:31:10
不敢認!62歲李連杰和64歲利智合照曝光,才發現風光背后滿是心酸

不敢認!62歲李連杰和64歲利智合照曝光,才發現風光背后滿是心酸

黔鄉小姊妹
2026-04-26 09:47:10
唐伯虎真跡現身美國,世上僅此一件,網友:讓當代書家汗顏

唐伯虎真跡現身美國,世上僅此一件,網友:讓當代書家汗顏

幸福娃3790
2025-12-04 11:10:09
CBA官宣常規賽8大獎候選:胡金秋領銜MVP 徐昕領銜最具進步獎

CBA官宣常規賽8大獎候選:胡金秋領銜MVP 徐昕領銜最具進步獎

醉臥浮生
2026-04-25 11:39:05
清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

抽象派大師
2026-04-24 12:23:42
美方在臺灣問題上有了新說辭:若中國和平統一,美國不會反對

美方在臺灣問題上有了新說辭:若中國和平統一,美國不會反對

動漫里的童話
2026-04-26 04:27:11
刺殺老蔣失敗,殺手投奔延安,毛主席:你絕對不能留在這里

刺殺老蔣失敗,殺手投奔延安,毛主席:你絕對不能留在這里

抽象派大師
2026-04-24 12:06:13
富安健洋:我從來沒想過,在阿森納會經歷這么煎熬的日子

富安健洋:我從來沒想過,在阿森納會經歷這么煎熬的日子

懂球帝
2026-04-25 17:17:33
5死2傷!成都一小區深夜突發大火,死者身份流出,知情者含淚發聲

5死2傷!成都一小區深夜突發大火,死者身份流出,知情者含淚發聲

老貓觀點
2026-04-26 07:01:13
難怪民進黨氣得跳腳也不敢抓鄭麗文,她背后的保護傘,讓綠營絕望

難怪民進黨氣得跳腳也不敢抓鄭麗文,她背后的保護傘,讓綠營絕望

觀星賞月
2026-04-25 17:56:35
金平日:與金正日爭權失敗,駐外30年躲過暗殺,因這件事允許回國

金平日:與金正日爭權失敗,駐外30年躲過暗殺,因這件事允許回國

阿胡
2025-04-03 13:59:42
小米公司發言人:網絡用戶李某華捏造、散布雷軍的謠言

小米公司發言人:網絡用戶李某華捏造、散布雷軍的謠言

IT之家
2026-04-26 09:31:08
日軍在華損失最慘一役,18萬精銳全被打垮,武漢會戰打出中國血性

日軍在華損失最慘一役,18萬精銳全被打垮,武漢會戰打出中國血性

鶴羽說個事
2026-04-25 22:42:20
2026-04-26 10:15:00
差評XPIN incentive-icons
差評XPIN
用知識和觀點Debug the world!
10642文章數 489599關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

時尚
數碼
教育
房產
軍事航空

伊姐周六熱推:電視劇《方圓八百米》;電視劇《金關》......

數碼要聞

OPPO手表6月推送新功能:身心狀態提醒、日照時長監測一應俱全

教育要聞

學校管理:“管”出規范,“理”出活力

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

軍事要聞

伊朗總統:不會在壓力、威脅下進行談判

無障礙瀏覽 進入關懷版