![]()
一群自研AI編碼助手的工程師,被勒令停止使用市面上最順手的兩個工具:Anthropic的Claude Code和OpenAI的Codex。理由?用得太多,可能“不小心”把競品的能力蒸餾進自家模型里。
這是Meta前幾日一份流傳出的內部文件所揭示的現實,該公司已對Applied AI部門工程師下達明確禁令:限制使用Claude Code和Codex,部分涉及這些模型的工作直接被叫停。一份內部備忘錄顯示原因為,競品AI輸出的內容若混入Meta訓練數據,將觸發“與合作方的糾紛升級”(serious escalations with partner companies)。
當“開放”遇上“護城河”
Meta這項內部新政被曝光,表面上是IT管理層面的常規操作,背后是更深層的戰略焦慮。
Meta的擔憂只有一個詞:蒸餾(Distillation)。
模型蒸餾,通俗說就是拿一個強大模型的輸出去訓練另一個模型。如果Meta工程師在編寫AI訓練代碼時大量依賴Claude Code或Codex,這些工具生成的代碼片段、調試建議和架構方案,就有可能被無意間收入Meta自身的訓練素材庫。技術上完全可行——工程師用Claude Code調試一條訓練腳本時,代碼塊流向Anthropic服務器,Claude的回答則留在Meta本地環境。
內部備忘錄警告,若Claude或Codex的輸出最終出現在Meta的訓練數據集里,“將直接導致與合作方的嚴重糾紛升級”。這句話的分量遠超商業競爭層面——它直指合同條款的嚴肅性。OpenAI、Anthropic、Google的服務條款均明確禁止使用模型輸出來構建競爭性系統。
這是AI行業首次有大型前沿實驗室因蒸餾擔憂,公開限制員工使用競品編碼工具。但這只是2026年蒸餾戰爭全面升級的最新一幕。
回看2026年,蒸餾爭議的烈度逐月攀升,從企業指控到國會聽證,從法庭證詞到白宮政策——
- 2月12日,OpenAI向美國眾議院中國特設委員會提交備忘錄,指控DeepSeek使用“新的、混淆的方法”蒸餾其模型訓練R1。
- 2月23日,Anthropic率先發難,指控DeepSeek、月之暗面、MiniMax三家中國公司實施“工業級蒸餾攻擊”,涉及超過2.4萬個虛假賬號、1600萬次交互。馬斯克隨即在X平臺反嗆:“還好意思說別人蒸餾?”
- 4月30日,在xAI訴OpenAI案法庭上,馬斯克被問及xAI是否蒸餾了OpenAI模型來訓練Grok,給出“部分是的”(Partially yes)的回答。
- 5月初,白宮發布“反蒸餾”政策備忘錄,將蒸餾問題從商業糾紛上升至國家安全層面。
- 6月10日,Anthropic再次向美國參議院銀行委員會致信,指控阿里巴巴關聯方在4月22日至6月5日期間,通過約2.5萬個虛假賬戶發起超過2880萬次Claude交互——Anthropic稱之為“已知最大規模的蒸餾攻擊”。
- 6月13日,美國政府以國家安全為由,要求AI企業限制非美國公民訪問頂尖大模型。
- 6月29日,The Information曝出Meta內部禁令:限制工程師使用Claude Code和Codex。
蒸餾已經從學術概念,演變為AI軍備競賽中最隱蔽也最高效的武器。
拆解Meta的矛盾
Meta在AI領域的標簽始終是“開源急先鋒”。從Llama 2到Llama 3再到Llama 4,扎克伯格反復宣講“開放AI”的價值觀。Meta搭建了開放的生態,允許外部開發者基于Llama微調、二次開發,甚至鼓勵商業產品落地。
但Meta對自己內部核心數據和訓練流程的保護,遠比外界想象中嚴苛。
這構成了一個商業悖論。面向外部開源Llama,Meta輸出的是一套戰略:通過降低AI技術門檻,削弱OpenAI和Google的封閉生態優勢,讓Llama成為行業事實標準。可一旦涉及自家核心模型的訓練數據——那些真正決定下一代模型能力上限的高質量數據集——Meta立刻切換到最保守的防御姿態。
Meta不希望別人蒸餾它,但也不想“不小心”蒸餾了別人——前者損害競爭壁壘,后者可能引爆法律風險。 一位業內觀察者如此表示
這種雙重身份在2025-2026年的行業環境中愈發難以維持。Anthropic在2025年8月底修訂了消費者條款,宣布用戶對話數據將默認用于模型訓練,但用戶可選擇退出(opt-out)。據Anthropic官方公告,這一變更于9月28日正式生效,直接引起了Meta法務和安全團隊的高度警惕——當數據默認流向訓練集,誰訓練了誰的數據,在法律上變得說不清。
Meta的恐懼首先來自合同層面。OpenAI、Anthropic、Google的服務條款均明令禁止使用模型輸出構建競爭性系統。若Meta被證實利用Claude或Codex的輸出訓練自家模型,備忘錄中“嚴重升級”四個字指向的,很可能是訴訟或天價賠償。
更深一層是競爭壁壘。Meta正在自研AI編碼助手MetaCode。如果內部工程師一邊花著Meta預算開發MetaCode,一邊依賴Claude Code和Codex完成關鍵編碼工作,那MetaCode最終的能力究竟是Meta自己的,還是“借”來的?你無法證明自己的模型能力是“自己長出來的”還是“偷來的”。講不清這個故事,損失的不僅是法律層面,更是投資者信心。
還有一層被忽視的現實是成本失控。Meta內部AI使用量呈指數級膨脹,2026年僅內部AI使用一項就將耗費數十億美元。這迫使公司必須控制員工對外部昂貴AI工具的消耗,一邊壓縮成本,一邊自研替代品。
最后是數據主權。當工程師用Claude Code調試訓練腳本時,Meta的專有代碼庫正通過API流向Anthropic服務器。對一家把AI作為核心戰略的公司而言,這是不可容忍的數據泄露路徑。Meta開發MetaCode的部分動機,正是要把這些敏感數據流完全封閉在自家基礎設施內。
蒸餾:AI行業最棘手的灰色地帶
蒸餾之所以讓所有大模型公司又愛又恨,是因為它在技術上幾乎不可防御。
OpenAI、Anthropic、Google都在服務條款中明確禁止蒸餾,但如何證明?當一個企業的工程師團隊每天產生數萬次API調用,哪些屬于“正常使用”,哪些屬于“蒸餾攻擊”,邊界極其模糊。
Anthropic在2026年6月指控阿里巴巴關聯方時,列舉了約2.5萬個虛假賬戶和超過2880萬次交互——這是能抓到的案例。但有多少蒸餾行為是“抓不住的”?當一家公司的員工在正常編碼工作中使用競品AI工具,再將生成的代碼片段作為參考寫入自己的訓練數據——這算不算蒸餾?在法律和技術兩個維度,答案可能截然不同。
更有意思的是Meta的“開源雙重標準”。Meta鼓勵外部開發者用Llama做任何事——包括蒸餾式的微調和二次開發。當外部開發者真的用Llama蒸餾了GPT-4的能力,Meta是受益者;而如果Meta自己的工程師“不小心”蒸餾了Claude,Meta就從受益者變成違規方。這種不對稱性,暴露出“開源AI”旗號背后的商業邏輯:開源是進攻的武器,封閉是防守的盾牌。
Meta這道禁令不止是內部IT管理,更像一個行業宣言——AI巨頭之間的“數據護城河”正從概念走向制度。
其他AI巨頭很可能跟進類似限制政策。Google、微軟、Amazon內部都在大量使用競品AI工具,面臨同樣的蒸餾風險。Meta一旦開了先例,合規團隊沒有理由坐視不理。
政策層面同樣在加速。白宮5月發布“反蒸餾”政策備忘錄,將蒸餾問題從企業間的合同糾紛上升至國家安全議題。6月13日,美國政府更進一步,要求AI企業限制非美國公民對頂尖模型的訪問權限。蒸餾的監管化,正在改變整個行業的競爭規則。
“空氣間隙”企業級AI編碼工具將迎來需求爆發。如果Claude和GPT-4這類模型無法滿足企業對數據殘留的合規要求,真正的贏家或許是那些能提供完全本地部署或私有云方案的AI公司。Meta選擇自研MetaCode,本質上就是走這條路。對Anthropic和OpenAI而言,這是挑戰也是機會——誰能更快推出讓企業客戶放心的部署方案,誰就能在下一階段占據先機。
蒸餾不會消失。它就像互聯網早期的盜版問題——技術和法律將在動態博弈中不斷尋求平衡。真正值得追問的是:當蒸餾變得越來越困難之后,那些靠“借力”起家的AI公司,還能否找到真正的獨立創新路徑?
(本文首發鈦媒體APP,作者 | 硅谷Tech-news,編輯 | 趙虹宇)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.