網易首頁 > 網易號 > 正文申請入駐

蒸餾戰爭全面開打：從Meta封堵Claude與Codex開始

2026-07-02 12:08:07　來源: 鈦媒體APP

北京舉報

分享至

一群自研AI編碼助手的工程師，被勒令停止使用市面上最順手的兩個工具：Anthropic的Claude Code和OpenAI的Codex。理由？用得太多，可能“不小心”把競品的能力蒸餾進自家模型里。

這是Meta前幾日一份流傳出的內部文件所揭示的現實，該公司已對Applied AI部門工程師下達明確禁令：限制使用Claude Code和Codex，部分涉及這些模型的工作直接被叫停。一份內部備忘錄顯示原因為，競品AI輸出的內容若混入Meta訓練數據，將觸發“與合作方的糾紛升級”（serious escalations with partner companies）。

當“開放”遇上“護城河”

Meta這項內部新政被曝光，表面上是IT管理層面的常規操作，背后是更深層的戰略焦慮。

Meta的擔憂只有一個詞：蒸餾（Distillation）。

模型蒸餾，通俗說就是拿一個強大模型的輸出去訓練另一個模型。如果Meta工程師在編寫AI訓練代碼時大量依賴Claude Code或Codex，這些工具生成的代碼片段、調試建議和架構方案，就有可能被無意間收入Meta自身的訓練素材庫。技術上完全可行——工程師用Claude Code調試一條訓練腳本時，代碼塊流向Anthropic服務器，Claude的回答則留在Meta本地環境。

內部備忘錄警告，若Claude或Codex的輸出最終出現在Meta的訓練數據集里，“將直接導致與合作方的嚴重糾紛升級”。這句話的分量遠超商業競爭層面——它直指合同條款的嚴肅性。OpenAI、Anthropic、Google的服務條款均明確禁止使用模型輸出來構建競爭性系統。

這是AI行業首次有大型前沿實驗室因蒸餾擔憂，公開限制員工使用競品編碼工具。但這只是2026年蒸餾戰爭全面升級的最新一幕。

回看2026年，蒸餾爭議的烈度逐月攀升，從企業指控到國會聽證，從法庭證詞到白宮政策——

2月12日，OpenAI向美國眾議院中國特設委員會提交備忘錄，指控DeepSeek使用“新的、混淆的方法”蒸餾其模型訓練R1。
2月23日，Anthropic率先發難，指控DeepSeek、月之暗面、MiniMax三家中國公司實施“工業級蒸餾攻擊”，涉及超過2.4萬個虛假賬號、1600萬次交互。馬斯克隨即在X平臺反嗆：“還好意思說別人蒸餾？”
4月30日，在xAI訴OpenAI案法庭上，馬斯克被問及xAI是否蒸餾了OpenAI模型來訓練Grok，給出“部分是的”（Partially yes）的回答。
5月初，白宮發布“反蒸餾”政策備忘錄，將蒸餾問題從商業糾紛上升至國家安全層面。
6月10日，Anthropic再次向美國參議院銀行委員會致信，指控阿里巴巴關聯方在4月22日至6月5日期間，通過約2.5萬個虛假賬戶發起超過2880萬次Claude交互——Anthropic稱之為“已知最大規模的蒸餾攻擊”。
6月13日，美國政府以國家安全為由，要求AI企業限制非美國公民訪問頂尖大模型。
6月29日，The Information曝出Meta內部禁令：限制工程師使用Claude Code和Codex。

蒸餾已經從學術概念，演變為AI軍備競賽中最隱蔽也最高效的武器。

拆解Meta的矛盾

Meta在AI領域的標簽始終是“開源急先鋒”。從Llama 2到Llama 3再到Llama 4，扎克伯格反復宣講“開放AI”的價值觀。Meta搭建了開放的生態，允許外部開發者基于Llama微調、二次開發，甚至鼓勵商業產品落地。

但Meta對自己內部核心數據和訓練流程的保護，遠比外界想象中嚴苛。

這構成了一個商業悖論。面向外部開源Llama，Meta輸出的是一套戰略：通過降低AI技術門檻，削弱OpenAI和Google的封閉生態優勢，讓Llama成為行業事實標準。可一旦涉及自家核心模型的訓練數據——那些真正決定下一代模型能力上限的高質量數據集——Meta立刻切換到最保守的防御姿態。

Meta不希望別人蒸餾它，但也不想“不小心”蒸餾了別人——前者損害競爭壁壘，后者可能引爆法律風險。一位業內觀察者如此表示

這種雙重身份在2025-2026年的行業環境中愈發難以維持。Anthropic在2025年8月底修訂了消費者條款，宣布用戶對話數據將默認用于模型訓練，但用戶可選擇退出（opt-out）。據Anthropic官方公告，這一變更于9月28日正式生效，直接引起了Meta法務和安全團隊的高度警惕——當數據默認流向訓練集，誰訓練了誰的數據，在法律上變得說不清。

Meta的恐懼首先來自合同層面。OpenAI、Anthropic、Google的服務條款均明令禁止使用模型輸出構建競爭性系統。若Meta被證實利用Claude或Codex的輸出訓練自家模型，備忘錄中“嚴重升級”四個字指向的，很可能是訴訟或天價賠償。

更深一層是競爭壁壘。Meta正在自研AI編碼助手MetaCode。如果內部工程師一邊花著Meta預算開發MetaCode，一邊依賴Claude Code和Codex完成關鍵編碼工作，那MetaCode最終的能力究竟是Meta自己的，還是“借”來的？你無法證明自己的模型能力是“自己長出來的”還是“偷來的”。講不清這個故事，損失的不僅是法律層面，更是投資者信心。

還有一層被忽視的現實是成本失控。Meta內部AI使用量呈指數級膨脹，2026年僅內部AI使用一項就將耗費數十億美元。這迫使公司必須控制員工對外部昂貴AI工具的消耗，一邊壓縮成本，一邊自研替代品。

最后是數據主權。當工程師用Claude Code調試訓練腳本時，Meta的專有代碼庫正通過API流向Anthropic服務器。對一家把AI作為核心戰略的公司而言，這是不可容忍的數據泄露路徑。Meta開發MetaCode的部分動機，正是要把這些敏感數據流完全封閉在自家基礎設施內。

蒸餾：AI行業最棘手的灰色地帶

蒸餾之所以讓所有大模型公司又愛又恨，是因為它在技術上幾乎不可防御。

OpenAI、Anthropic、Google都在服務條款中明確禁止蒸餾，但如何證明？當一個企業的工程師團隊每天產生數萬次API調用，哪些屬于“正常使用”，哪些屬于“蒸餾攻擊”，邊界極其模糊。

Anthropic在2026年6月指控阿里巴巴關聯方時，列舉了約2.5萬個虛假賬戶和超過2880萬次交互——這是能抓到的案例。但有多少蒸餾行為是“抓不住的”？當一家公司的員工在正常編碼工作中使用競品AI工具，再將生成的代碼片段作為參考寫入自己的訓練數據——這算不算蒸餾？在法律和技術兩個維度，答案可能截然不同。

更有意思的是Meta的“開源雙重標準”。Meta鼓勵外部開發者用Llama做任何事——包括蒸餾式的微調和二次開發。當外部開發者真的用Llama蒸餾了GPT-4的能力，Meta是受益者；而如果Meta自己的工程師“不小心”蒸餾了Claude，Meta就從受益者變成違規方。這種不對稱性，暴露出“開源AI”旗號背后的商業邏輯：開源是進攻的武器，封閉是防守的盾牌。

Meta這道禁令不止是內部IT管理，更像一個行業宣言——AI巨頭之間的“數據護城河”正從概念走向制度。

其他AI巨頭很可能跟進類似限制政策。Google、微軟、Amazon內部都在大量使用競品AI工具，面臨同樣的蒸餾風險。Meta一旦開了先例，合規團隊沒有理由坐視不理。

政策層面同樣在加速。白宮5月發布“反蒸餾”政策備忘錄，將蒸餾問題從企業間的合同糾紛上升至國家安全議題。6月13日，美國政府更進一步，要求AI企業限制非美國公民對頂尖模型的訪問權限。蒸餾的監管化，正在改變整個行業的競爭規則。

“空氣間隙”企業級AI編碼工具將迎來需求爆發。如果Claude和GPT-4這類模型無法滿足企業對數據殘留的合規要求，真正的贏家或許是那些能提供完全本地部署或私有云方案的AI公司。Meta選擇自研MetaCode，本質上就是走這條路。對Anthropic和OpenAI而言，這是挑戰也是機會——誰能更快推出讓企業客戶放心的部署方案，誰就能在下一階段占據先機。

蒸餾不會消失。它就像互聯網早期的盜版問題——技術和法律將在動態博弈中不斷尋求平衡。真正值得追問的是：當蒸餾變得越來越困難之后，那些靠“借力”起家的AI公司，還能否找到真正的獨立創新路徑？

（本文首發鈦媒體APP，作者 | 硅谷Tech-news，編輯 | 趙虹宇）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.