![]()
新智元報道
![]()
【新智元導讀】你每天用Codex、Claude Code寫代碼,從沒想過一個問題:這份聰明,到底算誰的?
今年5月,Meta給自家工程師劃了一道紅線。
應用AI工程部門的人,不能再隨便用Claude Code和Codex了。
![]()
據The Information拿到的內部指南,一份備忘錄甚至直接要求,暫停某些用到這兩個模型的任務。文件措辭很重,說這可能觸發「與合作方的嚴重升級」。
然而,反常也就反常在這兒。
Meta是Claude Code在全球最大的客戶之一。它今年內部用AI的總賬單,正奔著數十億美元去。
天天離不開的工具,公司花大錢買來,現在卻在內部限制使用。而限制的理由,你大概也想不到。
不是它們不好用。恰恰相反,是太好用了。
這條紅線
現在仍在生效
據The Information報道,這套限制5月就定下,至今仍在生效。
Meta為何如此緊張,這要從它內部一個AI編程助手項目說起。
今年,它組建了一個應用AI工程團隊,主攻自研的AI編程助手MetaCode(原名DevMate)。
目標就是別再讓Meta花大價錢繼續使用別人的AI編程模型,自己也要訓一個出來。
![]()
Claude Code官方界面。它與OpenAI的Codex,已是職業開發者做智能體編程的事實標準。
可要練出一個會寫代碼的模型,沒那么簡單。
你得喂給它海量高質量數據,還得出足夠多、足夠刁鉆的編程題,讓它練手、給它判分。這套題庫和評測,幾乎決定了一個編程模型最終有多強。
但問題恰恰出在這兒。
Meta遇到的難題,是怎樣才能不讓員工太過依賴這些外部工具,去打造內部的替代品。
它所擔心的,是這些外部模型的輸出滲進訓練數據,讓自己造的模型,偷偷學了對手的本事。
要看懂這層擔心,得先知道一個模型是怎么「學」的:你喂給它什么樣的數據,它就長成什么樣子。
MetaCode想變強,靠的就是工程師攢的那套訓練數據和編程題庫。
可一旦這些題目、答案、甚至判分標準出自Claude或Codex,MetaCode學到的,就不再是「人類工程師訓練出來的本事」,而是「Claude的本事」。
它照著對手的卷子抄答案,越練越像對手。
更隱蔽的,是評測這一環。
模型每答一道題,得有個東西告訴它答得好不好,它才知道往哪兒改。
如果出題和判分都交給Codex,那MetaCode就是在朝著「Codex覺得對」的方向進化,等于把對手的判斷標準,一點點復刻進了自己腦子里。
這就是為什么,Meta的這份指南不讓AI當出題人、判卷人,連「AI生成的材料能不能進被測模型讀得到的環境」都要管。
只要對手的輸出有一絲滲進訓練或評測的鏈條,這條「誰教會了誰」的界線,就糊了。
說到底,Meta暫停部分任務,是在給訓練數據做隔離。
怕的是AI寫得太好,分不清哪些本事是自己訓練出來的,哪些是從Claude和Codex那兒學習來的。
而后面這層能力,是租來的,并不是自己的。
細到讓人意外的限制
要先說清楚,Meta的內部文件里,并沒有任何員工真違規的記錄。
Meta發言人也回應,公司有「明確的政策」規范怎么用AI工具。所以這份文件,更像是在內部提前拉響警報。
哪些活不能讓AI碰?主要是以下三類:
第一,不能拿Claude或Codex的輸出,去給自家模型出測試題。指南的原話是,這「明確屬于工程師不在駕駛位的范疇」,「我們不要源自模型的任務」。
第二,不能讓AI在源碼里找bug,也不能讓它基于代碼分析幫你想「該測什么」。
第三,AI生成的任何東西,都不能放進被測模型能訪問到的地方。
說白了,只要AI參與了「該測什么、答得對不對」的判斷,對手的本事就可能混進來。三條堵的都是這個口子。
哪些活還能讓AI干?
搭工作流、整理代碼和文件、給內部工具搭測試的架子,這些日常雜活可以。指南把這類工作稱作「測試腳手架(test scaffolding)」和「方案校準(solution calibration)」,說白了就是打下手、搭框架。
哪怕是這些活,也有一條鐵律:AI的每一行產出,人都得先過一遍眼。
在Meta看來,一旦讓對手的模型來出題、判卷,這場考試就說不清是誰考出來的了。
它真正想守住的,就是那條「誰教會了誰」的界線。
繞不開的「蒸餾陷阱」
Meta擔心的這件事,業內有個專門名詞:蒸餾(distillation)。
意思不難懂:拿一個更強的模型,讓它不停答題,再用這些答案去訓練一個較弱的模型。
有點像讓學霸把卷子從頭做一遍,學渣照著抄,幾個月就追上人家好幾年的功力。
別人在數據、算力、研究上砸的天價投入,你近乎免費蹭走。
從零訓一個前沿模型,燒的錢和時間是天文數字。而蒸餾,可能只要對方一批輸出,成本和工期都砍到零頭。
蒸餾本身是業界常規操作,大廠也常拿自家大模型蒸餾出更小、更便宜的版本給用戶用。
麻煩只在于:一旦你抄的是別人家的模型,你訓出來的能力,到底是自己練的,還是順來的?說不清。
有人把這叫「蒸餾陷阱」:你越是靠最強的模型去搭自己的地基,就越難證明,你的聰明到底打哪來。
![]()
在美國,法律并未明文禁止蒸餾,AI生成的內容也不受版權保護。你拿對方的輸出去練自己的模型,法律這一關基本攔不住。
唯一的關卡是合同。
OpenAI、Anthropic的服務條款都寫了類似的限制:不許拿模型的輸出,去造一個跟自己競爭的東西。
而且這道關卡,執法權全在競爭對手手里。
去年,Anthropic就直接掐斷了OpenAI對Claude的接口(API)訪問,哪怕OpenAI說自己只是拿來評測能力和安全性,是「行業標準」做法。
就連馬斯克,也在今年4月的一場庭審上被迫承認,他的xAI「部分」蒸餾過OpenAI的模型。
![]()
2026年4月30日,在加州聯邦法院的證人席上,馬斯克被問到xAI是否對OpenAI模型用了蒸餾技術來訓練Grok,他先稱這是AI公司的普遍做法。
當被追問這是否等于「是」時,他回答是「部分」。
規則模糊,「執法權」都攥在競爭對手手里。誰敢拿自己幾十億的投入,去賭對手不翻臉。
從這個角度看,Meta的緊張,一點都不多余。
這里,還有一個算盤就是省錢。
按內部備忘錄,Meta今年光內部用AI這一項,就要燒掉數十億美元。它甚至開始給員工的token用量設上限。財大氣粗如Meta,也開始嫌AI太貴、要精打細算了。
如果能把開發工作從昂貴的外部工具轉到自家MetaCode上,既省了錢,又躲開了蒸餾的雷,可謂一舉兩得。
一張走鋼絲的地圖
關于Meta這套內部文件,科技法學者、法律顧問Mark Leiser有一句話很形象:這「幾乎就是一張走鋼絲的地圖」。
一邊要獲得外部模型的好處,一邊又得防著它的本事溜進自家系統。
像這樣走鋼絲的,當然不止Meta一家公司,它戳中的是整個行業的命門。
當你用一個足夠聰明的AI,去造另一個同樣聰明的AI,到最后,你可能很難說清:這份聰明,究竟是你自己練出來的,還是從別人的AI那兒悄悄學來的。
而且這事,離普通人也沒那么遠。
你用AI寫的代碼、改的方案、攢的資料,喂回去又會變成下一代模型的養料。
在這個循環中,誰站在誰的肩膀上,那條界線已經變得越來越糊。
當AI開始幫我們造AI,我們還分得清,本事到底是誰的嗎?
參考資料:
https://x.com/kimmonismus/status/2071591755351224344
https://www.theinformation.com/articles/internal-docs-show-meta-putting-limits-claude-codex-fearing-distillation
編輯:元宇
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.