![]()
一次低級(jí)失誤,讓全球開(kāi)發(fā)者拿到了 AI 編程工具的「行業(yè)標(biāo)準(zhǔn)答案」。
作者|樺林舞王
編輯|靖宇
如果幾天前有人告訴我,號(hào)稱(chēng)「最重視 AI 安全」的 Anthropic,會(huì)在一周之內(nèi)連續(xù)泄露兩次核心機(jī)密,我大概會(huì)覺(jué)得這是愚人節(jié)段子。
但它偏偏發(fā)生在愚人節(jié)前一天。
3 月 31 日,安全研究員 Chaofan Shou 發(fā)現(xiàn),Anthropic 在 npm 上發(fā)布的 Claude Code 2.1.88 版本里,塞了一個(gè) 59.8MB 的 source map 文件。這個(gè)本該用于內(nèi)部調(diào)試的文件,指向了 Anthropic 自己 Cloudflare R2 存儲(chǔ)桶里的一個(gè) zip 壓縮包——里面是 Claude Code 完整的 TypeScript 源代碼,約 1900 個(gè)文件,51.2 萬(wàn)行代碼。
幾小時(shí)內(nèi),GitHub 上出現(xiàn)了多個(gè)鏡像倉(cāng)庫(kù)。其中一個(gè)名叫「claw-code」的項(xiàng)目,兩小時(shí)內(nèi)拿下 5 萬(wàn)顆星,成為 GitHub 歷史上漲星最快的倉(cāng)庫(kù)。fork 數(shù)超過(guò) 4.15 萬(wàn)。
而就在五天前,Anthropic 剛剛因?yàn)橐粋€(gè)未加保護(hù)的公開(kāi)數(shù)據(jù)緩存,泄露了下一代模型「Mythos」的存在——一個(gè)被內(nèi)部描述為「能力階躍式提升」、在網(wǎng)絡(luò)安全能力上「遠(yuǎn)超所有現(xiàn)有 AI 模型」的新模型。
一周兩次泄露。一個(gè)講安全的公司,被自己的安全問(wèn)題打了臉。開(kāi)發(fā)者社區(qū)的評(píng)價(jià)相當(dāng)統(tǒng)一——「諷刺得不真實(shí)」。
但諷刺歸諷刺,泄露出來(lái)的東西,是真的有料。一個(gè)更重要的問(wèn)題是,AI 公司,應(yīng)該如何利用這次「泄露」,抄作業(yè)?
01
Claude Code「殼子」里有什么?
很多人第一反應(yīng)是:Claude Code 不就是一個(gè)套了模型 API 的命令行工具嗎?源代碼泄露了又怎樣,沒(méi)有模型權(quán)重,這些代碼不過(guò)是個(gè)「殼子」。
這個(gè)判斷對(duì)了一半。Claude Code 確實(shí)是個(gè)殼子,但它是一個(gè)精密到讓人意外的殼子。
先看工具系統(tǒng)。Claude Code 采用了類(lèi)似插件的架構(gòu),每種能力——文件讀寫(xiě)、shell 執(zhí)行、網(wǎng)頁(yè)抓取、LSP 集成——都是一個(gè)獨(dú)立的、有權(quán)限管控的工具模塊。光是工具定義層就有 2.9 萬(wàn)行 TypeScript。
每個(gè)工具的描述不是簡(jiǎn)單的一句話(huà),而是詳細(xì)到告訴模型「什么時(shí)候該用這個(gè)工具、怎么用、用完之后期望什么結(jié)果」。這些描述本身就是一種精心調(diào)優(yōu)的 prompt engineering。
再看記憶系統(tǒng)。泄露代碼揭示了一個(gè)三層「自修復(fù)記憶」架構(gòu)。最底層是 MEMORY.md,一個(gè)輕量級(jí)索引文件,每行大約 150 個(gè)字符,始終加載在上下文中。具體的項(xiàng)目知識(shí)分散在「主題文件」里,按需加載。原始對(duì)話(huà)記錄則永遠(yuǎn)不會(huì)整體回讀到上下文中,只在需要時(shí)通過(guò) grep 檢索特定標(biāo)識(shí)符。
也就是說(shuō),Anthropic 的工程師花了大量時(shí)間解決的核心問(wèn)題,不是「怎么調(diào)用 API」,而是「怎么在有限的上下文窗口里,讓模型盡可能聰明地工作」。
然后是那個(gè)讓所有人都興奮的 KAIROS。
這個(gè)以古希臘語(yǔ)「恰當(dāng)?shù)臅r(shí)機(jī)」命名的功能,在源代碼中被提及超過(guò) 150 次。它是一個(gè)自主守護(hù)進(jìn)程模式,讓 Claude Code 作為一個(gè) always-on 的后臺(tái)代理持續(xù)運(yùn)行。更有意思的是它的「autoDream」邏輯——在用戶(hù)空閑時(shí),代理會(huì)進(jìn)行「記憶整合」,合并零散觀察、消除邏輯矛盾、把模糊洞察轉(zhuǎn)化為確定性事實(shí)。
換句話(huà)說(shuō),Anthropic正在讓 AI 編程助手從「你問(wèn)我答」的工具,進(jìn)化為一個(gè)「持續(xù)理解你的項(xiàng)目、主動(dòng)發(fā)現(xiàn)問(wèn)題」的協(xié)作者。
此外,泄露代碼還包含 44 個(gè)未上線(xiàn)的 feature flag,覆蓋了多代理協(xié)調(diào)模式(COORDINATOR MODE)、語(yǔ)音交互(VOICE_MODE)、30 分鐘遠(yuǎn)程規(guī)劃會(huì)話(huà)(ULTRAPLAN),甚至還有一個(gè)拓麻歌子風(fēng)格的終端寵物(BUDDY),有 18 個(gè)物種和稀有度等級(jí)。
還有兩個(gè)細(xì)節(jié)值得一提。一個(gè)是「frustration regex」——一段正則表達(dá)式,用來(lái)檢測(cè)用戶(hù)是否在罵 Claude。用正則比用模型推理來(lái)判斷用戶(hù)情緒要快得多、便宜得多。
另一個(gè)是「undercover mode」,Anthropic 用 Claude Code 給公開(kāi)的開(kāi)源項(xiàng)目做「隱身貢獻(xiàn)」,系統(tǒng)提示詞明確寫(xiě)著:「你正在 UNDERCOVER 模式下運(yùn)行……你的 commit 信息不能包含任何 Anthropic 內(nèi)部信息。不要暴露身份。」
02
中國(guó) AI 公司能學(xué)到什么
現(xiàn)在回到真正重要的問(wèn)題。
過(guò)去一年,中國(guó) AI 編程工具賽道明顯加速。字節(jié)的 Trae 已經(jīng)從最初的 MarsCode 演進(jìn)為一個(gè) AI 原生 IDE,集成了 Agent 模式,支持從需求理解到代碼編寫(xiě)再到測(cè)試的全流程自動(dòng)化。智譜的 CodeGeeX 主打開(kāi)源和本地部署,在中文代碼理解上做了深度優(yōu)化。通義靈碼、豆包 MarsCode 也都在快速迭代。
但如果拿這些產(chǎn)品和 Claude Code 泄露的架構(gòu)對(duì)比,差距不在「能不能用」,而在工程精細(xì)度上。
第一課:工具描述就是產(chǎn)品力。
這可能是最容易被忽視、也最值得學(xué)的一點(diǎn)。
Claude Code 對(duì)每個(gè)工具的 prompt 描述經(jīng)過(guò)了極其精細(xì)的調(diào)優(yōu)——什么時(shí)候用、什么時(shí)候不用、用了之后怎么處理結(jié)果、出錯(cuò)了怎么重試。這些描述本質(zhì)上是在教模型「怎么做一個(gè)好的程序員」。
國(guó)內(nèi)很多工具的 tool use 實(shí)現(xiàn)還停留在「給模型一個(gè)函數(shù)簽名,讓它自己猜怎么用」的階段。光是把工具描述寫(xiě)到 Claude Code 的水平,就能讓同一個(gè)模型的表現(xiàn)提升一個(gè)檔次。
第二課:記憶架構(gòu),比模型參數(shù)更影響用戶(hù)體驗(yàn)。
Claude Code 的三層記憶系統(tǒng)解決的是一個(gè)很現(xiàn)實(shí)的問(wèn)題——模型的上下文窗口是有限的,你不能把所有歷史對(duì)話(huà)都塞進(jìn)去。
Anthropic 的做法是把記憶分層——熱數(shù)據(jù)始終在線(xiàn),溫?cái)?shù)據(jù)按需加載,冷數(shù)據(jù)只做索引。這種思路并不新鮮,但它在 AI 編程工具里的工程實(shí)現(xiàn),國(guó)內(nèi)團(tuán)隊(duì)大多還沒(méi)做到這個(gè)精細(xì)度。
第三課:情緒感知不是玄學(xué),是工程問(wèn)題。
用一段正則表達(dá)式檢測(cè)用戶(hù)是否在發(fā)火,然后調(diào)整回復(fù)策略。
這個(gè)方案簡(jiǎn)單到粗暴,但極其實(shí)用。它告訴你一個(gè)道理——好的 AI 產(chǎn)品不是每個(gè)問(wèn)題都需要用模型來(lái)解決,有時(shí)候一個(gè) regex 就夠了。
國(guó)內(nèi)做 AI 工具的團(tuán)隊(duì),經(jīng)常陷入「所有問(wèn)題都要丟給大模型」的思維慣性,這是一種浪費(fèi)。
第四課:KAIROS 指向的方向,比 KAIROS 本身更重要。
一個(gè) always-on 的后臺(tái)代理,在用戶(hù)不用的時(shí)候自動(dòng)整理記憶、發(fā)現(xiàn)問(wèn)題。
這個(gè)產(chǎn)品方向意味著 AI 編程助手的下一步不是「更快地回答問(wèn)題」,而是「在你沒(méi)有問(wèn)問(wèn)題的時(shí)候,就已經(jīng)在工作」。
目前國(guó)內(nèi)的 AI 編程工具幾乎全部是響應(yīng)式的——用戶(hù)發(fā)指令,工具執(zhí)行。
誰(shuí)先把守護(hù)進(jìn)程模式做出來(lái),誰(shuí)就可能定義下一代產(chǎn)品形態(tài)。
03
「抄」的邊界在哪里
當(dāng)然,學(xué)習(xí)和抄襲之間有一條線(xiàn)。
法律層面,這不是開(kāi)源代碼,而是意外泄露的商業(yè)軟件。直接基于泄露代碼構(gòu)建產(chǎn)品,版權(quán)風(fēng)險(xiǎn)是明確的。GitHub 上「claw-code」宣稱(chēng)要用 Rust 重寫(xiě),但如果核心邏輯照搬,法律邊界依然模糊。
對(duì)于中國(guó)公司來(lái)說(shuō),在出海壓力越來(lái)越大的背景下,這種風(fēng)險(xiǎn)需要認(rèn)真評(píng)估。
技術(shù)層面,Claude Code 的很多設(shè)計(jì)決策,是針對(duì) Claude 模型能力深度定制的。比如它的工具描述寫(xiě)得那么長(zhǎng)、那么詳細(xì),是因?yàn)?Claude 的長(zhǎng)上下文處理能力足夠強(qiáng),不會(huì)因?yàn)橄到y(tǒng)提示詞太長(zhǎng)而「走神」。換成上下文窗口短、指令遵循弱的模型,照搬同樣的 prompt 策略可能適得其反。
真正聰明的做法不是 fork 這 51 萬(wàn)行代碼,而是理解每一個(gè)設(shè)計(jì)決策背后的 tradeoff,然后針對(duì)自己的模型特點(diǎn)重新實(shí)現(xiàn)。
架構(gòu)思路可以學(xué),工具編排模式可以學(xué),記憶分層策略可以學(xué)——但實(shí)現(xiàn)必須是自己的。
還有一個(gè)容易被忽略的現(xiàn)實(shí)——Anthropic 泄露的是一個(gè)快照,而他們的工程團(tuán)隊(duì)每天都在迭代。44 個(gè) feature flag 意味著至少十幾個(gè)重大功能在排隊(duì)上線(xiàn)。
你今天 fork 的代碼,下個(gè)月就是舊版本。追著抄,永遠(yuǎn)追不上;理解了原理,才能跑出自己的路線(xiàn)。
這次泄露最大的意義可能不在技術(shù)細(xì)節(jié),而在于它撕掉了一層神秘感——原來(lái) Anthropic 最核心的 AI 編程工具,底層也不過(guò)是精心設(shè)計(jì)的 prompt 編排,加上工程化的工具調(diào)度。
沒(méi)有黑魔法,只有大量的細(xì)節(jié)打磨。
這對(duì)中國(guó) AI 公司來(lái)說(shuō),其實(shí)是個(gè)好消息。它意味著差距是可以彌合的。前提是,你得有耐心去打磨那些細(xì)節(jié)——而不是想著直接把別人的代碼拿過(guò)來(lái)改個(gè)名字。
*頭圖來(lái)源:LinkedIn
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO
傳統(tǒng)短劇劇組急剎車(chē),AI 產(chǎn)能大爆發(fā),短劇行業(yè)正在經(jīng)歷殘酷的「大換血」。本期直播,極客公園邀請(qǐng)一線(xiàn) AI 短劇操盤(pán)手與 AI 視頻技術(shù)專(zhuān)家:aipai.ai創(chuàng)始人陳坤、九紫源AI創(chuàng)始人/總導(dǎo)演丁寬、可靈AI 創(chuàng)作者及行業(yè)運(yùn)營(yíng)負(fù)責(zé)人王若暄。
今晚 20:00,極客公園視頻號(hào)直播間,一起聊聊:當(dāng) GPU 接管了導(dǎo)、演、攝、錄,AI 短劇的機(jī)會(huì)究竟在哪里?短劇行業(yè)的下半場(chǎng)要拼什么?
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.