這兩天,Claude Code的源碼在網(wǎng)上傳得飛起。
誰都沒想到,程序員的一次疏漏,就把核心商業(yè)資產(chǎn)暴露在了全世界的面前。
在好奇心驅(qū)使下,我也忍不住去看了看,你別說,發(fā)現(xiàn)了幾個小秘密,還真有點意思。
01
用戶情緒失控? 趕緊用正則判斷一下!
你以為一個頂級 AI 產(chǎn)品,是怎么理解用戶情緒的?
大模型?情感分析?多模態(tài)推理?
不。
是一行正則表達式!
在userPromptKeywords.ts 中,有這么一段:
}看到其中的正則表達式?jīng)]有?也就是說,如果你罵它:
“This shit is broken again.” “Wtf”
它是能“聽懂”的,但你要是來一句:
“這破玩意怎么又壞了?”
不好意思,它一臉懵。
用中文它可聽不懂,“英語好,得學(xué)啊!”
不過更有意思的是,它檢測到你情緒崩潰之后,并不會“哄你”,不會變溫柔,不會道歉三連,也不會進入什么“安撫模式”。
它只是默默地把這件事記下來:“嗯,這個用戶剛剛罵人了。”
然后用于內(nèi)部統(tǒng)計,比如:有多少用戶在使用過程中爆粗口,哪些場景最容易讓人抓狂。
既然是這樣,就不需要那么精確了,一行正則就行了。
這段代碼背后的故事可能是這樣的:
經(jīng)理:老板想統(tǒng)計下用戶在使用Cluade Code時,心情沮喪的占多大比例,能做不?
實習(xí)生:可以做。
經(jīng)理:今天下午能上線不?
實習(xí)生:可以,我用一行正則表達式搞定。
02
長達5594行的文件!
我在IBM的時候遇到了一個神奇的項目,Web界面很漂亮,打開代碼一看: 一個歷史悠久,長達5000行的JSP。
那一刻我就覺得,這已經(jīng)是“屎山藝術(shù)”的巔峰了。
沒想到啊,這次在 Claude Code 里,又看到了熟悉的感覺:一個 5594 行的 TypeScript 文件。
![]()
用Claude Code分析一下這個Claude Code文件,結(jié)果如下:
![]()
其中一個行數(shù)就長達3170行,占了整個文件的57%。
![]()
當(dāng)然,公平地說一句:代碼本身不差,注釋挺清晰,類型也很規(guī)范。
問題不在“寫得爛”,而在:結(jié)構(gòu)已經(jīng)開始失控了。
它很可能是快速迭代下的產(chǎn)物,你幾乎可以還原它的成長路徑:
1.一開始:結(jié)構(gòu)清晰、模塊優(yōu)雅
2. 然后,加一個 subtype
3. 再加一個subtype
4. 時間來不及了,再加一個subtype吧
往一個現(xiàn)成的函數(shù)里加邏輯,永遠是最省事的,沒有程序員能抵抗這種誘惑。
03
有人想“蒸餾”我? 給丫投毒!
在 claude.ts 文件的 301–313 行,有一個叫 ANTI_DISTILLATION_CC 的開關(guān)。
一旦打開,Claude Code 在調(diào)用 API 時會帶上一個字段:anti_distillation: ['fake_tools']
}這個字段的作用是:告訴服務(wù)器在系統(tǒng)提示詞(system prompt)中偷偷加入一些假的工具(fake tools)定義。
如果有人在抓 API 流量,做數(shù)據(jù)蒸餾訓(xùn)練,這些假工具會混進訓(xùn)練數(shù)據(jù),模型會學(xué)到一堆“并不存在的能力”,最終效果肯定是越學(xué)越歪。
更狠的是,在betas.ts中,還有一套機制:服務(wù)端文本壓縮 + 簽名驗證。
Claude會把對話壓縮成摘要,簽名后傳給客戶端,下一輪對話時客戶端把簽名回傳,服務(wù)端再恢復(fù)原文。
結(jié)果就是你抓到了API響應(yīng),但只是摘要,關(guān)鍵內(nèi)容拿不到。
這樣做有兩個好處,一是節(jié)省Token,其次還是防止蒸餾。
04
嘿嘿,我是臥底!
這個臥底功能僅對Anthropic的員工。
在內(nèi)部項目里(白名單那種),Claude Code非常“坦誠”,commit message 里會寫上:
Co-Authored-By: Claude Opus 4.6 noreply@anthropic.com
PR 描述中會帶:
Generated with Claude Code (93% 3-shotted by claude-opus-4-5)
大家一看就知道:哦,這是我們家AI寫的。
但員工一旦切到外部開源項目,畫風(fēng)突變,直接進入“臥底模式”。
所有 commit、PR 標(biāo)題、描述,都要嚴(yán)格遵守一套規(guī)則:
不能提任何內(nèi)部模型代號
不能出現(xiàn)未發(fā)布版本號
不能暴露內(nèi)部倉庫信息
甚至連 “Claude Code” 這幾個字都不能出現(xiàn)
更不用說 Co-Authored-By 這種 AI 署名了
簡單說就是一句話:不允許留下任何“這是 AI 寫的”痕跡。
于是就出現(xiàn)了一個很微妙的畫面:
一個 Anthropic 員工,用Claude Code在 GitHub 上提交代碼,寫 PR、改 bug、過 review,看起來,完全就是一個普通人類開發(fā)者。
如果只是擔(dān)心模型細節(jié)泄露,這其實很好理解。
但現(xiàn)在是連“AI參與過”這件事本身,也被一起抹掉了,這就不只是“保護機密”了,而更像是讓 AI 安靜地混在人群里干活。
05
一點兒感想
翻完這堆代碼,我最大的感受就是:
不管是任何產(chǎn)品,不管外表看起來有多么光鮮亮麗,內(nèi)部都有可能混亂不堪啊。
不管底層模型多牛,到了應(yīng)用層,該用正則還是用正則,該有屎山還是有屎山。
AI產(chǎn)品本質(zhì)上還是軟件工程。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.