網易首頁 > 網易號 > 正文 申請入駐

撕開Claude Code真相:讓它好用的98.4%,是工程不是AI

0
分享至


新智元報道

編輯:元宇

【新智元導讀】當普通人還在鉆研「最強提示詞咒語」時,硅谷頂級實驗室已經把AI基建跑成了生產線。

你還在ChatGPT的聊天框里反復調prompt?

最近,一位X用戶發了條推文,開頭就是一個驚呼:頭部大廠偷偷在用的Claude Code項目模板外泄!

這已經不是寫提示詞了。這是AI工程基礎設施。


整套打法圍繞一個文件「CLAUDE.md」展開,而它的核心原則只有三條:

每次Claude犯錯→你加一條規則;每次你重復自己→你加一個工作流;每次出bug→你加一道護欄。


這樣做,是要把項目經驗沉淀成它每次啟動都會讀取的長期上下文和自動化約束。

整個架構,像是一家AI公司的崗位編制:CLAUDE.md是入職手冊,skills/是工作SOP,hooks/是合規部,docs/是公司章程,tools/是后勤組,src/才是真正出活的業務部門。


你不再是在和AI聊天了,而是在構建一個了解你代碼倉庫的AI。

最瘋狂的部分是,你只需要配置一次,Claude就會自動審查代碼,并按指令重構、強制執行架構規則、撰寫發布說明、從技能中運行工作流、記住過去錯誤等。

而且它會越用越聰明。

大多數人,都是打開ChatGPT,寫提示詞,復制粘貼,反復;而在這套打法下,你只需要打開終端,跑一個skill代碼已交付。

這等于是在自己的代碼庫里養了一隊AI同事。

這條推文背后,傳遞的是這個時代正在悄悄翻篇的一個小信號,大多數人可能還沒反應過來。

一張不算泄露的「泄露截圖」

撕開一個真相

@ai_rohitt曬出來的這張截圖,是Anthropic官方文檔里公開推薦的Claude Code標準范式。


CLAUDE.md是Claude Code在每次會話開始時自動讀取的項目記憶文件。

.claude/skills/和.claude/hooks/是官方支持的擴展機制。

這些都是社區已經討論了幾個月的公開做法,并不是什么人偷出來的「內部模板」。

但它之所以能讓一些資深開發者主動轉發,說明它得到了一些天天用Claude的開發者們的認同。

其中相當一部分人,可能這兩天才意識到原來它還能這么用。

而硅谷頂級團隊,已經把這件事跑成了生產線。

第一個例子,是OpenAI Frontier團隊。

OpenAI官方披露的Frontier團隊實驗中,一個從空repo起步的內部beta,在約5個月內由Codex生成了約100萬行代碼和約1500個PR;團隊從3人擴展到7人,人工不直接寫代碼。

帶隊的Ryan Lopopolo在后續訪談中進一步提到,這套工作流已經接近「0 人工代碼、0 人工 review」的極限形態。

他認為與其節省token,不如利用模型極高的并發能力和極低的成本來代替人類有限且昂貴的同步注意力。

第二個例子,是Stripe內部的自動化代碼代理系統Minions。

Stripe內部的Minions每周生成并推動超過1300個PR合并,這些代碼從頭到尾由AI生成,但仍經過人工review。

這里還有一對數據:1.6%vs98.4%,它來自Mohamed bin Zayed AI大學VILA-Lab發表的一篇論文。


https://arxiv.org/pdf/2604.14228

研究者系統性扒了Claude Code v2.1.88版本51.2萬行TypeScript源碼,給出的結論是:只有1.6%是AI決策邏輯,剩下的98.4%是確定性的工程基礎設施。

具體說就是權限網關、上下文管理、工具路由、錯誤恢復這四類。

這組數字不是說模型只貢獻1.6%的能力,而是說明Claude Code作為產品,大量復雜度不在模型本身,而在權限、上下文、工具路由、恢復機制等確定性工程基礎設施上。

@ai_rohitt那張圖里的CLAUDE.md/skills/hooks結構,就是普通開發者也能搭一套的「入門版基建」,它和OpenAI、Stripe那套生產級架構是同一種范式,只是規模小得多。

CLAUDE.md暴露的秘密

過去3年,所有人都在問「GPT什么時候能更聰明」「Claude什么時候出新版本」。

但真正在生產環境跑通AI編程的團隊,他們更關心的可能根本不是這個,而是如何讓AI記住自己上次踩過的坑,怎么讓AI在動手前先看一眼項目的架構約束,怎么讓AI犯錯的時候自己被工具擋住。

CLAUDE.md正是這一切的承載體。

Anthropic官方對它的定義只有一句:

一個markdown文件,放在項目根目錄,Claude Code在每次會話開始時自動讀取。


https://code.claude.com/docs/en/memory

聽上去很簡單,圍繞它展開的那幾層結構,才是它真正厲害的部分。

CLAUDE.md是項目大腦。

架構決策、命名約定、測試要求、那些反復踩過的坑,都堆在這里。它是AI每次啟動時第一眼看到的「員工手冊」。

.claude/skills/是可復用工作流。

Claude Code的創建者Boris Cherny在社區里反復強調一句話:「如果你每天做某件事超過一次,把它變成skill或command!

一個skill就是一段可執行的方法論。Code review、生成commit message、寫發布說明,這些都不該是每天手敲提示詞的活,應該是skill調一下就出結果。

.claude/hooks/是自動護欄。

這是最關鍵的部分。它不依賴AI自己判斷,由確定性代碼在AI犯錯之前就擋住它。這就是為什么敢讓AI「無人監督」地跑,因為出錯的邊界由hooks卡死了。

docs/decisions/是架構決策記錄。

讓AI不僅知道代碼「是什么」,還知道代碼「為什么是這樣」。

這一項最容易被忽略,但也是AI協作最大的杠桿點。

tools/和src/是執行層。

這套架構真正值得注意的地方,不在于某個開發者搞出了一個漂亮目錄,而是越來越多獨立團隊正在收斂到同一個方向:把模型放進一套由上下文、工具、權限、評估和反饋循環組成的harness里。

GitHub上已經能看到不少類似項目:

rohitg00的awesome-claude-code-toolkit、diet103的claude-code-infrastructure-showcase、affaan-m的everything-claude-code,都在圍繞agents、skills、hooks、rules、MCP configs等組件搭建Claude Code的工程化工作環境。

這說明,真正成熟的AI編程工作流,不是只靠一個更強的模型,也不是只靠一條更長的prompt,而是把模型嵌入一套可復用、可約束、可恢復、可審計的工程系統里。

至于具體目錄結構,各家實現并不完全相同。

OpenAI實驗室的極限實驗

2026年2月11日,OpenAI官方博客發了一篇文章:《Harness engineering: leveraging Codex in an agent-first world》。


https://openai.com/index/harness-engineering/

Anthropic圍繞這個概念重新調整了Claude Code的架構思路;Martin Fowler的網站把它凝練成一個公式:「Agent=Model+Harness!

Harness這個詞來自馬術。它指的是馬的整套挽具,韁繩、馬嚼子、馬鞍、籠頭。

一匹馬可以跑得很快很有力,但它自己不知道往哪兒走:整套挽具決定了它的方向。

類比到AI編程:模型本身能力很強,但它不知道在你的代碼庫里該往哪兒走。Harness就是你為它造的方向盤+剎車+導航。

OpenAI Frontier團隊那個「100萬行0人工」的實驗,本質就是把Harness做到極致。

他們的關鍵工程實踐包括以下幾條。

層級架構強約束。

從Types到Config到Repo到Service到Runtime到UI,依賴關系單向流動,由linter在CI層強制執行。Agent寫出違反層級關系的代碼?直接構建失敗。

linter錯誤信息本身是修復指令,這也是最反直覺的細節。

普通項目的lint錯誤是「violation detected」,給人看的;OpenAI Frontier的lint錯誤是「use logger.info({event: 'name', ...data}) instead of console.log」,給Agent看的、可以直接讀懂并修復的指令。

文檔作為單一事實來源。所有架構圖、execution plans、設計規范都在倉庫內部的docs/目錄。Agent不需要任何外部知識庫,一切就在repo里。

這套東西效果有多厲害?

模型沒有換,但LangChain調整了harness,包括系統提示、工具、中間件和推理模式,最終把Terminal Bench 2.0分數從52.8提到66.5。

你今天就能做的事

是為AI造一個項目大腦

問題回到普通開發者這里:如果范式已經轉移,作為一個普通工程師,今天就能做點什么。

第一件事,在你最重要的項目根目錄建一個CLAUDE.md。

不需要完美,也不需要很長。寫下你團隊的架構規則、命名約定、測試要求、那些反復踩過的坑,10分鐘能寫完一個能用的版本。

下次AI犯錯的時候,先不要手動修,而是問自己一句:CLAUDE.md里缺了什么?

第二件事,把每天重復做的事改造成skill。

這里要注意Boris Cherny的金句:「如果你每天做某件事超過一次,把它變成skill或command!

Code review、生成commit message、寫發布說明、修一類重復的bug,這些都該是skill,不該是每天手敲提示詞。

第三件事,在容易踩坑的地方加一個hook。

Hook是98.4%里最有杠桿的那部分。它不依賴AI變聰明,它依賴確定性代碼做強制檢查。這是把人類工程師的判斷力翻譯成機器可讀約束的過程。

這件事的核心不在寫代碼,而在寫規則。

Karpathy今年1月在推特上的那句被廣泛轉發的話:「我已經從80%手動寫代碼變成了80%交給Agent寫!

未來五年,工程師的能力曲線正在從「我能寫多少行代碼」轉向「我能為AI設計多嚴格的工作環境」。

寫代碼的活兒正在被Agent接管。

但設計那個讓Agent能寫出好代碼的世界,還是人的工作。而且比以前更難、更重要、也更有意思。

參考資料:

https://x.com/ai_rohitt/status/2048390767115428016?s=20

https://arxiv.org/pdf/2604.14228

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
看世界杯難了!FIFA想訛天價轉播費,央視這次變硬氣,國足立大功

看世界杯難了!FIFA想訛天價轉播費,央視這次變硬氣,國足立大功

體育大學僧
2026-05-01 08:10:01
俄羅斯前10大煉油廠停產5個!彼爾姆石油樞紐遭受重創

俄羅斯前10大煉油廠停產5個!彼爾姆石油樞紐遭受重創

項鵬飛
2026-04-29 19:13:54
斬殺中年男性的三件套:陽痿、失業和心梗!

斬殺中年男性的三件套:陽痿、失業和心梗!

燈錦年
2026-04-30 10:04:05
美軍承認難以防御高超音速武器

美軍承認難以防御高超音速武器

參考消息
2026-05-01 14:47:08
13000mAh!新機曝光:搭載驍龍8 Elite Gen5+4K屏!

13000mAh!新機曝光:搭載驍龍8 Elite Gen5+4K屏!

科技堡壘
2026-04-29 09:36:45
瓦倫丁一句“車隨便騎飯管夠”火了,雅馬哈被網友扒到褲子都掉了

瓦倫丁一句“車隨便騎飯管夠”火了,雅馬哈被網友扒到褲子都掉了

小娛樂悠悠
2026-05-01 08:34:20
廣東男籃老板給杜鋒下死命令 北京熱身賽21分大勝深圳 高詩巖復出

廣東男籃老板給杜鋒下死命令 北京熱身賽21分大勝深圳 高詩巖復出

中國籃壇快訊
2026-05-01 14:14:52
浙江義烏車主10小時開到武昌:零分下高速,400塊過路費全省了!

浙江義烏車主10小時開到武昌:零分下高速,400塊過路費全省了!

眼光很亮
2026-05-01 15:07:16
濟南夏雨荷事件,文旅兩任領導疑似滿族,公司名叫盛世乾隆

濟南夏雨荷事件,文旅兩任領導疑似滿族,公司名叫盛世乾隆

魔都姐姐雜談
2026-05-01 12:50:13
一個時代結束,大疆首都遇冷,禁飛令已下,閉店開始,網友喊冤?

一個時代結束,大疆首都遇冷,禁飛令已下,閉店開始,網友喊冤?

眼光很亮
2026-05-01 12:35:39
蔣中正日記手稿被揭露,字跡竟被稱作書法界的奇跡!

蔣中正日記手稿被揭露,字跡竟被稱作書法界的奇跡!

書畫相約
2026-04-30 11:14:19
75歲劉曉慶網紅王婆同臺,全程冷場不愿互動,現場尷尬氣氛拉滿

75歲劉曉慶網紅王婆同臺,全程冷場不愿互動,現場尷尬氣氛拉滿

童叔不飆車
2026-04-30 15:28:22
烏克蘭丈母娘為躲避戰爭,投奔遠嫁中國的女兒,來了就不想走

烏克蘭丈母娘為躲避戰爭,投奔遠嫁中國的女兒,來了就不想走

小陸搞笑日常
2026-05-01 14:18:25
太解氣了!00后求職者詢問薪資被以“面聊”回應,最終怒懟老板

太解氣了!00后求職者詢問薪資被以“面聊”回應,最終怒懟老板

火山詩話
2026-05-01 12:33:53
《乘風2026》三公路透,“李小冉毫無運動痕跡”登上熱搜

《乘風2026》三公路透,“李小冉毫無運動痕跡”登上熱搜

落雪聽梅a
2026-05-01 04:58:46
北京協和醫學院博士:千萬不要把煩死了、累死了、氣死了掛在嘴上

北京協和醫學院博士:千萬不要把煩死了、累死了、氣死了掛在嘴上

洞見
2026-04-30 09:25:41
掘金被淘汰!阿德爾曼很失望,直指籃板+陣容劣勢,談穆雷低迷!

掘金被淘汰!阿德爾曼很失望,直指籃板+陣容劣勢,談穆雷低迷!

籃球資訊達人
2026-05-01 14:42:31
《穿普拉達的女王2》公映:20年過去,我們為何仍對媒體、女性和權力著迷?

《穿普拉達的女王2》公映:20年過去,我們為何仍對媒體、女性和權力著迷?

iWeekly周末畫報
2026-05-01 10:10:58
單依純演唱會票賣不動了,粉絲覺得被割韭菜,版權和造型又惹爭議

單依純演唱會票賣不動了,粉絲覺得被割韭菜,版權和造型又惹爭議

小椰的奶奶
2026-05-01 09:13:21
森林狼3將身價暴漲!麥丹攻守一體,香農強突破,戈貝爾統治內線

森林狼3將身價暴漲!麥丹攻守一體,香農強突破,戈貝爾統治內線

籃球資訊達人
2026-05-01 12:49:43
2026-05-01 15:44:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15107文章數 66823關注度
往期回顧 全部

科技要聞

蘋果上季在華收入繼續大增 iPhone收入新高

頭條要聞

中國軍號:日本有個致命的戰略弱點 出兵就是作死

頭條要聞

中國軍號:日本有個致命的戰略弱點 出兵就是作死

體育要聞

無奈!約基奇:這要在塞爾維亞 全隊早被炒了

娛樂要聞

鄧超在景德鎮被偶遇,穿黑外套逛茶園

財經要聞

GPU神話松動,AI真正的戰場變了

汽車要聞

限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

態度原創

親子
旅游
家居
游戲
軍事航空

親子要聞

日本小兒子來家里了,喜娜醬直接撲進懷里,斬不斷的血緣關系

旅游要聞

預計暑期開園,山東首個國風機甲神話文旅項目落地德州

家居要聞

靈動實用 生活藝術場

6萬塊 限量500件!《巫師3》新雕像:杰洛特希里對飲

軍事要聞

伊朗:持續推進海上封鎖的行為不可容忍

無障礙瀏覽 進入關懷版