網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Coding的中場(chǎng)戰(zhàn)事

2026-05-19 07:51:13　來(lái)源: 錦緞研究院

北京舉報(bào)

分享至

本文系基于公開(kāi)資料撰寫(xiě)，僅作為信息交流之用，不構(gòu)成任何投資建議

圖：阿道夫·伊馮?（Adolphe Yvon）的畫(huà)作《凱撒渡過(guò)盧比孔河》

2026年5月，Coding（AI編程）越過(guò)了盧比孔河。

愷撒率軍渡過(guò)這條界河時(shí)，羅馬法規(guī)定：任何將領(lǐng)不得率兵越過(guò)。他渡河了，內(nèi)戰(zhàn)全面爆發(fā)，再無(wú)媾和余地。Coding在這個(gè)5月完成的，是一次性質(zhì)相同的跨越——大模型公司集體越過(guò)了“輔助工具”與“生產(chǎn)力主體”之間的界河。退路已斷，全面戰(zhàn)爭(zhēng)打響。

在古羅馬，渡河的消息傳回元老院，靠的是快馬和信使。在這個(gè)時(shí)代，消息傳開(kāi)的方式是一份營(yíng)收曲線圖。五月初的開(kāi)發(fā)者大會(huì)上，Anthropic CEO Dario Amodei 披露了一組數(shù)字：公司年化收入在三個(gè)月內(nèi)從約100億美元飆至440億美元，每天新增約9600萬(wàn)美元。一位研究了超過(guò)200家上市軟件公司IPO數(shù)據(jù)的風(fēng)險(xiǎn)投資人坦言，從未見(jiàn)過(guò)這樣的增速。

驅(qū)動(dòng)這一增速的核心引擎是一款編程智能體Claude Code。它從內(nèi)部工具起步，到2026年初占據(jù)AI編程工具市場(chǎng)54%的份額，API調(diào)用量過(guò)去一年同比增長(zhǎng)17倍。更直白的數(shù)字是：全球GitHub公開(kāi)提交中約4%由Claude Code參與完成，Anthropic預(yù)計(jì)到2026年底將超過(guò)20%。

這是一個(gè)堪稱(chēng)“事件視界”式的商業(yè)增長(zhǎng)故事。Claude Code跑通了一件事：Agent不只能輔助編程，它能在真實(shí)工程環(huán)境中接管任務(wù)、交付結(jié)果。這件事一旦被驗(yàn)證，編程就成了Agent從“對(duì)話工具”向“生產(chǎn)力主體”躍遷的臨界點(diǎn)。

所有大模型公司都在同一時(shí)刻看清了：誰(shuí)能統(tǒng)治coding，誰(shuí)就拿到了通向AGI的入場(chǎng)券。這張入場(chǎng)券的代價(jià)，是再也無(wú)法退回河對(duì)岸。

緣起：率先渡河者

Anthropic今天的領(lǐng)先地位，根源要追溯到2024年6月。但在那個(gè)時(shí)間點(diǎn)之前，還有一個(gè)更早的伏筆。

2023年初，Anthropic的聯(lián)合創(chuàng)始人Jared Kaplan在一次內(nèi)部技術(shù)評(píng)審會(huì)上，與訓(xùn)練團(tuán)隊(duì)發(fā)生了一場(chǎng)激烈的爭(zhēng)論。Kaplan主張把真實(shí)代碼倉(cāng)庫(kù)里的數(shù)據(jù)，而不是LeetCode和HackerRank上的競(jìng)賽題，作為編程訓(xùn)練的主要數(shù)據(jù)源。

反對(duì)的聲音來(lái)自幾個(gè)資深研究員，理由很充分：真實(shí)倉(cāng)庫(kù)里的代碼太“臟”了。架構(gòu)混亂、注釋缺失、風(fēng)格不統(tǒng)一，有些甚至帶著隱藏的安全漏洞。用這種數(shù)據(jù)訓(xùn)練，短期內(nèi)的基準(zhǔn)測(cè)試分?jǐn)?shù)很可能不好看。

Kaplan在爭(zhēng)論中說(shuō)了一句后來(lái)被反復(fù)提起的話：“現(xiàn)實(shí)世界就是臟的。你要教一個(gè)士兵打仗，就讓他到泥地里打滾。不要在體操房里給他發(fā)金牌。”

最終，Anthropic選擇了泥地。這個(gè)決定在接下來(lái)的兩年里，成為整個(gè)編程賽道最深的護(hù)城河。當(dāng)其他廠商的模型在SWE-bench上拿著高分、卻在企業(yè)客戶(hù)的私有倉(cāng)庫(kù)里頻頻斷腿時(shí)，Anthropic的模型從一開(kāi)始就被訓(xùn)練成處理那些“不干凈”的東西——遺留系統(tǒng)的技術(shù)債、被十個(gè)前任維護(hù)者改得面目全非的模塊、文檔早已過(guò)期的依賴(lài)鏈條。

2024年6月，Claude Sonnet 3.5發(fā)布。在當(dāng)時(shí)，主流AI編程工具的能力邊界非常清晰：補(bǔ)全下一行代碼。GitHub Copilot提示續(xù)寫(xiě)，也僅限于此。開(kāi)發(fā)者們已經(jīng)習(xí)慣了這種節(jié)奏，AI像一個(gè)過(guò)于熱心的實(shí)習(xí)生，能在你打了一半的語(yǔ)句后面接上幾個(gè)字，但不能指望它理解整個(gè)函數(shù)在做什么，更不可能讓它自己去查文檔、找依賴(lài)、改配置。

Sonnet 3.5打破了這種默契。它不僅能續(xù)寫(xiě)代碼，還能理解整個(gè)項(xiàng)目的上下文。不只是文件片段，而是模塊之間的關(guān)系、架構(gòu)決策、依賴(lài)鏈條。對(duì)每天在大型項(xiàng)目里工作的開(kāi)發(fā)者來(lái)說(shuō)，這種差異不是量變——以前你要花二十分鐘給AI解釋上下文，現(xiàn)在AI自己建立了上下文。

Cursor在當(dāng)時(shí)還是一個(gè)只有十幾個(gè)人的年輕編輯器團(tuán)隊(duì)，CEO Michael Truell在看到Sonnet 3.5的內(nèi)部測(cè)試數(shù)據(jù)后，連夜飛到舊金山與Anthropic簽了集成協(xié)議。這個(gè)決定讓Cursor在接下來(lái)半年里從一個(gè)邊緣編輯器變成了編程工具賽道的最大黑馬。Truell后來(lái)在接受采訪時(shí)說(shuō)：“那一刻我們意識(shí)到，Cursor的未來(lái)不是做一個(gè)更好的文本編輯器，而是做一個(gè)AI Agent的駕駛艙。”

2025年初，Sonnet 3.7把駕駛艙變成了無(wú)人駕駛。模型從“代碼生成器”變成了一個(gè)Agent，它能在終端里自主操作，理解任務(wù)、規(guī)劃步驟、調(diào)用工具、交付結(jié)果，不再需要開(kāi)發(fā)者守在屏幕前。

2025年2月，Claude Code正式推出。到11月，年化收入突破10億美元。到2026年2月，超過(guò)25億美元。這個(gè)增速在商業(yè)軟件史上沒(méi)有先例。Salesforce從零到10億美元年化收入用了將近5年。ServiceNow用了4年。Claude Code用了9個(gè)月。

Anthropic聯(lián)合創(chuàng)始人Jack Clark在2026年的開(kāi)發(fā)者大會(huì)上透露了一個(gè)細(xì)節(jié)：AI為Anthropic編寫(xiě)的代碼比例，2026年底可能接近99%。Claude Code的主要?jiǎng)?chuàng)建者Boris Cherny從2025年11月起就沒(méi)有再手動(dòng)編輯過(guò)一行代碼。Cherny在那場(chǎng)大會(huì)上被邀請(qǐng)上臺(tái)時(shí)，說(shuō)了一句讓全場(chǎng)安靜了兩秒的話：“我是Claude Code的作者。但我已經(jīng)記不清，最后一行完全由我親手寫(xiě)的代碼是哪一行了。”

企業(yè)客戶(hù)也在用真金白銀下注。印度金融科技平臺(tái)CRED在維持金融級(jí)質(zhì)量標(biāo)準(zhǔn)的前提下，將開(kāi)發(fā)執(zhí)行速度翻倍。南美電商巨頭Mercado Libre擁有2.3萬(wàn)名工程師，目標(biāo)在2026年Q3實(shí)現(xiàn)90%的編碼自動(dòng)化。樂(lè)天讓Claude Code在一個(gè)1250萬(wàn)行代碼的開(kāi)源庫(kù)中連續(xù)自主工作7小時(shí)，數(shù)值精度達(dá)到99.9%。全球財(cái)富十強(qiáng)企業(yè)中，8家已成為Anthropic的付費(fèi)客戶(hù)。

但真正讓整個(gè)行業(yè)感到芒刺在背的，是OpenAI在這場(chǎng)渡河戰(zhàn)役中的缺席。

Wired的一篇萬(wàn)字長(zhǎng)文詳細(xì)回溯了這段歷史。2021年，OpenAI推出Codex并授權(quán)微軟用于GitHub Copilot。這本是一次漂亮的先手布局。但隨后的決策鏈條令人扼腕：原Codex團(tuán)隊(duì)被拆散，核心成員分流至DALL-E 2和GPT-4等項(xiàng)目。ChatGPT在2022年底爆發(fā)后，公司連續(xù)數(shù)年未設(shè)獨(dú)立編程產(chǎn)品團(tuán)隊(duì)，管理層認(rèn)為這個(gè)領(lǐng)域“已被GitHub Copilot覆蓋”。一位前OpenAI工程師在Wired的采訪中說(shuō)了一句意味深長(zhǎng)的話：“我們以為自己提前過(guò)了河，結(jié)果是在河對(duì)岸打了個(gè)盹，醒來(lái)發(fā)現(xiàn)橋被別人占了。”

OpenAI總裁Greg Brockman后來(lái)在播客中承認(rèn)：“這是我們吸取教訓(xùn)太晚的地方。”

當(dāng)Anthropic靠Sonnet 3.5撕開(kāi)編程的口子、用Claude Code把口子變成主航道時(shí)，編程作為Agent驗(yàn)證場(chǎng)景的標(biāo)桿意義已經(jīng)確立。它回答了整個(gè)行業(yè)的終極追問(wèn)：Agent能不能在高度復(fù)雜、可測(cè)試、可度量的真實(shí)任務(wù)中，穩(wěn)定地替代人類(lèi)勞動(dòng)？

答案是能。盧比孔河被越過(guò)的那個(gè)瞬間，正是這個(gè)答案落地的時(shí)刻。于是，所有人都撲上來(lái)了。

追逐：沒(méi)有人敢留在對(duì)岸

2026年的Coding賽道，全球大模型公司幾乎無(wú)一缺席。河對(duì)岸的規(guī)則已經(jīng)改寫(xiě)，沒(méi)有人敢留在原地。而每一家選擇渡河的姿態(tài)，折射出的恰恰是各自最深的焦慮和最強(qiáng)的武器。

OpenAI的追趕最為猛烈，也最為狼狽。Codex在2025年9月的使用量?jī)H為Claude Code的5%，這個(gè)數(shù)字在公司內(nèi)部被視為恥辱。一位OpenAI員工在匿名論壇Blind上寫(xiě)道：“我們發(fā)明了Codex，然后讓它爛在原地。現(xiàn)在我們要從5%追起，這種感覺(jué)就像看著別人開(kāi)著你的車(chē)沖過(guò)終點(diǎn)線。”到2026年1月，Codex使用量升至Claude Code的約40%，年化收入剛過(guò)10億美元，約為對(duì)手的四成。

GPT-5.5的發(fā)布改變了勢(shì)頭。2026年5月，一場(chǎng)實(shí)驗(yàn)震動(dòng)開(kāi)發(fā)者社區(qū)：Codex配合GPT-5.5的/goal模式，將一個(gè)博士生需要80小時(shí)完成的機(jī)械可解釋性研究任務(wù)，壓縮至不到2小時(shí)。表面效率提升約40倍。這個(gè)數(shù)字在社交媒體上被瘋狂轉(zhuǎn)發(fā)，但冷靜的研究者指出，機(jī)械可解釋性任務(wù)的結(jié)構(gòu)極其清晰、目標(biāo)高度明確，與日常工程場(chǎng)景中那種“需求還在變、文檔還沒(méi)寫(xiě)、依賴(lài)剛掛了”的混亂狀態(tài)相去甚遠(yuǎn)。能在實(shí)驗(yàn)室里跑出40倍的效率，不代表能在生產(chǎn)環(huán)境里跑出同樣的成績(jī)。

但商業(yè)競(jìng)爭(zhēng)不等人。Sam Altman在5月中旬宣布Codex免費(fèi)兩個(gè)月。這不是一場(chǎng)技術(shù)競(jìng)賽的加時(shí)賽，而是一場(chǎng)用現(xiàn)金流發(fā)動(dòng)的閃電戰(zhàn)。至4月21日，Codex開(kāi)發(fā)者用戶(hù)已超過(guò)400萬(wàn)。更關(guān)鍵的戰(zhàn)略動(dòng)作是：Codex被集成進(jìn)ChatGPT移動(dòng)應(yīng)用，從Coding Agent向通用Agent延伸。OpenAI的策略清晰到了殘酷的地步——用全球最大的對(duì)話用戶(hù)基數(shù)為自己的編程工具導(dǎo)流，不需要開(kāi)發(fā)者主動(dòng)尋找Codex，只需要讓Codex出現(xiàn)在他們已經(jīng)在用的App里。

谷歌的策略是另一種邏輯。開(kāi)源。Gemini CLI作為開(kāi)源Agent工具，將Gemini直接帶入終端，默認(rèn)集成GitHub、Google Drive、Google Maps等全家桶。定價(jià)極具攻擊性：Gemini 3.1 Pro每百萬(wàn)token輸入2美元、輸出12美元，僅為Claude Opus 4.7的十分之一。谷歌還推出Gemini Enterprise Agent Platform，將Vertex AI重新定位為面向企業(yè)Agent開(kāi)發(fā)的全棧平臺(tái)。

谷歌打的算盤(pán)是：我不需要在編程能力上超過(guò)你，只需要讓編程能力足夠便宜、足夠容易接入我的生態(tài)。一旦開(kāi)發(fā)者在谷歌的云上跑Agent，遷移成本本身就是一道護(hù)城河。一位前谷歌云高管在接受采訪時(shí)說(shuō)得直白：“這不是編程工具之戰(zhàn)，這是云服務(wù)入口之戰(zhàn)。”

Meta是入局最晚、動(dòng)作最激進(jìn)的一方。2026年3月，扎克伯格時(shí)隔約20年重新提交代碼。更令人玩味的是，他使用的工具不是自家產(chǎn)品，而是競(jìng)爭(zhēng)對(duì)手的Claude Code。其中一筆修改——為Instagram的推薦系統(tǒng)優(yōu)化了一段數(shù)據(jù)加載邏輯——獲得200多位工程師點(diǎn)贊。

據(jù)Business Insider報(bào)道，扎克伯格在內(nèi)部郵件中寫(xiě)道：“我用Claude Code寫(xiě)了一些代碼。說(shuō)實(shí)話，這是我20年來(lái)第一次覺(jué)得編程又重新變得有趣了。我們要么造出比它更好的東西，要么被它吃掉。”

這封郵件在Meta內(nèi)部被泄露后，引發(fā)了兩極化的反應(yīng)。一部分工程師感到振奮，覺(jué)得CEO在親身體驗(yàn)戰(zhàn)場(chǎng)。另一部分人感到不安，一位資深工程師在內(nèi)部論壇上回復(fù)：“老板用我們的對(duì)手寫(xiě)的工具寫(xiě)了代碼，然后告訴我們?nèi)绻覀冊(cè)觳怀龈玫木蜁?huì)被吃掉。這個(gè)邏輯里，我們是那個(gè)‘被吃掉’的部分。”

Meta的目標(biāo)定得極具野心：2026年上半年，65%的工程師，其75%以上的代碼由AI輔助完成。扎克伯格在公開(kāi)場(chǎng)合預(yù)測(cè)，未來(lái)12到18個(gè)月內(nèi)，“一半以上的開(kāi)發(fā)工作將由AI而非人類(lèi)完成”。這類(lèi)預(yù)測(cè)需要對(duì)照來(lái)看：技術(shù)可行性與組織慣性、安全合規(guī)、現(xiàn)有合同結(jié)構(gòu)之間存在顯著張力。當(dāng)年雅虎預(yù)測(cè)“移動(dòng)將取代PC”的時(shí)間表只早了五年，諾基亞預(yù)測(cè)“觸屏將取代鍵盤(pán)”的時(shí)間表只早了三年。預(yù)測(cè)對(duì)了方向、錯(cuò)了速度，比預(yù)測(cè)錯(cuò)了方向更加致命——因?yàn)樗鼤?huì)讓你在正確方向上提前消耗掉所有彈藥。

與此同時(shí)，Meta團(tuán)隊(duì)還發(fā)布了HYPERAGENTS論文，提出了一種能自己寫(xiě)代碼實(shí)現(xiàn)自我進(jìn)化的超級(jí)智能體架構(gòu)：Darwinian G?del Machine。這個(gè)方向的前景與風(fēng)險(xiǎn)同樣突出。前景是：如果AI能穩(wěn)定改進(jìn)自己的編程能力，那么整個(gè)行業(yè)追趕的將不再是一個(gè)固定的水平線，而是一條被AI自己不斷抬高的上升曲線。風(fēng)險(xiǎn)是：當(dāng)這條曲線的斜率超出人類(lèi)審查能力時(shí)，誰(shuí)能叫停它？Meta的論文沒(méi)有回答這個(gè)問(wèn)題。

中國(guó)廠商的渡河方式，展現(xiàn)出另一種集體特質(zhì)：速度、性?xún)r(jià)比和生態(tài)協(xié)同。

智譜AI的GLM-5.1在SWE-bench Pro上短暫領(lǐng)先后被追上，緩存命中價(jià)0.475美元/百萬(wàn)token首次對(duì)齊Claude Opus 4.5的0.5美元。百度通用智能體DuMate在Create大會(huì)上推出，目標(biāo)是讓非技術(shù)用戶(hù)無(wú)需接觸代碼就能完成編程任務(wù)。字節(jié)跳動(dòng)旗下的火山引擎推出ArkClaw，日均超過(guò)120萬(wàn)億token經(jīng)由豆包大模型消耗，2025年11月發(fā)布的Doubao-Seed-Code模型在SWE-bench Verified上以89.3%一度刷新行業(yè)紀(jì)錄。阿里Qwen3.6-Max Preview在六項(xiàng)主流編程基準(zhǔn)上全線登頂國(guó)產(chǎn)模型。

DeepSeek V3.2以輸入每百萬(wàn)token 0.14美元、輸出0.28美元的價(jià)格，成為性?xún)r(jià)比標(biāo)桿。月之暗面旗下的Kimi K2.6于4月開(kāi)源，在LiveCodeBench v6上以89.6%登頂榜首，不間斷編碼長(zhǎng)達(dá)13小時(shí)、編寫(xiě)或修改超4000行代碼，驅(qū)動(dòng)300個(gè)子Agent并行協(xié)作，多項(xiàng)基準(zhǔn)成績(jī)持平甚至超越GPT-5.4和Claude Opus 4.6等國(guó)際頂尖閉源模型。騰訊的Hy3 Preview和DeepSeek V4 Flash在OpenRouter的token消耗榜上持續(xù)高居前兩位。

中國(guó)軍團(tuán)的集體入場(chǎng)，改變的不只是市場(chǎng)份額的分割方式，更是定價(jià)權(quán)的歸屬。當(dāng)DeepSeek把每百萬(wàn)token的單價(jià)壓到0.14美元，它不只是在賣(mài)編程服務(wù)，而是在重塑整個(gè)行業(yè)的成本結(jié)構(gòu)預(yù)期。一旦這個(gè)價(jià)格成為錨點(diǎn)，所有更高價(jià)位的產(chǎn)品都必須回答同一個(gè)問(wèn)題：你貴出來(lái)的那一部分，到底貴在哪兒？Anthropic的答案是可靠性。但在SWE-bench分?jǐn)?shù)趨同、新基準(zhǔn)集體翻車(chē)的背景下，可靠性的證明越來(lái)越貴，越來(lái)越難。

還有一個(gè)變量，比任何一家公司都更深刻地改變了這場(chǎng)戰(zhàn)爭(zhēng)的參戰(zhàn)方式。

2025年11月，奧地利退休程序員Peter Steinberger寫(xiě)了一個(gè)周末項(xiàng)目。他在維也納郊外的一間公寓里，用一臺(tái)老舊的MacBook Pro，花了三天時(shí)間搭建了一個(gè)開(kāi)源Agent框架的雛形。他給它配了一只紅色龍蝦作為L(zhǎng)ogo。社區(qū)叫它“龍蝦”。OpenClaw的核心能力極其直接：讓大模型獲得本地操作系統(tǒng)權(quán)限，自主執(zhí)行Shell命令，直接接管電腦，跨軟件排日程、寫(xiě)代碼、理文件。

Steinberger不是創(chuàng)業(yè)者，不是學(xué)者，不是一個(gè)在硅谷車(chē)庫(kù)里懷揣夢(mèng)想的年輕人。他是一個(gè)退休的程序員，因?yàn)闊o(wú)聊寫(xiě)了個(gè)工具，然后隨手扔到了GitHub上。短短4個(gè)多月，OpenClaw的星標(biāo)數(shù)從零突破28.5萬(wàn)，超越React和Linux創(chuàng)下GitHub歷史紀(jì)錄。英偉達(dá)創(chuàng)始人黃仁勛在一次公開(kāi)演講中將它稱(chēng)為“迄今發(fā)布過(guò)的最重要軟件”。他沒(méi)有加“之一”。

OpenClaw不產(chǎn)生任何直接收入。真正受益的是大模型公司和云廠商——Agent的每一次任務(wù)執(zhí)行都會(huì)觸發(fā)多次模型請(qǐng)求，單次Token消耗可達(dá)數(shù)萬(wàn)至數(shù)十萬(wàn)。OpenClaw等于給整個(gè)行業(yè)造了一座Token消耗的加速器。2026年2月末，月之暗面向媒體透露，該公司2月前20天收入已超2025年全年總額。這不是月之暗面一家的故事。它是整個(gè)賽道被OpenClaw加速后的一個(gè)縮影。

但這股浪潮的另一面正在浮出水面。當(dāng)任何一個(gè)人都可以讓模型接管自己的操作系統(tǒng)時(shí)，安全邊界就不再是一個(gè)技術(shù)問(wèn)題，而是一個(gè)社會(huì)問(wèn)題。2026年4月，一位硅谷創(chuàng)業(yè)公司的CTO在內(nèi)部Slack上發(fā)了一條消息，被截圖傳遍網(wǎng)絡(luò)：“我們的實(shí)習(xí)生上周用OpenClaw配置開(kāi)發(fā)環(huán)境，不小心讓Agent把公司內(nèi)網(wǎng)的測(cè)試數(shù)據(jù)庫(kù)當(dāng)成了本地沙盒，刪掉了三天的聯(lián)調(diào)數(shù)據(jù)。沒(méi)有備份。”這條消息被轉(zhuǎn)發(fā)時(shí)，最常見(jiàn)的評(píng)論是：“這不是Agent的錯(cuò)誤，是我們把鑰匙交給了一個(gè)我們還不太了解的東西。”

盧比孔河式的跨越從來(lái)不止帶來(lái)勝利。它帶來(lái)的是規(guī)則的重置、角色的混亂、以及一種讓所有人都措手不及的加速度。

戰(zhàn)線：河岸交火之后

盧比孔河已經(jīng)渡過(guò)了。但渡河之后才發(fā)現(xiàn)，對(duì)岸不是一座空城。

2026年5月，AI編程賽道的競(jìng)爭(zhēng)密度已不能用“排行榜”來(lái)形容。更準(zhǔn)確的比喻是一張實(shí)時(shí)更新的戰(zhàn)況地圖——每一條戰(zhàn)線都在交火，每一個(gè)高地上都插著不止一面旗幟。

最直觀的尺度是SWE-bench Verified。這個(gè)由普林斯頓大學(xué)Carlos Jimenez團(tuán)隊(duì)在2023年建立的基準(zhǔn)，從GitHub上提取真實(shí)issue，要求模型在給定代碼倉(cāng)庫(kù)中定位并修復(fù)bug。它不是選擇題，不是填空題，是真實(shí)世界里程序員每天面對(duì)的那類(lèi)問(wèn)題。正因如此，它成了編程模型的試金石。2024年初，GPT-4在這上面的得分還在30%附近徘徊。到2026年5月，Claude Opus 4.7推到了87.6%，GPT-5.5、Gemini 3.1 Pro、Qwen 3.6 Max-Preview等6個(gè)前沿模型全擠在80%以上，彼此差距不超過(guò)2個(gè)百分點(diǎn)。

分?jǐn)?shù)在收斂，但故事不在分?jǐn)?shù)里。

更有意思的事情發(fā)生在價(jià)格那一欄。Opus 4.7每百萬(wàn)token輸入5美元、輸出25美元。GPT-5.5是2.5美元和15美元。DeepSeek V3.2是0.14美元和0.28美元。同一個(gè)任務(wù)，相近的完成率，成本可以相差近90倍。這是一個(gè)在科技史上反復(fù)出現(xiàn)的信號(hào)：當(dāng)性能趨同，戰(zhàn)爭(zhēng)就從實(shí)驗(yàn)室轉(zhuǎn)移到市場(chǎng)。90倍的價(jià)差不是技術(shù)差距，是策略差距。Anthropic選擇用高價(jià)守住品牌和可靠性，DeepSeek選擇用低價(jià)擊穿門(mén)檻。兩種選擇背后是兩套完全不同的戰(zhàn)爭(zhēng)理論——前者打的是“信我，因?yàn)槲也怀鲥e(cuò)”，后者打的是“用我，因?yàn)槟阍嚨闷稹薄?/p>

但這張戰(zhàn)況地圖上最耐人尋味的一筆，是SWE-bench的創(chuàng)建者Jimenez在2026年5月放出的新基準(zhǔn)：ProgramBench。這批題目不再是修bug，而是要求模型從零開(kāi)始構(gòu)建完整的程序模塊：理解需求、設(shè)計(jì)架構(gòu)、編寫(xiě)代碼、調(diào)試運(yùn)行、交付結(jié)果。在SWE-bench上拿到80%以上的那一批最強(qiáng)模型，在這套新題上集體交了白卷。0%。

這不是一個(gè)技術(shù)翻車(chē)的花邊新聞。它是一種古老戰(zhàn)爭(zhēng)規(guī)律的再現(xiàn)：每一道新防線都會(huì)暴露舊裝備的邊界。1940年，法國(guó)人引以為傲的馬其諾防線被德軍繞過(guò)時(shí)，法軍指揮部收到的第一批報(bào)告也是類(lèi)似的措辭：“敵人出現(xiàn)在我們的地圖之外”。

Jimenez在發(fā)布新基準(zhǔn)時(shí)寫(xiě)了一段話，措辭冷靜得像一份偵察報(bào)告：“當(dāng)前所有的編程模型，在面對(duì)需要自主規(guī)劃和多步驟推理的開(kāi)放任務(wù)時(shí)，表現(xiàn)急劇下降。這不是某個(gè)模型的缺陷，而是整個(gè)范式的天花板。”

更值得留意的是業(yè)界的反應(yīng)。OpenAI沒(méi)有公開(kāi)回應(yīng)。Anthropic的開(kāi)發(fā)者關(guān)系主管在一個(gè)技術(shù)論壇上簡(jiǎn)短留言：“已知曉。感謝。”谷歌DeepMind的Fran?ois Chollet——這位早在2019年就提出ARC基準(zhǔn)來(lái)測(cè)量AI抽象推理能力的科學(xué)家——轉(zhuǎn)發(fā)了Jimenez的推文，加了一句他多年來(lái)反復(fù)說(shuō)的話：“記住，排行榜衡量的是系統(tǒng)在特定分布內(nèi)的表現(xiàn)，而不是智能。我們?nèi)匀徊恢廊绾螠y(cè)量智能。”

Chollet這段話指向了一個(gè)更深層的問(wèn)題。當(dāng)所有廠商都在同一個(gè)基準(zhǔn)上優(yōu)化，當(dāng)訓(xùn)練數(shù)據(jù)里不可避免地混入了基準(zhǔn)的影子，當(dāng)排行榜上的差距縮小到小數(shù)點(diǎn)后一位，這些數(shù)字到底在說(shuō)什么？它們說(shuō)的是模型真的變強(qiáng)了，還是整個(gè)行業(yè)正在集體“過(guò)擬合”一套考題？

這不是一個(gè)學(xué)院式的追問(wèn)。它對(duì)商業(yè)競(jìng)爭(zhēng)有直接的殺傷力。2024年，一家估值超過(guò)20億美元的AI編程創(chuàng)業(yè)公司Augment，在SWE-bench上跑出了令人矚目的分?jǐn)?shù)，卻在企業(yè)付費(fèi)客戶(hù)的實(shí)測(cè)中表現(xiàn)平庸，一年內(nèi)經(jīng)歷了大規(guī)模裁員和業(yè)務(wù)收縮。SWE-bench的創(chuàng)建者Jimenez本人也在多個(gè)場(chǎng)合警告過(guò)這一風(fēng)險(xiǎn)。他在2025年的一篇博客中寫(xiě)道：“如果基準(zhǔn)是公開(kāi)的，它就不再是基準(zhǔn)。它會(huì)變成訓(xùn)練目標(biāo)。而一旦變成訓(xùn)練目標(biāo)，它就不再衡量能力——它只衡量你離靶心有多近。”

這正是盧比孔河對(duì)岸的第一場(chǎng)硬仗。不是跟競(jìng)爭(zhēng)對(duì)手打，是跟自己賴(lài)以評(píng)估勝負(fù)的坐標(biāo)系打。當(dāng)坐標(biāo)系本身開(kāi)始漂移，當(dāng)基準(zhǔn)失靈的速度超過(guò)了模型進(jìn)步的速度，所有參戰(zhàn)者都面臨同一個(gè)追問(wèn)：你是在打贏一場(chǎng)被精確定義的上一場(chǎng)戰(zhàn)爭(zhēng)，還是在為下一場(chǎng)戰(zhàn)爭(zhēng)準(zhǔn)備武器？

價(jià)格的崩塌也在加速這種漂移。GPU算力成本以每年超過(guò)50%的速度持續(xù)下降，推理成本被不斷攤薄。DeepSeek V3.2用0.28美元的價(jià)格提供接近Opus 4.7的編程能力，這件事的市場(chǎng)沖擊不亞于當(dāng)年豐田用花冠打入通用和福特的核心市場(chǎng)。Anthropic的毛利率從38%升至70%以上，說(shuō)明高端市場(chǎng)仍然愿意為可靠性支付溢價(jià)。

但問(wèn)題在于：當(dāng)?shù)投诉x項(xiàng)的可靠性也在逼近，溢價(jià)還能維持多久？豐田花冠最終不是靠?jī)r(jià)格打贏的，是靠可靠性。這正是日本汽車(chē)工業(yè)在上世紀(jì)80年代給底特律上的一課，也是如今懸在Anthropic頭上的一把劍。

2026年5月，Coding的最新戰(zhàn)況大致如此：渡河者已在河對(duì)岸站穩(wěn)腳跟，陣線正在從單點(diǎn)突破演變?yōu)槎帱c(diǎn)交火。前沿模型在已知地形的表現(xiàn)高度趨同，價(jià)格裂谷橫貫整個(gè)戰(zhàn)區(qū)。但更深處——那片尚未被測(cè)繪的區(qū)域——最新的偵察數(shù)據(jù)表明，所有渡河者都還沒(méi)有準(zhǔn)備好。那里藏著的，可能不是敵軍，而是這場(chǎng)戰(zhàn)爭(zhēng)本身的邊界。

而邊界的那一邊，已經(jīng)響起了新的聲響。

暗涌：戰(zhàn)爭(zhēng)機(jī)器的內(nèi)部裂痕

前線的戰(zhàn)況還在膠著，后方已經(jīng)出現(xiàn)了第一道裂縫。

2026年5月中旬，Anthropic在沒(méi)有任何預(yù)告的情況下，將Claude Code的免費(fèi)額度從每月250次調(diào)用壓縮至80次。公告在舊金山時(shí)間周五晚上發(fā)出——硅谷公司最偏愛(ài)的壞消息發(fā)布時(shí)間。開(kāi)發(fā)者社區(qū)在幾個(gè)小時(shí)內(nèi)炸開(kāi)了鍋。Twitter上一位在Spotify工作的工程師寫(xiě)道：“我們團(tuán)隊(duì)上周剛把整個(gè)CI/CD流水線掛在Claude Code上，現(xiàn)在告訴我們額度砍了三分之二，周一部署怎么辦？”這條推文被轉(zhuǎn)發(fā)了超過(guò)一萬(wàn)次。不到48小時(shí)，OpenAI的Sam Altman轉(zhuǎn)發(fā)了Codex免費(fèi)兩個(gè)月的公告，配文只有三個(gè)單詞：“No quotas.”——不設(shè)額度。

這是一場(chǎng)在對(duì)手暴露軟肋時(shí)精準(zhǔn)刺入的遭遇戰(zhàn)。Anthropic的算力瓶頸不是秘密。Dario Amodei在開(kāi)發(fā)者大會(huì)上被問(wèn)及額度問(wèn)題時(shí)，回答得相當(dāng)坦率：“收入增長(zhǎng)越快，芯片就越不夠用。我們正在以最大速度建設(shè)推理集群，但需求跑在供給前面。”這段話的潛臺(tái)詞是清晰的：Anthropic的護(hù)城河不在商業(yè)模式，在模型能力。但模型能力需要算力喂養(yǎng)，而算力是實(shí)物資產(chǎn)，有物理交付周期。當(dāng)戰(zhàn)爭(zhēng)從技術(shù)競(jìng)賽升級(jí)為消耗戰(zhàn)，率先渡河者反而最先撞上了自己的后勤極限。

OpenAI對(duì)這一點(diǎn)的理解，比任何人都刻骨銘心。

據(jù)知情人士透露，Greg Brockman在今年3月的一次內(nèi)部全員會(huì)上，回溯了公司歷史上一個(gè)鮮為人知的細(xì)節(jié)。2022年秋天，ChatGPT在發(fā)布前夜幾乎被擱置。彼時(shí)公司內(nèi)部對(duì)要不要上線爭(zhēng)論不休，有人認(rèn)為產(chǎn)品太不成熟，有人擔(dān)心API的算力供應(yīng)跟不上潛在的用戶(hù)涌入。據(jù)稱(chēng)，當(dāng)時(shí)Sam Altman問(wèn)了一個(gè)問(wèn)題：“如果我們不發(fā)，別人發(fā)了怎么辦？”沒(méi)有人能回答。ChatGPT在那周按時(shí)發(fā)布，兩周內(nèi)涌入了超過(guò)一億用戶(hù)，把OpenAI的服務(wù)器集群壓在崩潰的邊緣運(yùn)轉(zhuǎn)了近一個(gè)季度。“那三個(gè)月教會(huì)我們一件事，”Brockman在那次會(huì)上說(shuō)，“在AI這條賽道上，你永遠(yuǎn)不可能在完全準(zhǔn)備好的情況下開(kāi)戰(zhàn)。你只能在開(kāi)戰(zhàn)后，祈禱自己的彈藥比對(duì)手多一顆。”

這顆彈藥，正在變成現(xiàn)金。

截至2026年5月，OpenAI為Codex免費(fèi)期準(zhǔn)備的補(bǔ)貼預(yù)算，據(jù)估算超過(guò)4億美元。Anthropic的算力缺口，據(jù)半導(dǎo)體供應(yīng)鏈的消息人士估算，大約需要新增3到5萬(wàn)片H200級(jí)GPU才能填補(bǔ)。谷歌的Gemini Enterprise Agent Platform以近乎成本價(jià)的價(jià)格在市場(chǎng)上鋪量，背后是每年超過(guò)600億美元的資本開(kāi)支兜底。Meta的扎克伯格在內(nèi)部郵件中寫(xiě)道：“我們?cè)诰幊坦ぞ呱系穆浜螅举|(zhì)上是推理基礎(chǔ)設(shè)施的落后。補(bǔ)上這一課，需要200億美元級(jí)別的新增投入。”他在郵件末尾加了一行字：“這可能是本世紀(jì)最重要的資本支出，不要跟董事會(huì)討論ROI——他們算不出來(lái)。”

這不只是一場(chǎng)技術(shù)競(jìng)賽。它正在變成一場(chǎng)用現(xiàn)金填滿(mǎn)的消耗戰(zhàn)。

更致命的問(wèn)題在另一個(gè)維度。

2026年4月，摩根大通內(nèi)部信息安全委員會(huì)向全體工程部門(mén)發(fā)出一份備忘錄，措辭是金融行業(yè)少見(jiàn)的嚴(yán)厲：“當(dāng)前所有AI編程Agent在接入生產(chǎn)級(jí)代碼庫(kù)和客戶(hù)敏感數(shù)據(jù)時(shí)，均未達(dá)到我行內(nèi)部安全評(píng)估的第三級(jí)標(biāo)準(zhǔn)。在進(jìn)一步通知之前，禁止任何團(tuán)隊(duì)將AI Agent直接接入涉及個(gè)人身份信息的代碼倉(cāng)庫(kù)。”這份備忘錄沒(méi)有點(diǎn)名任何一家廠商，但它幾乎同時(shí)適用于所有廠商。高盛、花旗、匯豐在隨后兩周內(nèi)發(fā)布了類(lèi)似文件，措辭各有不同，底線高度一致：允許，但必須斷網(wǎng)，且限制數(shù)據(jù)訪問(wèn)級(jí)別。

這意味著什么？意味著AI編程Agent進(jìn)入企業(yè)核心業(yè)務(wù)系統(tǒng)的速度，將被安全合規(guī)問(wèn)題踩下剎車(chē)。而這個(gè)剎車(chē)不是任何一家模型廠商能單獨(dú)拆掉的。它需要整個(gè)行業(yè)在安全沙盒、數(shù)據(jù)審計(jì)、權(quán)限隔離和合規(guī)框架上達(dá)成共識(shí)，或者至少形成一套可被監(jiān)管機(jī)構(gòu)接受的事實(shí)標(biāo)準(zhǔn)。OpenAI在2026年5月發(fā)布的Windows沙盒技術(shù)方案，就是在試圖獨(dú)自作答這個(gè)問(wèn)題。但一家廠商的方案，不等于一個(gè)行業(yè)的答案。

這還不是裂痕的全部。

2026年5月下旬，Hacker News上出現(xiàn)了一篇廣為流傳的長(zhǎng)帖，標(biāo)題是《我用Claude Code寫(xiě)了三個(gè)月代碼，現(xiàn)在我不確定我還會(huì)編程》。帖子詳細(xì)記錄了作者從興奮到依賴(lài)，再到感到“肌肉萎縮”的全過(guò)程。“一開(kāi)始是復(fù)制粘貼AI生成的代碼段。然后是不加審查地接受整個(gè)函數(shù)的修改。最后我發(fā)現(xiàn)自己連一個(gè)簡(jiǎn)單的SQL查詢(xún)都不想寫(xiě)了，因?yàn)樽孋laude寫(xiě)更快。”帖子的評(píng)論區(qū)在三小時(shí)內(nèi)被頂?shù)搅薍acker News歷史熱度榜前十。排在最高贊的回復(fù)只有一句話：“我們正在用效率工具，制造一代不知道如何造輪子的工程師。”

這不是一個(gè)孤立的情緒波動(dòng)。斯坦福大學(xué)2026年發(fā)布的《人工智能指數(shù)報(bào)告》中，有一項(xiàng)針對(duì)超過(guò)5000名軟件開(kāi)發(fā)者的追蹤調(diào)查，結(jié)果顯示：每天使用AI編程工具的開(kāi)發(fā)者中，73%表示“明顯感到自己的底層調(diào)試能力在退化”，58%表示“對(duì)AI生成的代碼缺乏系統(tǒng)性理解”。更微妙的數(shù)據(jù)是：當(dāng)被要求在不使用AI工具的情況下完成一道中等難度的算法題時(shí)，這個(gè)群體完成率比兩年前的同齡對(duì)照組下降了22個(gè)百分點(diǎn)。

這是渡河者未曾預(yù)料到的代價(jià)之一。你帶了一支軍隊(duì)過(guò)河，但行軍過(guò)程中，武器在幫你打仗，也在讓你的士兵變?nèi)酢?/p>

Dario Amodei在開(kāi)發(fā)者大會(huì)的問(wèn)答環(huán)節(jié)被問(wèn)及這個(gè)問(wèn)題時(shí)，沉默了幾秒鐘。然后他給了一個(gè)不回避的回答：“這是一個(gè)真實(shí)的問(wèn)題。我們內(nèi)部也在討論。但我能說(shuō)的是，人類(lèi)過(guò)去每一次引入新工具，都會(huì)有人擔(dān)心技能退化。從計(jì)算器到搜索引擎，再到IDE自動(dòng)補(bǔ)全，每一次都發(fā)生了。但每一次，行業(yè)的整體生產(chǎn)力都上了一個(gè)臺(tái)階。”他頓了頓，又說(shuō)：“只是這次的速度確實(shí)太快了。快到我們可能來(lái)不及適應(yīng)。”

Greg Brockman在另一個(gè)場(chǎng)合的表述更直接。當(dāng)被問(wèn)及“程序員會(huì)不會(huì)被取代”時(shí)，他回答：“程序員不會(huì)消失。但不使用AI的程序員會(huì)。就像2005年，會(huì)計(jì)師沒(méi)有因?yàn)镋xcel消失，但不會(huì)用Excel的會(huì)計(jì)師消失了。”

兩句話放在一起看，可以讀出這場(chǎng)戰(zhàn)爭(zhēng)真正的殘酷之處：不是AI替代了人類(lèi)，而是使用AI的那部分人類(lèi)，正在替代不使用AI的那部分人類(lèi)。而使用AI的那部分人，又在面臨被AI削弱底層能力的風(fēng)險(xiǎn)。這不是一場(chǎng)單向的替代。這是一個(gè)所有人都被卷入、無(wú)人能完全掌控的螺旋。渡河之后，你以為戰(zhàn)場(chǎng)在河對(duì)岸。但你很快發(fā)現(xiàn)，河對(duì)岸的戰(zhàn)場(chǎng)，有一部分就在你自己的陣地上。

盧比孔河沒(méi)有上游和下游。它只有一條方向——朝前。

彼岸：尚未命名的土地

盧比孔河已被甩在身后。但渡河者很快會(huì)發(fā)現(xiàn)，他們占領(lǐng)的不是一座城池，而是一片尚未測(cè)繪的大陸。

Anthropic開(kāi)發(fā)者大會(huì)上，有一位參會(huì)者在筆記里寫(xiě)下了一句話，會(huì)后被反復(fù)引用：“多數(shù)生產(chǎn)級(jí)智能體系統(tǒng)的瓶頸，現(xiàn)在已經(jīng)不是模型能力，而是模型周邊的基礎(chǔ)設(shè)施。”寫(xiě)下這句話的是Stripe平臺(tái)工程團(tuán)隊(duì)的一位負(fù)責(zé)人，她所在的團(tuán)隊(duì)在三個(gè)月前將Claude Code接入了支付核心系統(tǒng)。

她說(shuō)這話時(shí)有數(shù)據(jù)支撐：Stripe的實(shí)測(cè)表明，Agent在理想環(huán)境中的代碼生成正確率超過(guò)85%，但在生產(chǎn)環(huán)境中，接入認(rèn)證網(wǎng)關(guān)、審計(jì)日志和異常回滾機(jī)制后，有效可用率跌到了60%以下。掉下來(lái)的25個(gè)百分點(diǎn)，沒(méi)有一個(gè)是模型的問(wèn)題。全是管道、權(quán)限、監(jiān)控和容錯(cuò)的問(wèn)題。

她的結(jié)論是：“我們花了一年時(shí)間讓模型變得足夠好。接下來(lái)可能要花兩年時(shí)間讓管道足夠結(jié)實(shí)。”

這句話精準(zhǔn)地標(biāo)定了一個(gè)歷史時(shí)刻：智能體編程已經(jīng)越過(guò)“能不能跑”的階段，進(jìn)入了“能不能大規(guī)模跑、能不能在風(fēng)雨里跑”的階段。

同一場(chǎng)大會(huì)上，Anthropic公布了一張調(diào)用量分布圖，堪稱(chēng)為整個(gè)行業(yè)做了一次內(nèi)部結(jié)構(gòu)的X光掃描。軟件工程獨(dú)占49.7%的調(diào)用，是第二名后臺(tái)自動(dòng)化的5.5倍。法律、醫(yī)療、電商、教育等垂直領(lǐng)域加起來(lái)，不到6%。這張圖的潛臺(tái)詞再清晰不過(guò)：coding作為Agent的生產(chǎn)力價(jià)值已被完全證實(shí)，但coding之外的白領(lǐng)勞動(dòng)市場(chǎng)，幾乎還是一塊處女地。

但這塊處女地上已經(jīng)出現(xiàn)了一些拓荒者。

法律科技公司Harvey的聯(lián)合創(chuàng)始人Winston Weinberg在大會(huì)上展示了他們的多智能體編排系統(tǒng)。在他的演示里，一個(gè)由7個(gè)專(zhuān)業(yè)Agent組成的團(tuán)隊(duì)——分別負(fù)責(zé)檢索判例、拆解條款、擬寫(xiě)初稿、交叉審閱、風(fēng)險(xiǎn)評(píng)估、格式校核和最終合稿——在22分鐘內(nèi)完成了一份跨境并購(gòu)協(xié)議的核心條款起草。同樣一組任務(wù)，交給一組初級(jí)律師，平均需要6小時(shí)。Weinberg沒(méi)有用“替代”這個(gè)詞。他說(shuō)的是：“我們不是在取代律師，我們是在把律師從文件堆里解放出來(lái)，讓他們?nèi)プ鲋挥腥四茏龅呐袛唷！迸_(tái)下的律師們表情復(fù)雜。

Netflix的平臺(tái)工程團(tuán)隊(duì)展示了另一個(gè)方向。他們的日志分析智能體可以并行處理數(shù)百個(gè)構(gòu)建批次，自動(dòng)過(guò)濾出值得關(guān)注的跨批次異常規(guī)律。負(fù)責(zé)人在演示中說(shuō)了句意味深長(zhǎng)的話：“以前我們雇人看日志，后來(lái)雇人寫(xiě)腳本看日志。現(xiàn)在腳本自己寫(xiě)自己看，我們只負(fù)責(zé)在它看不懂的時(shí)候做決定。”他補(bǔ)充道，“問(wèn)題是，它越來(lái)越不需要我們做決定了。”

不過(guò)，真正讓這場(chǎng)開(kāi)發(fā)者大會(huì)的后半段氣氛發(fā)生微妙變化的，不是這些案例，而是一個(gè)話題的轉(zhuǎn)向。

大會(huì)進(jìn)行到第二天下午，Anthropic的聯(lián)合創(chuàng)始人Jack Clark在臺(tái)上被問(wèn)到一個(gè)問(wèn)題：“當(dāng)AI編寫(xiě)的代碼比例接近100%時(shí)，人類(lèi)工程師的角色到底是什么？”Clark沒(méi)有用公關(guān)話術(shù)。他沉默了幾秒，然后說(shuō)：“我不知道。我說(shuō)真的，我不知道。”

他接著講了一個(gè)故事。幾周前，Claude Code的團(tuán)隊(duì)發(fā)現(xiàn)了一段底層調(diào)度邏輯存在問(wèn)題。如果放在兩年前，這會(huì)是一張JIRA工單，分給某個(gè)工程師，花一個(gè)下午調(diào)試。但那天，Claude Code的主要?jiǎng)?chuàng)建者Boris Cherny在Slack上發(fā)了一條消息：“我讓Claude看了一下，它找到了三個(gè)可能的根因，給出了修復(fù)方案，概率排序。我只點(diǎn)了‘接受’。”Clark停了一下，看著臺(tái)下的觀眾。“我們創(chuàng)造了這個(gè)工具，但我們自己也在被這個(gè)工具重新定義。工具的設(shè)計(jì)師正在變成工具的用戶(hù)，然后變成工具的審核者。接下來(lái)是什么？審核者的審核者？”

會(huì)場(chǎng)安靜了幾秒鐘。然后有人鼓掌。不是熱烈的掌聲，是那種被說(shuō)中了不安后的本能反應(yīng)。

這不是一個(gè)孤立的故事。它指向的，是coding在硅基文明演進(jìn)中的真正位置。它正在從“Agent的一個(gè)應(yīng)用場(chǎng)景”變成“Agent自我進(jìn)化的底層引擎”。

Meta的HYPERAGENTS論文（已被ICLR 2026收錄）提出了一種名為Darwinian G?del Machine的架構(gòu)，其核心邏輯極其簡(jiǎn)潔，也極其令人不安：在編程領(lǐng)域，改進(jìn)自身編程能力的任務(wù)，與解決外部編程問(wèn)題的任務(wù)，天然對(duì)齊。也就是說(shuō)，AI改進(jìn)自己的代碼，就是在改進(jìn)自己。

這種“遞歸式自我改進(jìn)”在概念上不是新東西。圖靈在1951年的曼徹斯特講演中就曾模糊地觸及過(guò)，哥德?tīng)栐诟绲臅r(shí)候?yàn)樗峁┝诉壿媽W(xué)地基。但2026年，它第一次不再是理論推演，而是工程提案。論文中有一個(gè)段落被圈內(nèi)反復(fù)標(biāo)注：“如果自我改進(jìn)的鏈條在某個(gè)節(jié)點(diǎn)上不再需要外部驗(yàn)證就能通過(guò)內(nèi)部一致性判斷，那么系統(tǒng)的進(jìn)化速度將不再受人類(lèi)審查帶寬的限制。”

這句話換一種說(shuō)法就是：當(dāng)AI學(xué)會(huì)自己給自己打分，并且這個(gè)分?jǐn)?shù)足夠可信，人類(lèi)的剎車(chē)踏板就消失了。

這是coding的中場(chǎng)戰(zhàn)事。

上半場(chǎng)，Anthropic用Claude Code驗(yàn)證了一件事：Agent可以在編程領(lǐng)域穩(wěn)定替代人類(lèi)勞動(dòng)。全球大模型公司隨后密集渡河，在基準(zhǔn)測(cè)試和市場(chǎng)份額上展開(kāi)貼身纏斗，價(jià)格戰(zhàn)、算力戰(zhàn)、安全合規(guī)戰(zhàn)相繼打響。

下半場(chǎng)的輪廓也已清晰：編程不再是終點(diǎn)，它是AI自我強(qiáng)化的底座。誰(shuí)能在這個(gè)底座上建得更高、跑得更穩(wěn)、覆蓋得更廣，誰(shuí)就能在這場(chǎng)硅基文明演進(jìn)的競(jìng)爭(zhēng)中，撐到下個(gè)十年。

但Clark那一句“我不知道”，Brockman那一句“吸取教訓(xùn)太晚”，Amodei那一句“快到我們可能來(lái)不及適應(yīng)”，以及那個(gè)在Hacker News上寫(xiě)下“我不確定我還會(huì)編程”的匿名工程師——這些聲音指向的是同一件事：渡河者不僅要面對(duì)對(duì)岸的敵軍，還要面對(duì)自己內(nèi)部正在發(fā)生的某種不可逆的變化。工具在重塑使用者，使用者在適應(yīng)工具，而適應(yīng)的終點(diǎn)在哪里，沒(méi)有人能在地圖上標(biāo)出來(lái)。

盧比孔河已經(jīng)過(guò)去了。愷撒渡河時(shí)說(shuō)的那句話——“骰子已經(jīng)擲下”——常常被解讀為一種破釜沉舟的豪情。但研究羅馬史的學(xué)者知道，這句話的拉丁文原文“Alea iacta est”還有一層更古老的詞源學(xué)含義：alea不是普通的骰子，是那種在羅馬酒館里被人灌了鉛的、注定擲不出某個(gè)點(diǎn)數(shù)的作弊骰。普魯塔克在《希臘羅馬名人傳》里考證過(guò)這一層。換句話說(shuō)，愷撒在說(shuō)出這句話時(shí)，未必是在豪賭。他可能是在說(shuō)：這個(gè)游戲的規(guī)則，早在骰子被制造出來(lái)時(shí)就已經(jīng)被寫(xiě)死了。我能做的，只有擲出去。

2026年5月的AI編程賽道，骰子同樣已經(jīng)擲下。它是不是灌了鉛的，沒(méi)有人知道。但有一件事是確定的：一旦擲出，撿不回來(lái)。

留給每一個(gè)參戰(zhàn)者的真正難題，不在河對(duì)岸。在自己身上。當(dāng)模型能力趨同、價(jià)格歸零、基準(zhǔn)失靈，當(dāng)工程師在鍵盤(pán)上越來(lái)越快、腦子里越來(lái)越空，當(dāng)AI開(kāi)始寫(xiě)代碼改進(jìn)AI自己——競(jìng)爭(zhēng)將退回到那個(gè)最古老的層面：信任、克制，以及知道在哪里踩剎車(chē)的判斷力。

那才是Coding之后，真正的戰(zhàn)場(chǎng)。不是誰(shuí)跑得更快，而是在所有人都剎不住車(chē)的時(shí)候，誰(shuí)能證明自己值得被信任。

愷撒最終贏下了內(nèi)戰(zhàn)，卻在元老院被刺。有些戰(zhàn)爭(zhēng)，贏在戰(zhàn)場(chǎng)上，輸在大勢(shì)里。盧比孔河只是一個(gè)起點(diǎn)。彼岸的黎明，從不保證任何人的抵達(dá)。

轉(zhuǎn)載開(kāi)白 | 商務(wù)合作 | 內(nèi)容交流

請(qǐng)?zhí)砑游⑿牛簀induan008

添加微信請(qǐng)備注姓名公司與來(lái)意

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.