无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Coding的中場(chǎng)戰(zhàn)事

0
分享至

本文系基于公開(kāi)資料撰寫(xiě),僅作為信息交流之用,不構(gòu)成任何投資建議


圖:阿道夫·伊馮?(Adolphe Yvon)的畫(huà)作《凱撒渡過(guò)盧比孔河》

2026年5月,Coding(AI編程)越過(guò)了盧比孔河。

愷撒率軍渡過(guò)這條界河時(shí),羅馬法規(guī)定:任何將領(lǐng)不得率兵越過(guò)。他渡河了,內(nèi)戰(zhàn)全面爆發(fā),再無(wú)媾和余地。Coding在這個(gè)5月完成的,是一次性質(zhì)相同的跨越——大模型公司集體越過(guò)了“輔助工具”與“生產(chǎn)力主體”之間的界河。退路已斷,全面戰(zhàn)爭(zhēng)打響。

在古羅馬,渡河的消息傳回元老院,靠的是快馬和信使。在這個(gè)時(shí)代,消息傳開(kāi)的方式是一份營(yíng)收曲線圖。五月初的開(kāi)發(fā)者大會(huì)上,Anthropic CEO Dario Amodei 披露了一組數(shù)字:公司年化收入在三個(gè)月內(nèi)從約100億美元飆至440億美元,每天新增約9600萬(wàn)美元。一位研究了超過(guò)200家上市軟件公司IPO數(shù)據(jù)的風(fēng)險(xiǎn)投資人坦言,從未見(jiàn)過(guò)這樣的增速。

驅(qū)動(dòng)這一增速的核心引擎是一款編程智能體Claude Code。它從內(nèi)部工具起步,到2026年初占據(jù)AI編程工具市場(chǎng)54%的份額,API調(diào)用量過(guò)去一年同比增長(zhǎng)17倍。更直白的數(shù)字是:全球GitHub公開(kāi)提交中約4%由Claude Code參與完成,Anthropic預(yù)計(jì)到2026年底將超過(guò)20%。

這是一個(gè)堪稱(chēng)“事件視界”式的商業(yè)增長(zhǎng)故事。Claude Code跑通了一件事:Agent不只能輔助編程,它能在真實(shí)工程環(huán)境中接管任務(wù)、交付結(jié)果。這件事一旦被驗(yàn)證,編程就成了Agent從“對(duì)話工具”向“生產(chǎn)力主體”躍遷的臨界點(diǎn)。

所有大模型公司都在同一時(shí)刻看清了:誰(shuí)能統(tǒng)治coding,誰(shuí)就拿到了通向AGI的入場(chǎng)券。這張入場(chǎng)券的代價(jià),是再也無(wú)法退回河對(duì)岸。

01

緣起:率先渡河者

Anthropic今天的領(lǐng)先地位,根源要追溯到2024年6月。但在那個(gè)時(shí)間點(diǎn)之前,還有一個(gè)更早的伏筆。

2023年初,Anthropic的聯(lián)合創(chuàng)始人Jared Kaplan在一次內(nèi)部技術(shù)評(píng)審會(huì)上,與訓(xùn)練團(tuán)隊(duì)發(fā)生了一場(chǎng)激烈的爭(zhēng)論。Kaplan主張把真實(shí)代碼倉(cāng)庫(kù)里的數(shù)據(jù),而不是LeetCode和HackerRank上的競(jìng)賽題,作為編程訓(xùn)練的主要數(shù)據(jù)源。

反對(duì)的聲音來(lái)自幾個(gè)資深研究員,理由很充分:真實(shí)倉(cāng)庫(kù)里的代碼太“臟”了。架構(gòu)混亂、注釋缺失、風(fēng)格不統(tǒng)一,有些甚至帶著隱藏的安全漏洞。用這種數(shù)據(jù)訓(xùn)練,短期內(nèi)的基準(zhǔn)測(cè)試分?jǐn)?shù)很可能不好看。

Kaplan在爭(zhēng)論中說(shuō)了一句后來(lái)被反復(fù)提起的話:“現(xiàn)實(shí)世界就是臟的。你要教一個(gè)士兵打仗,就讓他到泥地里打滾。不要在體操房里給他發(fā)金牌。”

最終,Anthropic選擇了泥地。這個(gè)決定在接下來(lái)的兩年里,成為整個(gè)編程賽道最深的護(hù)城河。當(dāng)其他廠商的模型在SWE-bench上拿著高分、卻在企業(yè)客戶(hù)的私有倉(cāng)庫(kù)里頻頻斷腿時(shí),Anthropic的模型從一開(kāi)始就被訓(xùn)練成處理那些“不干凈”的東西——遺留系統(tǒng)的技術(shù)債、被十個(gè)前任維護(hù)者改得面目全非的模塊、文檔早已過(guò)期的依賴(lài)鏈條。

2024年6月,Claude Sonnet 3.5發(fā)布。在當(dāng)時(shí),主流AI編程工具的能力邊界非常清晰:補(bǔ)全下一行代碼。GitHub Copilot提示續(xù)寫(xiě),也僅限于此。開(kāi)發(fā)者們已經(jīng)習(xí)慣了這種節(jié)奏,AI像一個(gè)過(guò)于熱心的實(shí)習(xí)生,能在你打了一半的語(yǔ)句后面接上幾個(gè)字,但不能指望它理解整個(gè)函數(shù)在做什么,更不可能讓它自己去查文檔、找依賴(lài)、改配置。

Sonnet 3.5打破了這種默契。它不僅能續(xù)寫(xiě)代碼,還能理解整個(gè)項(xiàng)目的上下文。不只是文件片段,而是模塊之間的關(guān)系、架構(gòu)決策、依賴(lài)鏈條。對(duì)每天在大型項(xiàng)目里工作的開(kāi)發(fā)者來(lái)說(shuō),這種差異不是量變——以前你要花二十分鐘給AI解釋上下文,現(xiàn)在AI自己建立了上下文。

Cursor在當(dāng)時(shí)還是一個(gè)只有十幾個(gè)人的年輕編輯器團(tuán)隊(duì),CEO Michael Truell在看到Sonnet 3.5的內(nèi)部測(cè)試數(shù)據(jù)后,連夜飛到舊金山與Anthropic簽了集成協(xié)議。這個(gè)決定讓Cursor在接下來(lái)半年里從一個(gè)邊緣編輯器變成了編程工具賽道的最大黑馬。Truell后來(lái)在接受采訪時(shí)說(shuō):“那一刻我們意識(shí)到,Cursor的未來(lái)不是做一個(gè)更好的文本編輯器,而是做一個(gè)AI Agent的駕駛艙。”

2025年初,Sonnet 3.7把駕駛艙變成了無(wú)人駕駛。模型從“代碼生成器”變成了一個(gè)Agent,它能在終端里自主操作,理解任務(wù)、規(guī)劃步驟、調(diào)用工具、交付結(jié)果,不再需要開(kāi)發(fā)者守在屏幕前。

2025年2月,Claude Code正式推出。到11月,年化收入突破10億美元。到2026年2月,超過(guò)25億美元。這個(gè)增速在商業(yè)軟件史上沒(méi)有先例。Salesforce從零到10億美元年化收入用了將近5年。ServiceNow用了4年。Claude Code用了9個(gè)月。

Anthropic聯(lián)合創(chuàng)始人Jack Clark在2026年的開(kāi)發(fā)者大會(huì)上透露了一個(gè)細(xì)節(jié):AI為Anthropic編寫(xiě)的代碼比例,2026年底可能接近99%。Claude Code的主要?jiǎng)?chuàng)建者Boris Cherny從2025年11月起就沒(méi)有再手動(dòng)編輯過(guò)一行代碼。Cherny在那場(chǎng)大會(huì)上被邀請(qǐng)上臺(tái)時(shí),說(shuō)了一句讓全場(chǎng)安靜了兩秒的話:“我是Claude Code的作者。但我已經(jīng)記不清,最后一行完全由我親手寫(xiě)的代碼是哪一行了。”

企業(yè)客戶(hù)也在用真金白銀下注。印度金融科技平臺(tái)CRED在維持金融級(jí)質(zhì)量標(biāo)準(zhǔn)的前提下,將開(kāi)發(fā)執(zhí)行速度翻倍。南美電商巨頭Mercado Libre擁有2.3萬(wàn)名工程師,目標(biāo)在2026年Q3實(shí)現(xiàn)90%的編碼自動(dòng)化。樂(lè)天讓Claude Code在一個(gè)1250萬(wàn)行代碼的開(kāi)源庫(kù)中連續(xù)自主工作7小時(shí),數(shù)值精度達(dá)到99.9%。全球財(cái)富十強(qiáng)企業(yè)中,8家已成為Anthropic的付費(fèi)客戶(hù)。

但真正讓整個(gè)行業(yè)感到芒刺在背的,是OpenAI在這場(chǎng)渡河戰(zhàn)役中的缺席。

Wired的一篇萬(wàn)字長(zhǎng)文詳細(xì)回溯了這段歷史。2021年,OpenAI推出Codex并授權(quán)微軟用于GitHub Copilot。這本是一次漂亮的先手布局。但隨后的決策鏈條令人扼腕:原Codex團(tuán)隊(duì)被拆散,核心成員分流至DALL-E 2和GPT-4等項(xiàng)目。ChatGPT在2022年底爆發(fā)后,公司連續(xù)數(shù)年未設(shè)獨(dú)立編程產(chǎn)品團(tuán)隊(duì),管理層認(rèn)為這個(gè)領(lǐng)域“已被GitHub Copilot覆蓋”。一位前OpenAI工程師在Wired的采訪中說(shuō)了一句意味深長(zhǎng)的話:“我們以為自己提前過(guò)了河,結(jié)果是在河對(duì)岸打了個(gè)盹,醒來(lái)發(fā)現(xiàn)橋被別人占了。”

OpenAI總裁Greg Brockman后來(lái)在播客中承認(rèn):“這是我們吸取教訓(xùn)太晚的地方。”

當(dāng)Anthropic靠Sonnet 3.5撕開(kāi)編程的口子、用Claude Code把口子變成主航道時(shí),編程作為Agent驗(yàn)證場(chǎng)景的標(biāo)桿意義已經(jīng)確立。它回答了整個(gè)行業(yè)的終極追問(wèn):Agent能不能在高度復(fù)雜、可測(cè)試、可度量的真實(shí)任務(wù)中,穩(wěn)定地替代人類(lèi)勞動(dòng)?

答案是能。盧比孔河被越過(guò)的那個(gè)瞬間,正是這個(gè)答案落地的時(shí)刻。于是,所有人都撲上來(lái)了。

02

追逐:沒(méi)有人敢留在對(duì)岸

2026年的Coding賽道,全球大模型公司幾乎無(wú)一缺席。河對(duì)岸的規(guī)則已經(jīng)改寫(xiě),沒(méi)有人敢留在原地。而每一家選擇渡河的姿態(tài),折射出的恰恰是各自最深的焦慮和最強(qiáng)的武器。

OpenAI的追趕最為猛烈,也最為狼狽。Codex在2025年9月的使用量?jī)H為Claude Code的5%,這個(gè)數(shù)字在公司內(nèi)部被視為恥辱。一位OpenAI員工在匿名論壇Blind上寫(xiě)道:“我們發(fā)明了Codex,然后讓它爛在原地。現(xiàn)在我們要從5%追起,這種感覺(jué)就像看著別人開(kāi)著你的車(chē)沖過(guò)終點(diǎn)線。”到2026年1月,Codex使用量升至Claude Code的約40%,年化收入剛過(guò)10億美元,約為對(duì)手的四成。

GPT-5.5的發(fā)布改變了勢(shì)頭。2026年5月,一場(chǎng)實(shí)驗(yàn)震動(dòng)開(kāi)發(fā)者社區(qū):Codex配合GPT-5.5的/goal模式,將一個(gè)博士生需要80小時(shí)完成的機(jī)械可解釋性研究任務(wù),壓縮至不到2小時(shí)。表面效率提升約40倍。這個(gè)數(shù)字在社交媒體上被瘋狂轉(zhuǎn)發(fā),但冷靜的研究者指出,機(jī)械可解釋性任務(wù)的結(jié)構(gòu)極其清晰、目標(biāo)高度明確,與日常工程場(chǎng)景中那種“需求還在變、文檔還沒(méi)寫(xiě)、依賴(lài)剛掛了”的混亂狀態(tài)相去甚遠(yuǎn)。能在實(shí)驗(yàn)室里跑出40倍的效率,不代表能在生產(chǎn)環(huán)境里跑出同樣的成績(jī)。

但商業(yè)競(jìng)爭(zhēng)不等人。Sam Altman在5月中旬宣布Codex免費(fèi)兩個(gè)月。這不是一場(chǎng)技術(shù)競(jìng)賽的加時(shí)賽,而是一場(chǎng)用現(xiàn)金流發(fā)動(dòng)的閃電戰(zhàn)。至4月21日,Codex開(kāi)發(fā)者用戶(hù)已超過(guò)400萬(wàn)。更關(guān)鍵的戰(zhàn)略動(dòng)作是:Codex被集成進(jìn)ChatGPT移動(dòng)應(yīng)用,從Coding Agent向通用Agent延伸。OpenAI的策略清晰到了殘酷的地步——用全球最大的對(duì)話用戶(hù)基數(shù)為自己的編程工具導(dǎo)流,不需要開(kāi)發(fā)者主動(dòng)尋找Codex,只需要讓Codex出現(xiàn)在他們已經(jīng)在用的App里。

谷歌的策略是另一種邏輯。開(kāi)源。Gemini CLI作為開(kāi)源Agent工具,將Gemini直接帶入終端,默認(rèn)集成GitHub、Google Drive、Google Maps等全家桶。定價(jià)極具攻擊性:Gemini 3.1 Pro每百萬(wàn)token輸入2美元、輸出12美元,僅為Claude Opus 4.7的十分之一。谷歌還推出Gemini Enterprise Agent Platform,將Vertex AI重新定位為面向企業(yè)Agent開(kāi)發(fā)的全棧平臺(tái)。

谷歌打的算盤(pán)是:我不需要在編程能力上超過(guò)你,只需要讓編程能力足夠便宜、足夠容易接入我的生態(tài)。一旦開(kāi)發(fā)者在谷歌的云上跑Agent,遷移成本本身就是一道護(hù)城河。一位前谷歌云高管在接受采訪時(shí)說(shuō)得直白:“這不是編程工具之戰(zhàn),這是云服務(wù)入口之戰(zhàn)。”

Meta是入局最晚、動(dòng)作最激進(jìn)的一方。2026年3月,扎克伯格時(shí)隔約20年重新提交代碼。更令人玩味的是,他使用的工具不是自家產(chǎn)品,而是競(jìng)爭(zhēng)對(duì)手的Claude Code。其中一筆修改——為Instagram的推薦系統(tǒng)優(yōu)化了一段數(shù)據(jù)加載邏輯——獲得200多位工程師點(diǎn)贊。

據(jù)Business Insider報(bào)道,扎克伯格在內(nèi)部郵件中寫(xiě)道:“我用Claude Code寫(xiě)了一些代碼。說(shuō)實(shí)話,這是我20年來(lái)第一次覺(jué)得編程又重新變得有趣了。我們要么造出比它更好的東西,要么被它吃掉。”

這封郵件在Meta內(nèi)部被泄露后,引發(fā)了兩極化的反應(yīng)。一部分工程師感到振奮,覺(jué)得CEO在親身體驗(yàn)戰(zhàn)場(chǎng)。另一部分人感到不安,一位資深工程師在內(nèi)部論壇上回復(fù):“老板用我們的對(duì)手寫(xiě)的工具寫(xiě)了代碼,然后告訴我們?nèi)绻覀冊(cè)觳怀龈玫木蜁?huì)被吃掉。這個(gè)邏輯里,我們是那個(gè)‘被吃掉’的部分。”

Meta的目標(biāo)定得極具野心:2026年上半年,65%的工程師,其75%以上的代碼由AI輔助完成。扎克伯格在公開(kāi)場(chǎng)合預(yù)測(cè),未來(lái)12到18個(gè)月內(nèi),“一半以上的開(kāi)發(fā)工作將由AI而非人類(lèi)完成”。這類(lèi)預(yù)測(cè)需要對(duì)照來(lái)看:技術(shù)可行性與組織慣性、安全合規(guī)、現(xiàn)有合同結(jié)構(gòu)之間存在顯著張力。當(dāng)年雅虎預(yù)測(cè)“移動(dòng)將取代PC”的時(shí)間表只早了五年,諾基亞預(yù)測(cè)“觸屏將取代鍵盤(pán)”的時(shí)間表只早了三年。預(yù)測(cè)對(duì)了方向、錯(cuò)了速度,比預(yù)測(cè)錯(cuò)了方向更加致命——因?yàn)樗鼤?huì)讓你在正確方向上提前消耗掉所有彈藥。

與此同時(shí),Meta團(tuán)隊(duì)還發(fā)布了HYPERAGENTS論文,提出了一種能自己寫(xiě)代碼實(shí)現(xiàn)自我進(jìn)化的超級(jí)智能體架構(gòu):Darwinian G?del Machine。這個(gè)方向的前景與風(fēng)險(xiǎn)同樣突出。前景是:如果AI能穩(wěn)定改進(jìn)自己的編程能力,那么整個(gè)行業(yè)追趕的將不再是一個(gè)固定的水平線,而是一條被AI自己不斷抬高的上升曲線。風(fēng)險(xiǎn)是:當(dāng)這條曲線的斜率超出人類(lèi)審查能力時(shí),誰(shuí)能叫停它?Meta的論文沒(méi)有回答這個(gè)問(wèn)題。

中國(guó)廠商的渡河方式,展現(xiàn)出另一種集體特質(zhì):速度、性?xún)r(jià)比和生態(tài)協(xié)同。

智譜AI的GLM-5.1在SWE-bench Pro上短暫領(lǐng)先后被追上,緩存命中價(jià)0.475美元/百萬(wàn)token首次對(duì)齊Claude Opus 4.5的0.5美元。百度通用智能體DuMate在Create大會(huì)上推出,目標(biāo)是讓非技術(shù)用戶(hù)無(wú)需接觸代碼就能完成編程任務(wù)。字節(jié)跳動(dòng)旗下的火山引擎推出ArkClaw,日均超過(guò)120萬(wàn)億token經(jīng)由豆包大模型消耗,2025年11月發(fā)布的Doubao-Seed-Code模型在SWE-bench Verified上以89.3%一度刷新行業(yè)紀(jì)錄。阿里Qwen3.6-Max Preview在六項(xiàng)主流編程基準(zhǔn)上全線登頂國(guó)產(chǎn)模型。

DeepSeek V3.2以輸入每百萬(wàn)token 0.14美元、輸出0.28美元的價(jià)格,成為性?xún)r(jià)比標(biāo)桿。月之暗面旗下的Kimi K2.6于4月開(kāi)源,在LiveCodeBench v6上以89.6%登頂榜首,不間斷編碼長(zhǎng)達(dá)13小時(shí)、編寫(xiě)或修改超4000行代碼,驅(qū)動(dòng)300個(gè)子Agent并行協(xié)作,多項(xiàng)基準(zhǔn)成績(jī)持平甚至超越GPT-5.4和Claude Opus 4.6等國(guó)際頂尖閉源模型。騰訊的Hy3 Preview和DeepSeek V4 Flash在OpenRouter的token消耗榜上持續(xù)高居前兩位。

中國(guó)軍團(tuán)的集體入場(chǎng),改變的不只是市場(chǎng)份額的分割方式,更是定價(jià)權(quán)的歸屬。當(dāng)DeepSeek把每百萬(wàn)token的單價(jià)壓到0.14美元,它不只是在賣(mài)編程服務(wù),而是在重塑整個(gè)行業(yè)的成本結(jié)構(gòu)預(yù)期。一旦這個(gè)價(jià)格成為錨點(diǎn),所有更高價(jià)位的產(chǎn)品都必須回答同一個(gè)問(wèn)題:你貴出來(lái)的那一部分,到底貴在哪兒?Anthropic的答案是可靠性。但在SWE-bench分?jǐn)?shù)趨同、新基準(zhǔn)集體翻車(chē)的背景下,可靠性的證明越來(lái)越貴,越來(lái)越難。

還有一個(gè)變量,比任何一家公司都更深刻地改變了這場(chǎng)戰(zhàn)爭(zhēng)的參戰(zhàn)方式。

2025年11月,奧地利退休程序員Peter Steinberger寫(xiě)了一個(gè)周末項(xiàng)目。他在維也納郊外的一間公寓里,用一臺(tái)老舊的MacBook Pro,花了三天時(shí)間搭建了一個(gè)開(kāi)源Agent框架的雛形。他給它配了一只紅色龍蝦作為L(zhǎng)ogo。社區(qū)叫它“龍蝦”。OpenClaw的核心能力極其直接:讓大模型獲得本地操作系統(tǒng)權(quán)限,自主執(zhí)行Shell命令,直接接管電腦,跨軟件排日程、寫(xiě)代碼、理文件。

Steinberger不是創(chuàng)業(yè)者,不是學(xué)者,不是一個(gè)在硅谷車(chē)庫(kù)里懷揣夢(mèng)想的年輕人。他是一個(gè)退休的程序員,因?yàn)闊o(wú)聊寫(xiě)了個(gè)工具,然后隨手扔到了GitHub上。短短4個(gè)多月,OpenClaw的星標(biāo)數(shù)從零突破28.5萬(wàn),超越React和Linux創(chuàng)下GitHub歷史紀(jì)錄。英偉達(dá)創(chuàng)始人黃仁勛在一次公開(kāi)演講中將它稱(chēng)為“迄今發(fā)布過(guò)的最重要軟件”。他沒(méi)有加“之一”。

OpenClaw不產(chǎn)生任何直接收入。真正受益的是大模型公司和云廠商——Agent的每一次任務(wù)執(zhí)行都會(huì)觸發(fā)多次模型請(qǐng)求,單次Token消耗可達(dá)數(shù)萬(wàn)至數(shù)十萬(wàn)。OpenClaw等于給整個(gè)行業(yè)造了一座Token消耗的加速器。2026年2月末,月之暗面向媒體透露,該公司2月前20天收入已超2025年全年總額。這不是月之暗面一家的故事。它是整個(gè)賽道被OpenClaw加速后的一個(gè)縮影。

但這股浪潮的另一面正在浮出水面。當(dāng)任何一個(gè)人都可以讓模型接管自己的操作系統(tǒng)時(shí),安全邊界就不再是一個(gè)技術(shù)問(wèn)題,而是一個(gè)社會(huì)問(wèn)題。2026年4月,一位硅谷創(chuàng)業(yè)公司的CTO在內(nèi)部Slack上發(fā)了一條消息,被截圖傳遍網(wǎng)絡(luò):“我們的實(shí)習(xí)生上周用OpenClaw配置開(kāi)發(fā)環(huán)境,不小心讓Agent把公司內(nèi)網(wǎng)的測(cè)試數(shù)據(jù)庫(kù)當(dāng)成了本地沙盒,刪掉了三天的聯(lián)調(diào)數(shù)據(jù)。沒(méi)有備份。”這條消息被轉(zhuǎn)發(fā)時(shí),最常見(jiàn)的評(píng)論是:“這不是Agent的錯(cuò)誤,是我們把鑰匙交給了一個(gè)我們還不太了解的東西。”

盧比孔河式的跨越從來(lái)不止帶來(lái)勝利。它帶來(lái)的是規(guī)則的重置、角色的混亂、以及一種讓所有人都措手不及的加速度。

03

戰(zhàn)線:河岸交火之后

盧比孔河已經(jīng)渡過(guò)了。但渡河之后才發(fā)現(xiàn),對(duì)岸不是一座空城。

2026年5月,AI編程賽道的競(jìng)爭(zhēng)密度已不能用“排行榜”來(lái)形容。更準(zhǔn)確的比喻是一張實(shí)時(shí)更新的戰(zhàn)況地圖——每一條戰(zhàn)線都在交火,每一個(gè)高地上都插著不止一面旗幟。

最直觀的尺度是SWE-bench Verified。這個(gè)由普林斯頓大學(xué)Carlos Jimenez團(tuán)隊(duì)在2023年建立的基準(zhǔn),從GitHub上提取真實(shí)issue,要求模型在給定代碼倉(cāng)庫(kù)中定位并修復(fù)bug。它不是選擇題,不是填空題,是真實(shí)世界里程序員每天面對(duì)的那類(lèi)問(wèn)題。正因如此,它成了編程模型的試金石。2024年初,GPT-4在這上面的得分還在30%附近徘徊。到2026年5月,Claude Opus 4.7推到了87.6%,GPT-5.5、Gemini 3.1 Pro、Qwen 3.6 Max-Preview等6個(gè)前沿模型全擠在80%以上,彼此差距不超過(guò)2個(gè)百分點(diǎn)。

分?jǐn)?shù)在收斂,但故事不在分?jǐn)?shù)里。

更有意思的事情發(fā)生在價(jià)格那一欄。Opus 4.7每百萬(wàn)token輸入5美元、輸出25美元。GPT-5.5是2.5美元和15美元。DeepSeek V3.2是0.14美元和0.28美元。同一個(gè)任務(wù),相近的完成率,成本可以相差近90倍。這是一個(gè)在科技史上反復(fù)出現(xiàn)的信號(hào):當(dāng)性能趨同,戰(zhàn)爭(zhēng)就從實(shí)驗(yàn)室轉(zhuǎn)移到市場(chǎng)。90倍的價(jià)差不是技術(shù)差距,是策略差距。Anthropic選擇用高價(jià)守住品牌和可靠性,DeepSeek選擇用低價(jià)擊穿門(mén)檻。兩種選擇背后是兩套完全不同的戰(zhàn)爭(zhēng)理論——前者打的是“信我,因?yàn)槲也怀鲥e(cuò)”,后者打的是“用我,因?yàn)槟阍嚨闷稹薄?/p>

但這張戰(zhàn)況地圖上最耐人尋味的一筆,是SWE-bench的創(chuàng)建者Jimenez在2026年5月放出的新基準(zhǔn):ProgramBench。這批題目不再是修bug,而是要求模型從零開(kāi)始構(gòu)建完整的程序模塊:理解需求、設(shè)計(jì)架構(gòu)、編寫(xiě)代碼、調(diào)試運(yùn)行、交付結(jié)果。在SWE-bench上拿到80%以上的那一批最強(qiáng)模型,在這套新題上集體交了白卷。0%。

這不是一個(gè)技術(shù)翻車(chē)的花邊新聞。它是一種古老戰(zhàn)爭(zhēng)規(guī)律的再現(xiàn):每一道新防線都會(huì)暴露舊裝備的邊界。1940年,法國(guó)人引以為傲的馬其諾防線被德軍繞過(guò)時(shí),法軍指揮部收到的第一批報(bào)告也是類(lèi)似的措辭:“敵人出現(xiàn)在我們的地圖之外”。

Jimenez在發(fā)布新基準(zhǔn)時(shí)寫(xiě)了一段話,措辭冷靜得像一份偵察報(bào)告:“當(dāng)前所有的編程模型,在面對(duì)需要自主規(guī)劃和多步驟推理的開(kāi)放任務(wù)時(shí),表現(xiàn)急劇下降。這不是某個(gè)模型的缺陷,而是整個(gè)范式的天花板。”

更值得留意的是業(yè)界的反應(yīng)。OpenAI沒(méi)有公開(kāi)回應(yīng)。Anthropic的開(kāi)發(fā)者關(guān)系主管在一個(gè)技術(shù)論壇上簡(jiǎn)短留言:“已知曉。感謝。”谷歌DeepMind的Fran?ois Chollet——這位早在2019年就提出ARC基準(zhǔn)來(lái)測(cè)量AI抽象推理能力的科學(xué)家——轉(zhuǎn)發(fā)了Jimenez的推文,加了一句他多年來(lái)反復(fù)說(shuō)的話:“記住,排行榜衡量的是系統(tǒng)在特定分布內(nèi)的表現(xiàn),而不是智能。我們?nèi)匀徊恢廊绾螠y(cè)量智能。”

Chollet這段話指向了一個(gè)更深層的問(wèn)題。當(dāng)所有廠商都在同一個(gè)基準(zhǔn)上優(yōu)化,當(dāng)訓(xùn)練數(shù)據(jù)里不可避免地混入了基準(zhǔn)的影子,當(dāng)排行榜上的差距縮小到小數(shù)點(diǎn)后一位,這些數(shù)字到底在說(shuō)什么?它們說(shuō)的是模型真的變強(qiáng)了,還是整個(gè)行業(yè)正在集體“過(guò)擬合”一套考題?

這不是一個(gè)學(xué)院式的追問(wèn)。它對(duì)商業(yè)競(jìng)爭(zhēng)有直接的殺傷力。2024年,一家估值超過(guò)20億美元的AI編程創(chuàng)業(yè)公司Augment,在SWE-bench上跑出了令人矚目的分?jǐn)?shù),卻在企業(yè)付費(fèi)客戶(hù)的實(shí)測(cè)中表現(xiàn)平庸,一年內(nèi)經(jīng)歷了大規(guī)模裁員和業(yè)務(wù)收縮。SWE-bench的創(chuàng)建者Jimenez本人也在多個(gè)場(chǎng)合警告過(guò)這一風(fēng)險(xiǎn)。他在2025年的一篇博客中寫(xiě)道:“如果基準(zhǔn)是公開(kāi)的,它就不再是基準(zhǔn)。它會(huì)變成訓(xùn)練目標(biāo)。而一旦變成訓(xùn)練目標(biāo),它就不再衡量能力——它只衡量你離靶心有多近。”

這正是盧比孔河對(duì)岸的第一場(chǎng)硬仗。不是跟競(jìng)爭(zhēng)對(duì)手打,是跟自己賴(lài)以評(píng)估勝負(fù)的坐標(biāo)系打。當(dāng)坐標(biāo)系本身開(kāi)始漂移,當(dāng)基準(zhǔn)失靈的速度超過(guò)了模型進(jìn)步的速度,所有參戰(zhàn)者都面臨同一個(gè)追問(wèn):你是在打贏一場(chǎng)被精確定義的上一場(chǎng)戰(zhàn)爭(zhēng),還是在為下一場(chǎng)戰(zhàn)爭(zhēng)準(zhǔn)備武器?

價(jià)格的崩塌也在加速這種漂移。GPU算力成本以每年超過(guò)50%的速度持續(xù)下降,推理成本被不斷攤薄。DeepSeek V3.2用0.28美元的價(jià)格提供接近Opus 4.7的編程能力,這件事的市場(chǎng)沖擊不亞于當(dāng)年豐田用花冠打入通用和福特的核心市場(chǎng)。Anthropic的毛利率從38%升至70%以上,說(shuō)明高端市場(chǎng)仍然愿意為可靠性支付溢價(jià)。

但問(wèn)題在于:當(dāng)?shù)投诉x項(xiàng)的可靠性也在逼近,溢價(jià)還能維持多久?豐田花冠最終不是靠?jī)r(jià)格打贏的,是靠可靠性。這正是日本汽車(chē)工業(yè)在上世紀(jì)80年代給底特律上的一課,也是如今懸在Anthropic頭上的一把劍。

2026年5月,Coding的最新戰(zhàn)況大致如此:渡河者已在河對(duì)岸站穩(wěn)腳跟,陣線正在從單點(diǎn)突破演變?yōu)槎帱c(diǎn)交火。前沿模型在已知地形的表現(xiàn)高度趨同,價(jià)格裂谷橫貫整個(gè)戰(zhàn)區(qū)。但更深處——那片尚未被測(cè)繪的區(qū)域——最新的偵察數(shù)據(jù)表明,所有渡河者都還沒(méi)有準(zhǔn)備好。那里藏著的,可能不是敵軍,而是這場(chǎng)戰(zhàn)爭(zhēng)本身的邊界。

而邊界的那一邊,已經(jīng)響起了新的聲響。

04

暗涌:戰(zhàn)爭(zhēng)機(jī)器的內(nèi)部裂痕

前線的戰(zhàn)況還在膠著,后方已經(jīng)出現(xiàn)了第一道裂縫。

2026年5月中旬,Anthropic在沒(méi)有任何預(yù)告的情況下,將Claude Code的免費(fèi)額度從每月250次調(diào)用壓縮至80次。公告在舊金山時(shí)間周五晚上發(fā)出——硅谷公司最偏愛(ài)的壞消息發(fā)布時(shí)間。開(kāi)發(fā)者社區(qū)在幾個(gè)小時(shí)內(nèi)炸開(kāi)了鍋。Twitter上一位在Spotify工作的工程師寫(xiě)道:“我們團(tuán)隊(duì)上周剛把整個(gè)CI/CD流水線掛在Claude Code上,現(xiàn)在告訴我們額度砍了三分之二,周一部署怎么辦?”這條推文被轉(zhuǎn)發(fā)了超過(guò)一萬(wàn)次。不到48小時(shí),OpenAI的Sam Altman轉(zhuǎn)發(fā)了Codex免費(fèi)兩個(gè)月的公告,配文只有三個(gè)單詞:“No quotas.”——不設(shè)額度。

這是一場(chǎng)在對(duì)手暴露軟肋時(shí)精準(zhǔn)刺入的遭遇戰(zhàn)。Anthropic的算力瓶頸不是秘密。Dario Amodei在開(kāi)發(fā)者大會(huì)上被問(wèn)及額度問(wèn)題時(shí),回答得相當(dāng)坦率:“收入增長(zhǎng)越快,芯片就越不夠用。我們正在以最大速度建設(shè)推理集群,但需求跑在供給前面。”這段話的潛臺(tái)詞是清晰的:Anthropic的護(hù)城河不在商業(yè)模式,在模型能力。但模型能力需要算力喂養(yǎng),而算力是實(shí)物資產(chǎn),有物理交付周期。當(dāng)戰(zhàn)爭(zhēng)從技術(shù)競(jìng)賽升級(jí)為消耗戰(zhàn),率先渡河者反而最先撞上了自己的后勤極限。

OpenAI對(duì)這一點(diǎn)的理解,比任何人都刻骨銘心。

據(jù)知情人士透露,Greg Brockman在今年3月的一次內(nèi)部全員會(huì)上,回溯了公司歷史上一個(gè)鮮為人知的細(xì)節(jié)。2022年秋天,ChatGPT在發(fā)布前夜幾乎被擱置。彼時(shí)公司內(nèi)部對(duì)要不要上線爭(zhēng)論不休,有人認(rèn)為產(chǎn)品太不成熟,有人擔(dān)心API的算力供應(yīng)跟不上潛在的用戶(hù)涌入。據(jù)稱(chēng),當(dāng)時(shí)Sam Altman問(wèn)了一個(gè)問(wèn)題:“如果我們不發(fā),別人發(fā)了怎么辦?”沒(méi)有人能回答。ChatGPT在那周按時(shí)發(fā)布,兩周內(nèi)涌入了超過(guò)一億用戶(hù),把OpenAI的服務(wù)器集群壓在崩潰的邊緣運(yùn)轉(zhuǎn)了近一個(gè)季度。“那三個(gè)月教會(huì)我們一件事,”Brockman在那次會(huì)上說(shuō),“在AI這條賽道上,你永遠(yuǎn)不可能在完全準(zhǔn)備好的情況下開(kāi)戰(zhàn)。你只能在開(kāi)戰(zhàn)后,祈禱自己的彈藥比對(duì)手多一顆。”

這顆彈藥,正在變成現(xiàn)金。

截至2026年5月,OpenAI為Codex免費(fèi)期準(zhǔn)備的補(bǔ)貼預(yù)算,據(jù)估算超過(guò)4億美元。Anthropic的算力缺口,據(jù)半導(dǎo)體供應(yīng)鏈的消息人士估算,大約需要新增3到5萬(wàn)片H200級(jí)GPU才能填補(bǔ)。谷歌的Gemini Enterprise Agent Platform以近乎成本價(jià)的價(jià)格在市場(chǎng)上鋪量,背后是每年超過(guò)600億美元的資本開(kāi)支兜底。Meta的扎克伯格在內(nèi)部郵件中寫(xiě)道:“我們?cè)诰幊坦ぞ呱系穆浜螅举|(zhì)上是推理基礎(chǔ)設(shè)施的落后。補(bǔ)上這一課,需要200億美元級(jí)別的新增投入。”他在郵件末尾加了一行字:“這可能是本世紀(jì)最重要的資本支出,不要跟董事會(huì)討論ROI——他們算不出來(lái)。”

這不只是一場(chǎng)技術(shù)競(jìng)賽。它正在變成一場(chǎng)用現(xiàn)金填滿(mǎn)的消耗戰(zhàn)。

更致命的問(wèn)題在另一個(gè)維度。

2026年4月,摩根大通內(nèi)部信息安全委員會(huì)向全體工程部門(mén)發(fā)出一份備忘錄,措辭是金融行業(yè)少見(jiàn)的嚴(yán)厲:“當(dāng)前所有AI編程Agent在接入生產(chǎn)級(jí)代碼庫(kù)和客戶(hù)敏感數(shù)據(jù)時(shí),均未達(dá)到我行內(nèi)部安全評(píng)估的第三級(jí)標(biāo)準(zhǔn)。在進(jìn)一步通知之前,禁止任何團(tuán)隊(duì)將AI Agent直接接入涉及個(gè)人身份信息的代碼倉(cāng)庫(kù)。”這份備忘錄沒(méi)有點(diǎn)名任何一家廠商,但它幾乎同時(shí)適用于所有廠商。高盛、花旗、匯豐在隨后兩周內(nèi)發(fā)布了類(lèi)似文件,措辭各有不同,底線高度一致:允許,但必須斷網(wǎng),且限制數(shù)據(jù)訪問(wèn)級(jí)別。

這意味著什么?意味著AI編程Agent進(jìn)入企業(yè)核心業(yè)務(wù)系統(tǒng)的速度,將被安全合規(guī)問(wèn)題踩下剎車(chē)。而這個(gè)剎車(chē)不是任何一家模型廠商能單獨(dú)拆掉的。它需要整個(gè)行業(yè)在安全沙盒、數(shù)據(jù)審計(jì)、權(quán)限隔離和合規(guī)框架上達(dá)成共識(shí),或者至少形成一套可被監(jiān)管機(jī)構(gòu)接受的事實(shí)標(biāo)準(zhǔn)。OpenAI在2026年5月發(fā)布的Windows沙盒技術(shù)方案,就是在試圖獨(dú)自作答這個(gè)問(wèn)題。但一家廠商的方案,不等于一個(gè)行業(yè)的答案。

這還不是裂痕的全部。

2026年5月下旬,Hacker News上出現(xiàn)了一篇廣為流傳的長(zhǎng)帖,標(biāo)題是《我用Claude Code寫(xiě)了三個(gè)月代碼,現(xiàn)在我不確定我還會(huì)編程》。帖子詳細(xì)記錄了作者從興奮到依賴(lài),再到感到“肌肉萎縮”的全過(guò)程。“一開(kāi)始是復(fù)制粘貼AI生成的代碼段。然后是不加審查地接受整個(gè)函數(shù)的修改。最后我發(fā)現(xiàn)自己連一個(gè)簡(jiǎn)單的SQL查詢(xún)都不想寫(xiě)了,因?yàn)樽孋laude寫(xiě)更快。”帖子的評(píng)論區(qū)在三小時(shí)內(nèi)被頂?shù)搅薍acker News歷史熱度榜前十。排在最高贊的回復(fù)只有一句話:“我們正在用效率工具,制造一代不知道如何造輪子的工程師。”

這不是一個(gè)孤立的情緒波動(dòng)。斯坦福大學(xué)2026年發(fā)布的《人工智能指數(shù)報(bào)告》中,有一項(xiàng)針對(duì)超過(guò)5000名軟件開(kāi)發(fā)者的追蹤調(diào)查,結(jié)果顯示:每天使用AI編程工具的開(kāi)發(fā)者中,73%表示“明顯感到自己的底層調(diào)試能力在退化”,58%表示“對(duì)AI生成的代碼缺乏系統(tǒng)性理解”。更微妙的數(shù)據(jù)是:當(dāng)被要求在不使用AI工具的情況下完成一道中等難度的算法題時(shí),這個(gè)群體完成率比兩年前的同齡對(duì)照組下降了22個(gè)百分點(diǎn)。

這是渡河者未曾預(yù)料到的代價(jià)之一。你帶了一支軍隊(duì)過(guò)河,但行軍過(guò)程中,武器在幫你打仗,也在讓你的士兵變?nèi)酢?/p>

Dario Amodei在開(kāi)發(fā)者大會(huì)的問(wèn)答環(huán)節(jié)被問(wèn)及這個(gè)問(wèn)題時(shí),沉默了幾秒鐘。然后他給了一個(gè)不回避的回答:“這是一個(gè)真實(shí)的問(wèn)題。我們內(nèi)部也在討論。但我能說(shuō)的是,人類(lèi)過(guò)去每一次引入新工具,都會(huì)有人擔(dān)心技能退化。從計(jì)算器到搜索引擎,再到IDE自動(dòng)補(bǔ)全,每一次都發(fā)生了。但每一次,行業(yè)的整體生產(chǎn)力都上了一個(gè)臺(tái)階。”他頓了頓,又說(shuō):“只是這次的速度確實(shí)太快了。快到我們可能來(lái)不及適應(yīng)。”

Greg Brockman在另一個(gè)場(chǎng)合的表述更直接。當(dāng)被問(wèn)及“程序員會(huì)不會(huì)被取代”時(shí),他回答:“程序員不會(huì)消失。但不使用AI的程序員會(huì)。就像2005年,會(huì)計(jì)師沒(méi)有因?yàn)镋xcel消失,但不會(huì)用Excel的會(huì)計(jì)師消失了。”

兩句話放在一起看,可以讀出這場(chǎng)戰(zhàn)爭(zhēng)真正的殘酷之處:不是AI替代了人類(lèi),而是使用AI的那部分人類(lèi),正在替代不使用AI的那部分人類(lèi)。而使用AI的那部分人,又在面臨被AI削弱底層能力的風(fēng)險(xiǎn)。這不是一場(chǎng)單向的替代。這是一個(gè)所有人都被卷入、無(wú)人能完全掌控的螺旋。渡河之后,你以為戰(zhàn)場(chǎng)在河對(duì)岸。但你很快發(fā)現(xiàn),河對(duì)岸的戰(zhàn)場(chǎng),有一部分就在你自己的陣地上。

盧比孔河沒(méi)有上游和下游。它只有一條方向——朝前。

05

彼岸:尚未命名的土地

盧比孔河已被甩在身后。但渡河者很快會(huì)發(fā)現(xiàn),他們占領(lǐng)的不是一座城池,而是一片尚未測(cè)繪的大陸。

Anthropic開(kāi)發(fā)者大會(huì)上,有一位參會(huì)者在筆記里寫(xiě)下了一句話,會(huì)后被反復(fù)引用:“多數(shù)生產(chǎn)級(jí)智能體系統(tǒng)的瓶頸,現(xiàn)在已經(jīng)不是模型能力,而是模型周邊的基礎(chǔ)設(shè)施。”寫(xiě)下這句話的是Stripe平臺(tái)工程團(tuán)隊(duì)的一位負(fù)責(zé)人,她所在的團(tuán)隊(duì)在三個(gè)月前將Claude Code接入了支付核心系統(tǒng)。

她說(shuō)這話時(shí)有數(shù)據(jù)支撐:Stripe的實(shí)測(cè)表明,Agent在理想環(huán)境中的代碼生成正確率超過(guò)85%,但在生產(chǎn)環(huán)境中,接入認(rèn)證網(wǎng)關(guān)、審計(jì)日志和異常回滾機(jī)制后,有效可用率跌到了60%以下。掉下來(lái)的25個(gè)百分點(diǎn),沒(méi)有一個(gè)是模型的問(wèn)題。全是管道、權(quán)限、監(jiān)控和容錯(cuò)的問(wèn)題。

她的結(jié)論是:“我們花了一年時(shí)間讓模型變得足夠好。接下來(lái)可能要花兩年時(shí)間讓管道足夠結(jié)實(shí)。”

這句話精準(zhǔn)地標(biāo)定了一個(gè)歷史時(shí)刻:智能體編程已經(jīng)越過(guò)“能不能跑”的階段,進(jìn)入了“能不能大規(guī)模跑、能不能在風(fēng)雨里跑”的階段。

同一場(chǎng)大會(huì)上,Anthropic公布了一張調(diào)用量分布圖,堪稱(chēng)為整個(gè)行業(yè)做了一次內(nèi)部結(jié)構(gòu)的X光掃描。軟件工程獨(dú)占49.7%的調(diào)用,是第二名后臺(tái)自動(dòng)化的5.5倍。法律、醫(yī)療、電商、教育等垂直領(lǐng)域加起來(lái),不到6%。這張圖的潛臺(tái)詞再清晰不過(guò):coding作為Agent的生產(chǎn)力價(jià)值已被完全證實(shí),但coding之外的白領(lǐng)勞動(dòng)市場(chǎng),幾乎還是一塊處女地。

但這塊處女地上已經(jīng)出現(xiàn)了一些拓荒者。

法律科技公司Harvey的聯(lián)合創(chuàng)始人Winston Weinberg在大會(huì)上展示了他們的多智能體編排系統(tǒng)。在他的演示里,一個(gè)由7個(gè)專(zhuān)業(yè)Agent組成的團(tuán)隊(duì)——分別負(fù)責(zé)檢索判例、拆解條款、擬寫(xiě)初稿、交叉審閱、風(fēng)險(xiǎn)評(píng)估、格式校核和最終合稿——在22分鐘內(nèi)完成了一份跨境并購(gòu)協(xié)議的核心條款起草。同樣一組任務(wù),交給一組初級(jí)律師,平均需要6小時(shí)。Weinberg沒(méi)有用“替代”這個(gè)詞。他說(shuō)的是:“我們不是在取代律師,我們是在把律師從文件堆里解放出來(lái),讓他們?nèi)プ鲋挥腥四茏龅呐袛唷!迸_(tái)下的律師們表情復(fù)雜。

Netflix的平臺(tái)工程團(tuán)隊(duì)展示了另一個(gè)方向。他們的日志分析智能體可以并行處理數(shù)百個(gè)構(gòu)建批次,自動(dòng)過(guò)濾出值得關(guān)注的跨批次異常規(guī)律。負(fù)責(zé)人在演示中說(shuō)了句意味深長(zhǎng)的話:“以前我們雇人看日志,后來(lái)雇人寫(xiě)腳本看日志。現(xiàn)在腳本自己寫(xiě)自己看,我們只負(fù)責(zé)在它看不懂的時(shí)候做決定。”他補(bǔ)充道,“問(wèn)題是,它越來(lái)越不需要我們做決定了。”

不過(guò),真正讓這場(chǎng)開(kāi)發(fā)者大會(huì)的后半段氣氛發(fā)生微妙變化的,不是這些案例,而是一個(gè)話題的轉(zhuǎn)向。

大會(huì)進(jìn)行到第二天下午,Anthropic的聯(lián)合創(chuàng)始人Jack Clark在臺(tái)上被問(wèn)到一個(gè)問(wèn)題:“當(dāng)AI編寫(xiě)的代碼比例接近100%時(shí),人類(lèi)工程師的角色到底是什么?”Clark沒(méi)有用公關(guān)話術(shù)。他沉默了幾秒,然后說(shuō):“我不知道。我說(shuō)真的,我不知道。”

他接著講了一個(gè)故事。幾周前,Claude Code的團(tuán)隊(duì)發(fā)現(xiàn)了一段底層調(diào)度邏輯存在問(wèn)題。如果放在兩年前,這會(huì)是一張JIRA工單,分給某個(gè)工程師,花一個(gè)下午調(diào)試。但那天,Claude Code的主要?jiǎng)?chuàng)建者Boris Cherny在Slack上發(fā)了一條消息:“我讓Claude看了一下,它找到了三個(gè)可能的根因,給出了修復(fù)方案,概率排序。我只點(diǎn)了‘接受’。”Clark停了一下,看著臺(tái)下的觀眾。“我們創(chuàng)造了這個(gè)工具,但我們自己也在被這個(gè)工具重新定義。工具的設(shè)計(jì)師正在變成工具的用戶(hù),然后變成工具的審核者。接下來(lái)是什么?審核者的審核者?”

會(huì)場(chǎng)安靜了幾秒鐘。然后有人鼓掌。不是熱烈的掌聲,是那種被說(shuō)中了不安后的本能反應(yīng)。

這不是一個(gè)孤立的故事。它指向的,是coding在硅基文明演進(jìn)中的真正位置。它正在從“Agent的一個(gè)應(yīng)用場(chǎng)景”變成“Agent自我進(jìn)化的底層引擎”。

Meta的HYPERAGENTS論文(已被ICLR 2026收錄)提出了一種名為Darwinian G?del Machine的架構(gòu),其核心邏輯極其簡(jiǎn)潔,也極其令人不安:在編程領(lǐng)域,改進(jìn)自身編程能力的任務(wù),與解決外部編程問(wèn)題的任務(wù),天然對(duì)齊。也就是說(shuō),AI改進(jìn)自己的代碼,就是在改進(jìn)自己。

這種“遞歸式自我改進(jìn)”在概念上不是新東西。圖靈在1951年的曼徹斯特講演中就曾模糊地觸及過(guò),哥德?tīng)栐诟绲臅r(shí)候?yàn)樗峁┝诉壿媽W(xué)地基。但2026年,它第一次不再是理論推演,而是工程提案。論文中有一個(gè)段落被圈內(nèi)反復(fù)標(biāo)注:“如果自我改進(jìn)的鏈條在某個(gè)節(jié)點(diǎn)上不再需要外部驗(yàn)證就能通過(guò)內(nèi)部一致性判斷,那么系統(tǒng)的進(jìn)化速度將不再受人類(lèi)審查帶寬的限制。”

這句話換一種說(shuō)法就是:當(dāng)AI學(xué)會(huì)自己給自己打分,并且這個(gè)分?jǐn)?shù)足夠可信,人類(lèi)的剎車(chē)踏板就消失了。

這是coding的中場(chǎng)戰(zhàn)事。

上半場(chǎng),Anthropic用Claude Code驗(yàn)證了一件事:Agent可以在編程領(lǐng)域穩(wěn)定替代人類(lèi)勞動(dòng)。全球大模型公司隨后密集渡河,在基準(zhǔn)測(cè)試和市場(chǎng)份額上展開(kāi)貼身纏斗,價(jià)格戰(zhàn)、算力戰(zhàn)、安全合規(guī)戰(zhàn)相繼打響。

下半場(chǎng)的輪廓也已清晰:編程不再是終點(diǎn),它是AI自我強(qiáng)化的底座。誰(shuí)能在這個(gè)底座上建得更高、跑得更穩(wěn)、覆蓋得更廣,誰(shuí)就能在這場(chǎng)硅基文明演進(jìn)的競(jìng)爭(zhēng)中,撐到下個(gè)十年。

但Clark那一句“我不知道”,Brockman那一句“吸取教訓(xùn)太晚”,Amodei那一句“快到我們可能來(lái)不及適應(yīng)”,以及那個(gè)在Hacker News上寫(xiě)下“我不確定我還會(huì)編程”的匿名工程師——這些聲音指向的是同一件事:渡河者不僅要面對(duì)對(duì)岸的敵軍,還要面對(duì)自己內(nèi)部正在發(fā)生的某種不可逆的變化。工具在重塑使用者,使用者在適應(yīng)工具,而適應(yīng)的終點(diǎn)在哪里,沒(méi)有人能在地圖上標(biāo)出來(lái)。

盧比孔河已經(jīng)過(guò)去了。愷撒渡河時(shí)說(shuō)的那句話——“骰子已經(jīng)擲下”——常常被解讀為一種破釜沉舟的豪情。但研究羅馬史的學(xué)者知道,這句話的拉丁文原文“Alea iacta est”還有一層更古老的詞源學(xué)含義:alea不是普通的骰子,是那種在羅馬酒館里被人灌了鉛的、注定擲不出某個(gè)點(diǎn)數(shù)的作弊骰。普魯塔克在《希臘羅馬名人傳》里考證過(guò)這一層。換句話說(shuō),愷撒在說(shuō)出這句話時(shí),未必是在豪賭。他可能是在說(shuō):這個(gè)游戲的規(guī)則,早在骰子被制造出來(lái)時(shí)就已經(jīng)被寫(xiě)死了。我能做的,只有擲出去。

2026年5月的AI編程賽道,骰子同樣已經(jīng)擲下。它是不是灌了鉛的,沒(méi)有人知道。但有一件事是確定的:一旦擲出,撿不回來(lái)。

留給每一個(gè)參戰(zhàn)者的真正難題,不在河對(duì)岸。在自己身上。當(dāng)模型能力趨同、價(jià)格歸零、基準(zhǔn)失靈,當(dāng)工程師在鍵盤(pán)上越來(lái)越快、腦子里越來(lái)越空,當(dāng)AI開(kāi)始寫(xiě)代碼改進(jìn)AI自己——競(jìng)爭(zhēng)將退回到那個(gè)最古老的層面:信任、克制,以及知道在哪里踩剎車(chē)的判斷力。

那才是Coding之后,真正的戰(zhàn)場(chǎng)。不是誰(shuí)跑得更快,而是在所有人都剎不住車(chē)的時(shí)候,誰(shuí)能證明自己值得被信任。

愷撒最終贏下了內(nèi)戰(zhàn),卻在元老院被刺。有些戰(zhàn)爭(zhēng),贏在戰(zhàn)場(chǎng)上,輸在大勢(shì)里。盧比孔河只是一個(gè)起點(diǎn)。彼岸的黎明,從不保證任何人的抵達(dá)。

轉(zhuǎn)載開(kāi)白 | 商務(wù)合作 | 內(nèi)容交流

請(qǐng)?zhí)砑游⑿牛簀induan008

添加微信請(qǐng)備注姓名公司與來(lái)意

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
河南“零分女生”蔣多多:因不滿(mǎn)高考制度,在試卷上寫(xiě)8000字長(zhǎng)文

河南“零分女生”蔣多多:因不滿(mǎn)高考制度,在試卷上寫(xiě)8000字長(zhǎng)文

混沌錄
2026-06-09 22:03:13
壞消息不斷送進(jìn)克里姆林宮,普京開(kāi)始“打土豪”,寡頭秒掏千億

壞消息不斷送進(jìn)克里姆林宮,普京開(kāi)始“打土豪”,寡頭秒掏千億

浪子說(shuō)
2026-06-09 00:05:03
梅西替補(bǔ)建功,阿根廷3-0冰島,世界杯首戰(zhàn)對(duì)手剛掀翻無(wú)冕之王

梅西替補(bǔ)建功,阿根廷3-0冰島,世界杯首戰(zhàn)對(duì)手剛掀翻無(wú)冕之王

釘釘陌上花開(kāi)
2026-06-10 11:04:57
越鬧越大!宋珍珍再曝猛料,除了陳濤以外,還被很多深圳老板睡過(guò)

越鬧越大!宋珍珍再曝猛料,除了陳濤以外,還被很多深圳老板睡過(guò)

小鋭?dòng)性捳f(shuō)
2026-06-10 00:04:26
中方:對(duì)投票結(jié)果表示失望

中方:對(duì)投票結(jié)果表示失望

揚(yáng)子晚報(bào)
2026-06-10 10:20:07
重磅!皇馬官宣1.5億歐報(bào)價(jià)26歲小蜘蛛 馬競(jìng)秒拒:感謝?來(lái)搞笑的

重磅!皇馬官宣1.5億歐報(bào)價(jià)26歲小蜘蛛 馬競(jìng)秒拒:感謝?來(lái)搞笑的

風(fēng)過(guò)鄉(xiāng)
2026-06-10 05:53:38
存在虛報(bào)年齡參賽,中國(guó)籃協(xié)公布對(duì)李沂澤及相關(guān)人員的處罰決定

存在虛報(bào)年齡參賽,中國(guó)籃協(xié)公布對(duì)李沂澤及相關(guān)人員的處罰決定

界面新聞
2026-06-10 10:34:44
李若彤自曝“整頭都是假發(fā)片”,60歲狀態(tài)驚艷網(wǎng)友

李若彤自曝“整頭都是假發(fā)片”,60歲狀態(tài)驚艷網(wǎng)友

韓小娛
2026-06-10 09:24:19
靈活就業(yè)今年將達(dá)到3.2億人,這說(shuō)明了什么?

靈活就業(yè)今年將達(dá)到3.2億人,這說(shuō)明了什么?

歷史總在押韻
2026-06-09 19:44:49
上海司機(jī)沒(méi)禮讓行人被扣分后表示不認(rèn)罰,交警反懟:我不需要你認(rèn)

上海司機(jī)沒(méi)禮讓行人被扣分后表示不認(rèn)罰,交警反懟:我不需要你認(rèn)

映射生活的身影
2026-06-09 15:57:40
美眾議院集體表決通告全球:不再承認(rèn)“一中”原則?這次不能再忍

美眾議院集體表決通告全球:不再承認(rèn)“一中”原則?這次不能再忍

混沌錄
2026-06-09 22:14:08
紐約市長(zhǎng):G4將舉辦場(chǎng)外觀賽派對(duì),尼克斯五場(chǎng)奪冠!

紐約市長(zhǎng):G4將舉辦場(chǎng)外觀賽派對(duì),尼克斯五場(chǎng)奪冠!

懂球帝
2026-06-10 09:32:31
一位大學(xué)老師,決定停更了

一位大學(xué)老師,決定停更了

大張的自留地
2026-06-09 21:25:22
惡有惡報(bào):7.9級(jí)地震,菲律賓向中國(guó)求助引全球關(guān)注

惡有惡報(bào):7.9級(jí)地震,菲律賓向中國(guó)求助引全球關(guān)注

夢(mèng)想的現(xiàn)實(shí)
2026-06-09 20:32:59
活久見(jiàn)!4人在上海國(guó)際KTV消費(fèi)52990元引關(guān)注,酒水消費(fèi)達(dá)44940元

活久見(jiàn)!4人在上海國(guó)際KTV消費(fèi)52990元引關(guān)注,酒水消費(fèi)達(dá)44940元

火山詩(shī)話
2026-06-09 15:00:41
龍珠人物原型,怪不得總感覺(jué)似曾相識(shí),看到孫悟空很多人繃不住了

龍珠人物原型,怪不得總感覺(jué)似曾相識(shí),看到孫悟空很多人繃不住了

動(dòng)漫小天堂
2026-06-09 11:57:04
離婚15年后再看謝暉,他的選擇有多正確

離婚15年后再看謝暉,他的選擇有多正確

小柨拍客在北漂
2026-06-09 12:55:49
菲律賓一天1055次地震,中美日都不提援助二字,菲防長(zhǎng)自食苦果

菲律賓一天1055次地震,中美日都不提援助二字,菲防長(zhǎng)自食苦果

共工之錨
2026-06-10 00:37:43
雞蛋價(jià)格暴漲

雞蛋價(jià)格暴漲

第一財(cái)經(jīng)資訊
2026-06-09 17:44:37
NBA總決賽砍下50+有多難?歷史有7人解鎖此成就,現(xiàn)役僅2人做到!

NBA總決賽砍下50+有多難?歷史有7人解鎖此成就,現(xiàn)役僅2人做到!

猴哥聊體育
2026-06-10 07:15:09
2026-06-10 13:16:49
錦緞研究院 incentive-icons
錦緞研究院
專(zhuān)注上市公司價(jià)值發(fā)現(xiàn)與傳播
2533文章數(shù) 10831關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!Anthropic神級(jí)模型向你開(kāi)放

頭條要聞

美媒:美國(guó)政客連中國(guó)品牌車(chē)輛"入境"美國(guó)都不允許了

頭條要聞

美媒:美國(guó)政客連中國(guó)品牌車(chē)輛"入境"美國(guó)都不允許了

體育要聞

2026世界杯,我們看什么?

娛樂(lè)要聞

850萬(wàn)請(qǐng)跑男,公款追星肥了誰(shuí)的口袋

財(cái)經(jīng)要聞

大盤(pán)股IPO終結(jié)行情盛宴?背后真相來(lái)了

汽車(chē)要聞

賽豆科技發(fā)布AIVA品牌 首款概念車(chē)亮相/量產(chǎn)版新車(chē)今年內(nèi)發(fā)布

態(tài)度原創(chuàng)

健康
藝術(shù)
游戲
家居
數(shù)碼

粽子、湯圓……常見(jiàn)粘食大盤(pán)點(diǎn)!

藝術(shù)要聞

2026年中國(guó)美術(shù)學(xué)院,研究生畢業(yè)油畫(huà)作品選(四)

全新豐乳足控游戲上線!通關(guān)解鎖玉足懟臉鏡頭

家居要聞

空間微調(diào) 移形換境

數(shù)碼要聞

每隔3個(gè)月插拔1次:網(wǎng)友反饋其RTX 5090顯卡線纜熔毀

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版