AI正在以遠(yuǎn)超人類預(yù)期的速度,改寫自己的代碼。
6月4日,手握Claude模型、估值已飆升至9650億美元的AI巨頭Anthropic,突然向全球同業(yè)拋出了一顆重磅炸彈——呼吁全球頂級(jí)AI實(shí)驗(yàn)室考慮放緩研發(fā)步伐,理由很簡單,但也極其震撼:AI可能正在逼近一個(gè)"遞歸自我改進(jìn)"的臨界點(diǎn),屆時(shí),AI將能在沒有人類干預(yù)的情況下自行迭代,造出更強(qiáng)的下一代AI。
這不是科幻小說里的情節(jié)。Anthropic在萬字長文中披露的內(nèi)部數(shù)據(jù)顯示,截至2026年5月,其代碼庫中超過80%的代碼已經(jīng)由Claude自己生成;工程師平均每季度交付的代碼量,是2021-2025年的8倍。在最開放、最模糊、連答案長什么樣都不確定的編程任務(wù)上,Claude的成功率達(dá)到了76%,而6個(gè)月前,這個(gè)數(shù)字只有26%。
![]()
當(dāng)一家公司聲稱"代碼幾乎都是AI寫的",而外部觀察者發(fā)現(xiàn)它說的確實(shí)是事實(shí)時(shí),整個(gè)世界就不能再假裝什么都沒發(fā)生了。這不是關(guān)于AI取代程序員,而是關(guān)于AI開始取代AI開發(fā)者的工作——一個(gè)自我加速的螺旋,正在悄然轉(zhuǎn)動(dòng)。
一、AI的"自我加速"到底有多快?
Anthropic創(chuàng)建了一個(gè)全新的衡量維度,叫"AI能獨(dú)立完成的任務(wù)時(shí)長"。2024年3月,Claude Opus 3只能搞定人類大約4分鐘的軟件任務(wù);一年后,Claude Sonnet 3.7能干1.5小時(shí)的活兒;又一年,Claude Opus 4.6已經(jīng)能連續(xù)工作12小時(shí)。而最新的Mythos版本,在內(nèi)測中已經(jīng)能夠連續(xù)工作"至少"16小時(shí)——這已經(jīng)是METR測試框架能衡量的上限。
翻倍的速度也在加快。從每7個(gè)月翻一倍,加速到了每4個(gè)月翻一倍。如果這個(gè)趨勢持續(xù)下去,2027年,AI可能能獨(dú)立完成數(shù)周甚至數(shù)月的工作量。
在Anthropic內(nèi)部,AI不只是"協(xié)助"開發(fā),而是深度"參與"到了研發(fā)的每一個(gè)環(huán)節(jié)。所有提交到代碼庫的改動(dòng),都會(huì)先經(jīng)過Claude自動(dòng)審查,檢查bug、安全漏洞和其他缺陷。回溯分析發(fā)現(xiàn),如果之前每次改動(dòng)都有這道自動(dòng)審查,大約三分之一導(dǎo)致線上事故的bug,上線之前就會(huì)被攔下來。
在更宏觀的層面,OpenAI后訓(xùn)練團(tuán)隊(duì)負(fù)責(zé)人Yann Dubois也提供了一個(gè)觀察角度:AI能力的增長是線性的、連續(xù)的,但用戶體驗(yàn)到的"有用性"卻是離散的、跳躍的。因?yàn)榇嬖谝粋€(gè)"可靠性閾值",在跨過那個(gè)門檻之前,AI像一個(gè)聰明但愛闖禍的實(shí)習(xí)生,你不敢把活徹底交給它;跨過之后,它就成了能托付工作的員工。他判斷OpenAI大概在2025年12月左右跨過了這條線。而更刺激的是,當(dāng)模型足夠好,它會(huì)反過來加速研發(fā)本身——尤其在編程場景里,模型變強(qiáng)等于全員多了個(gè)不睡覺的搭檔,既能幫研究者把工具鏈搭起來,也能在訓(xùn)練下一代模型時(shí)"以AI養(yǎng)AI"。加速回路一旦轉(zhuǎn)起來,就會(huì)越轉(zhuǎn)越快。
換句話說,當(dāng)AI開始參與設(shè)計(jì)下一代的自己時(shí),開發(fā)者本人反而成了配角。
二、AI加速的紅利:生產(chǎn)力飛躍與社會(huì)變革
Anthropic在文章中強(qiáng)調(diào),"自主迭代的AI,是人類科技史上里程碑式的突破,能在生物醫(yī)藥、前沿科研等領(lǐng)域帶來巨大的好處"。
第一種可能是樂觀的:AI能力可能停滯在當(dāng)前水平,但現(xiàn)有技術(shù)普及仍將重塑各行各業(yè)。第二種可能是"人均生產(chǎn)力暴增",百人團(tuán)隊(duì)可完成過往萬人甚至十萬人的工作量,知識(shí)產(chǎn)業(yè)、政務(wù)服務(wù)迎來顛覆性變革。第三種可能性則是:AI將掌握人類創(chuàng)造性研發(fā)的全部能力,獨(dú)立自主設(shè)計(jì)迭代新版本,加速醫(yī)藥、化工、基礎(chǔ)科學(xué)的突破。
這不僅是技術(shù)的飛躍,更是社會(huì)結(jié)構(gòu)的重構(gòu)。正如Anthropic所言,"100人的公司就能完成1萬人甚至10萬人的組織的工作量",這將徹底改變知識(shí)工作和政府服務(wù)的形態(tài)。
三、踩剎車:為什么技術(shù)飛躍令人不安?
但硬幣的另一面,同樣令人憂心。
如果AI能夠自主構(gòu)建下一代AI系統(tǒng),面臨的將不是一個(gè)技術(shù)問題,而是一個(gè)控制問題。Anthropic警告稱,"如今模型中罕見的偏差可能會(huì)隨著模型構(gòu)建其后續(xù)版本而加劇,出現(xiàn)頻率越來越高,但人們對(duì)其理解卻越來越少,直至人類失去對(duì)它們的控制"。
![]()
這種"遞歸自我改進(jìn)"一旦啟動(dòng),AI的發(fā)展速度將完全取決于計(jì)算資源,人類的監(jiān)管作用將大幅降低。在這種極端情境下,AI會(huì)不會(huì)理解人類的目標(biāo),但選擇以人類無法理解或無法接受的方式去實(shí)現(xiàn)它?沒人知道答案。
OpenAI確實(shí)已跨過了"可靠性閾值",但OpenAI后訓(xùn)練團(tuán)隊(duì)負(fù)責(zé)人也坦言,進(jìn)入真實(shí)世界后,系統(tǒng)的可靠性提升變得極為困難。一個(gè)粗暴的模型是:AI智能體每兩分鐘就有一定概率犯錯(cuò),運(yùn)行時(shí)間越長,最終答案翻車的概率就越高。這個(gè)看似簡單的"錯(cuò)誤率控制"問題,恰恰是AI從"工具"走向"自主決策體"道路上最難攻克的山頭。
從經(jīng)濟(jì)學(xué)的視角看,更大的不確定性在于價(jià)值觀對(duì)齊的問題。如果人類勞動(dòng)力不再具有競爭力,一個(gè)由AI主導(dǎo)的經(jīng)濟(jì)體系將會(huì)是什么樣,很難預(yù)測。Anthropic呼吁為"社會(huì)結(jié)構(gòu)和對(duì)齊研究能夠跟上技術(shù)進(jìn)步的步伐"留出時(shí)間,正是基于這樣的深層憂慮。
"對(duì)齊問題疊加惡化,最終導(dǎo)致失控",是一個(gè)懸在所有AI實(shí)驗(yàn)室頭上的達(dá)摩克利斯之劍。
四、真心還是營銷?時(shí)機(jī)引發(fā)質(zhì)疑
然而,事情的復(fù)雜性在于:Anthropic發(fā)出這一呼吁的時(shí)機(jī),很難不讓人多想。
就在呼吁發(fā)出的前兩天(5月28日),Anthropic剛宣布完成650億美元融資,估值高達(dá)9650億美元,超越OpenAI的7300億美元,成為全球估值最高的私營AI公司。緊接著在6月1日,公司秘密向美國證券交易委員會(huì)遞交了IPO文件,啟動(dòng)上市流程。公司年化運(yùn)營收入從2025年底的90億美元暴漲至470億美元。
當(dāng)一家公司在IPO前夕呼吁"整個(gè)行業(yè)放慢腳步","考前呼吁大家暫停復(fù)習(xí)一周"的調(diào)侃,并非全無道理。
信息安全研究員關(guān)傲男的評(píng)判也相當(dāng)犀利:這篇文章"并非嚴(yán)格的技術(shù)報(bào)告,更傾向于是Anthropic Institute部門的公關(guān)游說與政策倡導(dǎo)目的的宣傳文章"。其主要作者是政策高管與安全戰(zhàn)略研究員,并非來自技術(shù)團(tuán)隊(duì)。
"這就好比一家造車新勢力,其超級(jí)工廠里的機(jī)械臂組裝汽車速度比過去快了10倍,完全替代流水線上的裝配工人已經(jīng)沒有任何問題,但這并不代表它就能獨(dú)立完成一款全新汽車的完整設(shè)計(jì)與研發(fā)。"關(guān)傲男舉例稱,如果車企宣稱"因?yàn)闄C(jī)械臂組裝得足夠快,所以馬上就能發(fā)明出下一代顛覆性車型",市場顯然不會(huì)買賬。
更尖銳的批評(píng)來自硅谷創(chuàng)投家、特朗普的非正式顧問戴維·薩克斯。他曾指責(zé)Anthropic的領(lǐng)導(dǎo)層推行"監(jiān)管俘獲議程",即借監(jiān)管之名打壓競爭對(duì)手,可能最終導(dǎo)致禁止所謂的開源模型。
但也有人為Anthropic辯護(hù)。沃頓商學(xué)院副教授Ethan Mollick在轉(zhuǎn)發(fā)時(shí)認(rèn)為,文章值得一讀,雖然其中有一些自省、一些營銷內(nèi)容,但也有很多Anthropic對(duì)AI未來可能性的真切看法。
畢竟,Anthropic由多位OpenAI前員工于2021年創(chuàng)立,長期把AI安全和AI對(duì)齊放在公司敘事核心位置,在這一點(diǎn)上確實(shí)保持了一貫性。
五、爭議之外:可行性困境
拋開動(dòng)機(jī)爭議,這項(xiàng)呼吁本身的可行性也面臨巨大挑戰(zhàn)。
文章本身也承認(rèn):"要在全球范圍內(nèi)強(qiáng)制暫停人工智能研發(fā)幾乎不可能,因?yàn)闊o論是經(jīng)濟(jì)利益還是國家安全,都有太多國家有動(dòng)力繼續(xù)推進(jìn)"。而且,"AI訓(xùn)練項(xiàng)目遠(yuǎn)比導(dǎo)彈發(fā)射井更容易隱匿。當(dāng)其他人暫停時(shí),誰繼續(xù)前進(jìn)誰就可能取得領(lǐng)先。"。
要達(dá)成一個(gè)類似"核武器協(xié)議"的全球性協(xié)議,需要多個(gè)國家、多個(gè)前沿實(shí)驗(yàn)室在統(tǒng)一規(guī)則下達(dá)成共識(shí),還要配套可互相核驗(yàn)的落地機(jī)制。這即使在AI監(jiān)管理念相對(duì)一致的西方陣營內(nèi)部,也堪稱不可能完成的任務(wù)。
AI行業(yè)對(duì)當(dāng)前模型距離RSI等基準(zhǔn)還有多遠(yuǎn),本身就存在巨大分歧。圖靈獎(jiǎng)得主、"深度學(xué)習(xí)三巨頭之一"楊立昆就認(rèn)為,基于大語言模型的系統(tǒng)永遠(yuǎn)無法實(shí)現(xiàn)與人類智商相媲美的飛躍,AI只是高效工具,智能水平僅相當(dāng)于貓。
六、技術(shù)與安全的天平
Anthropic的呼吁,無論動(dòng)機(jī)如何,都將一個(gè)根本性問題推到了聚光燈下:當(dāng)AI的自我進(jìn)化速度超過人類社會(huì)的適應(yīng)能力時(shí),我們?cè)撊绾螒?yīng)對(duì)?
一方面,AI的自我加速確實(shí)正在發(fā)生。Anthropic的內(nèi)部數(shù)據(jù)清晰地展示了這一趨勢。另一方面,也有人擔(dān)心,如果過早踩下技術(shù)"剎車",可能會(huì)讓某個(gè)只有AI才能找到的重大科學(xué)突破——比如癌癥的治愈、可控核聚變的實(shí)現(xiàn)——被無限期推遲。
但真正的難題在于,AI安全與對(duì)齊研究需要時(shí)間,其進(jìn)展速度遠(yuǎn)落后于模型能力的提升速度。Anthropic最終提到:"如果存在一個(gè)可驗(yàn)證的機(jī)制,能保證AI實(shí)驗(yàn)室確實(shí)都沒偷偷卷,我們?cè)敢鉁p速、甚至?xí)和?。
這個(gè)"如果",或許才是整篇文章最誠實(shí)的一句話。技術(shù)無法倒退,但監(jiān)管可以進(jìn)化。也許我們需要的,不是一個(gè)全球性的暫停按鈕,而是一個(gè)能跟上技術(shù)腳步的"全球監(jiān)管安全帶"——讓AI在自我加速的同時(shí),始終有一個(gè)人類可以掌控的方向盤。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.