![]()
來源:新智元
【導讀】AI造AI,已經發生了!Anthropic重磅長文揭秘,超80%代碼由Claude編寫,工程師人均產出暴增8倍,Mythos研究提速52倍。看著如此恐怖的進化速度,Anthropic卻發出呼吁:必要時,請暫停AI研發。
AI造AI的時代,已然降臨!
![]()
就在剛剛,Anthropic扔出了一篇重磅長文:When AI builds itself(當AI開始造AI)。
打開這篇博客,滿屏只透出一個詞:加速!
![]()
這一次,他們用最硬核的真實數據,把AI「遞歸自我改進」(RSI)徹底砸到了臺面上——
在Anthropic內部,超80%的代碼,全由Claude編寫;
工程師人均代碼產出較2024年暴漲8倍,許多研究員已經5個月,沒有手寫過一行代碼;
最開放的工程難題上,Claude成功率半年從26%飆到76%;
優化訓練代碼,人類4-8小時做到4倍加速,Claude Mythos Preview直接干到52倍。
![]()
![]()
「遞歸自我改進」的奇點尚未徹底降臨,但它逼近的速度,恐怕已超出全球所有頂尖實驗室的準備。
然而,最具戲劇性的一幕出現了:
就在Anthropic不斷鋪陳RSI,將以何等驚人的速度到來時,卻突然發出嚴肅呼吁——
必要時,一起按下前沿AI的「暫停鍵」。
![]()
一時間,這篇博文全網刷屏,許多人瘋狂安利:墻裂建議每個人都讀一讀!
![]()
![]()
80%的代碼,出自Claude之手
整篇文章,Anthropic都在向外界證實一個令人膽寒的現實——
Claude正在瘋狂按下AI進化的「加速鍵」。
他們正在蹚出一條通向「遞歸自我改進」的現實路徑:讓AI親手打造出比自己更強大的下一代系統。
![]()
而這一切,比所有人預想的還要快。
截至2026年5月,Anthropic合入代碼庫的代碼中,超80%由Claude撰寫。
而在2025年2月Claude Code發布之前,這個數字還停留在「個位數」。
一年多時間,從「打打下手」到「包攬八成」。
![]()
Claude進化時間線
產能端的變化更直觀。2021到2024年,Anthropic工程師人均每天合入的代碼量基本是一條水平線。
2025年,Claude開始自己運行代碼,曲線第一次上揚;
2026年,模型開始在更長時間跨度上自主工作,曲線第二次陡升。
到2026年第二季度,典型工程師的日代碼合入量,已經是2024年的8倍。
![]()
一位Anthropic員工的自述更扎心:
大約一年前我開始全力「Claude化」。這是一場瘋狂的冒險——到現在,我已經有約5個月沒自己寫過任何代碼了。
![]()
不過,Anthropic也很誠實地補了一刀:
代碼行數衡量數量多過質量,8倍肯定高估了真實生產力。
但2026年3月,對130名研究人員的內部調查顯示,中位數受訪者估計,自己的產出是沒有AI時的4倍左右。
![]()
不光寫得多,寫得還比人好
量大管飽,那Claude輸出的質量如何?
Anthropic給出了兩個判斷標準:代碼能不能跑,以及別的工程師能不能看懂、能不能在上面繼續蓋樓。
第一條,證據已經非常硬核。
過去一年,研究員糾正、打斷、中途接管Claude任務的比率持續下降——
哪怕是在最復雜、最開放的任務上。
在最開放的任務難度檔位上,Claude的成功率在2026年5月達到了76%,6個月暴漲50個百分點。
![]()
舉個真實案例:一次例行升級,突然讓數萬個訓練任務集體崩潰。
工程師只丟給Claude一段文字描述和集群權限,Claude在運行中的任務里逐一排查環境變量,揪出了那個極其隱蔽的調試標志,復現、驗證、修復
兩小時,Claude干完了正常需要兩三天的活。
![]()
更夸張的是2026年4月的一次「大掃除」,Claude一口氣提交了800多個修復,把一類API錯誤壓低了1000倍。
負責監督的工程師估算:這些活兒如果讓人來干,得花4年。
第二條標準,差距還在,但正在以肉眼可見的速度消失。Anthropic內部的共識是:
我們預計Claude編寫的代碼,將在今年內全面超越人類。
![]()
Claude寫代碼,Claude審代碼,這個閉環已經轉起來了。
一年提速52倍,Claude暴擊人類
如果說寫代碼只是工程層面,那真正讓人脊背發涼的,是研究層面的進展。
Anthropic每次發新模型,都會做同一個測試:
給Claude一段訓練小型AI模型的代碼,要求它在保證正確性的前提下,跑得越快越好。
這本質上,就是一個微縮版的AI研究實驗循環——改代碼、跑、計時、再改。
看看這份極具壓迫感的「成績單」:
2025年5月:Claude Opus 4約3倍加速
2026年4月:Claude Mythos Preview約52倍加速
而一位熟練的人類研究員,需要4到8小時,才能做到4倍。
一年時間,Claude從「超級有用」到「超人水平」。在這種目標明確的實驗優化環節,人類已經被甩出了一個數量級。
![]()
更重磅的是,Claude開始展現「研究判斷力」的苗頭。
Anthropic做了一個極其刁鉆的實驗:他們翻出真實研究session里人類研究員「走彎路」的129個時刻,把彎路之前的全部上下文喂給Claude,問它:下一步該怎么走?
再讓另一個能看到完整結局的Claude當裁判。
結果,2025年11月的Opus 4.5,有51%的概率給出比人類更優的下一步;
2026年4月的Mythos Preview,這個數字漲到了64%。
還有那個著名的「端到端」實驗:Claude智能體被丟進一個開放的AI安全難題,自己提假設、自己設計實驗、自己和并行智能體交換發現。
兩位人類研究員花一周,只追回了23%的性能差距;
Claude智能體軍團用800個累計小時、約1.8萬美元算力,追回了97%。
![]()
人類唯一的實質性貢獻,只剩下:選了這個題。
AI留給人類「1%靈感」
所剩時間不多了
把以上所有證據拼在一起,一幅圖景浮現出來:
在AI開發的每一個環節,人類的角色都在收窄。
寫代碼?Claude包了。跑實驗?Claude比你快一個數量級。判斷下一步?Claude正在追上來。
![]()
Anthropic的判斷是:一旦人類和AI的代碼質量達到平價,人類將徹底停止寫代碼,只負責審查。
但問題來了,如果人類審查的速度跟不上Claude生成的速度,人類自己就會變成AI發展的瓶頸。
這正是計算機科學里經典的「阿姆達爾定律」(Amdahl’s law)——
整體速度,永遠被那個沒提速的環節卡住。
![]()
Anthropic已經撞上了第一堵墻:代碼審查排隊。
第二堵墻也來了:員工和強大模型合作之后,新想法、新工具、新模擬的產出量爆炸,多到公司根本沒有能力全部消化。
目前,人類僅存的比較優勢,叫做「研究品味」——
判斷哪些問題值得做、哪些結果可信、哪條路是死胡同。
但Anthropic毫不留情地補了一刀,愛迪生說天才是1%的靈感加99%的汗水,而我們看到,汗水正在被全面自動化。
文章里有一段非常清醒的論述:AI的進步很少靠「靈光一現」。
Transformer這種范式級靈感,幾年才出一次;
之間的絕大多數進步,靠的都是「放大、看哪壞了、修好、再試」。這恰恰是Claude最擅長的工作流。
至于「研究品味」?
Anthropic的原話是,它可能只是又一個AI暫時不會、然后突然就會了的能力。解釋笑話、心智理論、語言謎題——哪一個不是這么被攻克的?
![]()
三種未來
Anthropic押注最后兩個
那接下來會發生什么?Anthropic給出了三種劇本。
劇本一:趨勢停滯,S曲線見頂。
也許「研究品味」就是堆算力堆不出來的;也許瓶頸在芯片、電網和供應鏈。
但即便模型能力今天就凍結,世界也回不去了——
Project Glasswing的Mythos Preview,僅在最初幾周就在全球關鍵系統中,找出了超過10000個高危和嚴重級漏洞,多到網絡防御的瓶頸從「找漏洞」變成了「來不及打補丁」。
不過Anthropic自己都說:這是三種劇本里他們最不相信的一種。
因為到目前為止,每一條能測量的能力曲線,都沒有彎。
![]()
劇本二:復合加速持續,人類掌舵,
AI研發大幅自動化,人類繼續掌舵方向。100人的公司干出10萬人組織的活兒。
這是Anthropic認為最可能的走向——
但效率的另一面,是整套能力同樣可以服務于全民監控和千人千面的操縱機器。
劇本三:完全的遞歸自我改進。
AI自己設計、訓練、迭代自己的繼任者。AI進步的速度只取決于算力供給,人類退居驗證和監督。
Anthropic罕見地承認:對這個世界,「我們沒有好的直覺」——
今天模型里那些罕見的失準行為,可能在一代代自我構建中復合放大,越來越頻繁,越來越難以理解,直到失控。
上個月在倫敦的演講,聯創Jack Clark給出過一個更具體的數字:
2028年底前,出現遞歸自我改進的概率為60% 。
警告全球:必要時,暫停AI
于是,就有了這篇博客,最戲劇性的部分。Anthropic公開寫道:
我們相信,讓世界擁有「減速或暫停前沿AI開發」的選項,是一件好事—— 這能讓社會結構和對齊研究跟上技術的腳步。
![]()
注意,他們沒有天真地喊「都停下」。
Anthropic說得很清楚:如果只有謹慎者放慢腳步,等于把領先優勢拱手送給最不謹慎的人。
所以真正需要的,是多國、多個前沿實驗室、在同樣條件下同時停,且彼此可驗證。
![]()
當AI開始造AI,正叩開ASI的大門
人類通往超級智能(ASI)的路徑上,一直橫著一道理論上的「最后關卡」:智能爆炸的臨界點。
當AI改進AI的速度,超過人類改進AI的速度,飛輪就會脫離人類的手,開始自轉,且越轉越快。
今天,全球估值最高的AI公司之一,拿著自家代碼庫的提交記錄告訴你:
跨越臨界的倒計時,已經悄然開啟。
![]()
80%的代碼、8倍的產能、52倍的實驗加速、64%的判斷勝率——每一個數字,都是飛輪加速的一聲咔噠。
剩下的,只有最后一格:研究品味。
一旦這格被點亮,AI研發的速度將只由算力決定。從AGI到ASI的距離,可能短到以「模型代際」來計量。
到那時,受益的將遠超AI本身——
藥物研發、材料科學、能源、機器人,每一個領域,都會被這臺自我加速的智能引擎重新發動。
參考資料:
https://x.com/AnthropicAI/status/2062568862479208923
https://www.anthropic.com/institute/recursive-self-improvement
https://www.wsj.com/tech/ai/anthropic-urges-global-pause-in-ai-development-flags-self-improvement-risk-99cefb73?mod=tech_lead_story
為偉大思想而生!
AI+時代,互聯網思想(wanging0123),
第一必讀自媒體
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.