大家好,我是程序員魚皮。
昨天 Claude 背后的公司 Anthropic 在官網發了一篇重磅博客,同時在 Twitter 上也發了一條推文。
![]()
這條推文一發出來就炸了,已經有 800 多萬次瀏覽,核心信息就一句話:
我們的內部數據顯示,Claude 正在加速 AI 的開發進程,這可能是一條通往遞歸自我提升的路徑,也就是 AI 自主構建更強的下一代 AI。
緊接著,不少國內媒體用了類似「Anthropic 呼吁全員停止 AI 研究」的標題來報道,看著還怪嚇人的嘞,成功勾起了我的好奇心。
作為一個高頻使用 Claude 寫代碼的程序員,我花了一個多小時把這篇英文博客完整讀了一遍,發現了幾個很有價值的點。原文很長,我會幫大家梳理出最核心的信息,也聊聊我自己的判斷。
原文:https://www.anthropic.com/institute/recursive-self-improvement
這篇博客的標題是「When AI builds itself」(當 AI 構建自身),全文雖然很長,但核心就是在講一件事:
AI 正在加速 AI 自身的開發,而且這個加速還在變快。
Anthropic 把這種可能的趨勢稱為 RSI(Recursive Self-Improvement 遞歸自我提升)。簡單來說就是,AI 幫人類寫代碼,寫出來的代碼讓 AI 變強,更強的 AI 又寫出更好的代碼,如此循環往復。
![]()
但 Anthropic 說了,這件事目前還沒有真正發生,也不是必然會發生:
We are not there yet, and recursive self-improvement is not inevitable. But it could come sooner than most institutions are prepared for. 我們還沒有走到那一步,遞歸自我提升也并非必然。但它到來的速度,可能比大多數機構準備好的要快。
所以這篇博客想表達的是,Anthropic 用大量內部數據來說明 AI 參與 AI 開發的程度正在快速加深,然后呼吁全行業認真對待這件事。
至于國內媒體說的「呼吁停止 AI 研究」,我覺得很扯,原文的表述其實是有前提條件的:如果存在一個 可驗證的全球協調機制,能確保各家 AI 公司都沒有私下繼續加速研發,那 Anthropic 愿意減速甚至暫停。
這跟單方面宣布停工是兩碼事好吧?!
5 個最震撼的數據
Anthropic 的「AI 自主進化論」是怎么得來的呢?
正如他們所說,他們在博客里放了大量 內部數據,我挑幾個最有沖擊力的跟大家聊聊。
1、80% 以上的代碼由 Claude 編寫
截至 2026 年 5 月,Anthropic 代碼庫中合并的代碼里,超過 80% 由 Claude 編寫。
而在 2025 年 2 月 Claude Code 發布之前,這個比例還只是個位數。
一年多時間,AI 從偶爾幫忙寫幾行,變成了扛起絕大部分的編寫工作。
![]()
2、工程師代碼產出是 2024 年的 8 倍
2026 年第二季度,Anthropic 工程師每天合并的代碼量是 2024 年的 8 倍。
原因很簡單,他們的工程師并沒有突然變強,而是大部分代碼由 Claude 來寫了,工程師的角色變成了指揮和審核。
雖然 Anthropic 很謙虛地說:代碼行數不是一個完美的衡量指標,8 倍產出不等于 8 倍生產力。
但大的方向很明確了。
3、最難的開放式任務,成功率飛升 50%
Claude 在那種最開放、最模糊、連最終結果應該是什么樣都不確定的編程任務上,成功率從 2025 年底的 26% 漲到了 2026 年 5 月的 76%。
![]()
剛看到這個數據的時候我震驚了,真的是震驚,就有種感覺,好像 AI 已經可以很大程度上預測到我們編程任務需要做什么、解決什么問題了,甚至人類都不需要描述清楚。。。
![]()
舉個具體例子,博客里提到,有一次常規升級導致上萬個訓練任務崩潰,工程師只給了 Claude 一些日志信息和集群訪問權限。Claude 自己排查運行中的任務,逐項測試環境變量,最終發現是一個不起眼的調試標志在作怪,正是它觸發了崩潰。
整個過程大約兩個小時,換成人類工程師可能要花兩到三天。
4、代碼優化能力 Claude 可達 52 倍
Anthropic 每發布一個新模型,都會做同一個測試:給 Claude 一段訓練小型 AI 模型的代碼,讓它在保證正確性的前提下盡可能加速。
2025 年 5 月,Claude Opus 4 做到了 3 倍加速。2026 年 4 月,Claude Mythos Preview 做到了 52 倍。
作為對比,一個熟練的人類研究員需要 4 到 8 個小時才能做到 4 倍。
不到一年時間,這類任務上 Claude 已經遠遠甩開了人類。
![]()
5、AI 安全實驗,Claude 把差距縮小 97%
Anthropic 給 Claude 布置了一個開放式的 AI 安全研究課題:一個弱模型能不能可靠地監督一個強模型?
然后讓 Claude 自己提假設、設計實驗、跑數據、分析結果。
兩名人類研究員花了大約一周時間,把性能差距縮小了 23%。
而 Claude 消耗了累計約 800 小時的計算資源,成本約 1.8 萬美元,把差距縮小了 97%。
試問那兩名人類研究院的心理面積。。。
![]()
不過 Anthropic 也指出了這個實驗的局限:人類仍然定義了問題和評分標準,而且結果并沒有很好地遷移到更大規模的模型上。
但在給定邊界內,Claude 確實完成了所有的實驗設計。
三種未來
擺完這些數據,Anthropic 接著討論了未來可能怎么走,大家也可以想想,預測一下你覺得未來會怎么樣?
第一種,漲著漲著就停了。
現在看到的指數曲線其實是 S 曲線,到某個拐點就會放平。可能「研究判斷力」這種東西就是沒法靠堆算力解決,需要全新的架構突破。又或者瓶頸出在能源和芯片的物理供應鏈上。
第二種,AI 持續加速,但人類仍然掌舵。
Anthropic 認為這是當前最可能的走向。一家 100 人的公司,可能做出過去 1 萬人才做得完的事情,每個人都像是在指揮一組 AI Agent。但瓶頸不會消失,只是轉移到下一個環節。比如代碼寫得飛快了,結果代碼審查成了新的卡點。Anthropic 自己就遇到了這個問題。
We've also encountered this friction outside engineering. There has been an explosion of new ideas, initiatives, tools, and simulations—far more than we have the capacity to pursue. 我們在工程之外也遇到了這種摩擦。新的想法、新的工具、新的實驗爆炸式涌現,遠遠超出了我們能消化的容量。
第三種,AI 完全自我迭代,開始自己設計并訓練下一代。
如果真走到這一步,AI 的進步速度就主要取決于可用的算力了。人類會退到監督和驗證的位置。
Anthropic 對此的判斷是,如果真到了第三種情況,而對齊問題又沒有解決好,偏差會在 AI 自我迭代的過程中逐漸累積,最終可能完全失控。這也是他們呼吁全行業重視的核心原因。
![]()
這篇博客背后的動機
了解完博客的內容后,還有一個值得思考的問題:為什么 Anthropic 選擇在這個時間點發這篇博客?
我讓 AI 搜集了幾個背景,放在一起看,也許能琢磨出一點兒東西。。。
Anthropic 剛剛遞交了 IPO 文件,據《華爾街日報》報道,估值接近 1 萬億美元
OpenAI 此前也在官方博客中提到過 AI 遞歸自我提升的趨勢,行業對這個話題的關注度正在升溫
Anthropic 一直在強調自己是更安全、更負責的 AI 公司
我自己的判斷是,這篇文章里既有真實的安全考量,也有公關策略的成分。
在 IPO 前夕發這樣一篇文章,既強化了負責任的形象,也順手秀了一把自己內部的技術沉淀。
對程序員的影響
作為一名程序員,看完這篇博客,除了前面 AI 應對開放式任務的成功率大幅提升之外,其他的地方對我內心倒沒有造成什么太大的波瀾。因為我自己 99% 以上的代碼基本都用 AI 來寫了,我從 23 年開始就用 AI 編程到現在,親身經歷了 AI 強度的變化。
而且 AI 發展了,人類就沒有優勢了么?程序員就沒有自身的價值了么?
并非如此,Anthropic 自己在博客里也承認了:
An area of human comparative advantage, for now, is research taste and judgment, including choosing which problems matter, which results to trust, and when an approach is a dead end. 人類目前的比較優勢在于研究品味和判斷力,包括選擇哪些問題值得做、哪些結果可以信任、什么時候該放棄一條路。
執行層面的工作確實正在被 AI 接管,但方向判斷、需求理解、產品設計、技術選型這些事,目前還是得靠人來做。
AI 現在能做到的是「你告訴它做什么,它幫你執行得很好」,但「應該做什么」,它還很難替你決定。
這跟我之前分享過的觀點是一致的:AI 編程帶來的核心變化不是讓你寫代碼更快,而是讓你能做到以前做不到的事情。 以前一個人往往只能深度負責一個模塊,現在你有機會指揮 AI 同時推進好幾個方向。
所以我的建議是:
1)不用焦慮,但要保持學習
誰都不知道拐點什么時候來,持續跟進 AI 工具的發展、保持自己的技術判斷力,是當下最務實的做法。
2)把精力放在 AI 還做不好的事情上
需求分析、系統架構、用戶體驗這些需要理解真實世界的事,短期內沒那么容易被替代。
3)學會指揮 AI 做項目
你不需要親自寫每一行代碼了,但你得能判斷 AI 寫的代碼好不好、方向對不對、哪些坑要避開。這跟以前帶團隊其實是一回事,只不過現在你帶的是一群 AI Agent。
如果你想練的正是這種指揮 AI 做項目的能力,可以看看我免費開源的 ,從 0 開始帶你做出完整項目。
![]()
我是魚皮,持續分享 AI 編程干貨。覺得有用的話記得點贊、收藏、關注~
也歡迎在評論區聊聊:你覺得 AI 真的會實現遞歸自進化嗎?還是說又是一次周期性的炒作?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.