6月5日,Anthropic發表了一篇警示文章,《When AI buildes itself》,當 AI 開始建造自己,不禁要思考,我們人類角色將如何改變?
在 AI 發展的歷史中,人類長期主導著每一個開發環節。但如今,在 Anthropic,我們正將越來越多的AI開發工作委托給AI系統自身,這極大加速了我們的工作進展。
![]()
圖源:Anthropic
漢化:MarsKr
如果這一趨勢走得足夠遠,再配合充足的算力,最終可能誕生一個完全自主設計并開發自身繼任者的AI系統,這就是遞歸自我改進(Recursive Self-Improvement)。
我們尚未完全抵達這一步,且它并非必然發生。但Anthropic Institute的最新報告顯示:這一趨勢可能比大多數機構預想的來得更早。
AI已在顯著加速AI自身的開發。一個最直觀的例子是:如今Anthropic工程師平均每個季度輸出的代碼量,是2021-2025年期間的8倍。
這些趨勢意味著AI能力將在未來幾年大幅躍升。它可能帶來科學、醫療等領域的巨大福祉,但也可能大幅增加人類失去對AI控制的風險。當系統能自主構建后繼者時,安全、監控和行為引導將變得至關重要。
01
—外部世界的證據:AI能力加速提升
AI 模型能可靠獨立完成的任務長度,正在每4個月翻一番(此前是每 7 個月)。
2024年3月:Claude Opus 3 可完成人類約 4 分鐘的任務;
2025年:Claude Sonnet 3.7 可處理約 1.5 小時的任務;
2026年:Claude Opus 4.6 已能應對 12 小時的任務。
![]()
圖源:Anthropic
漢化:MarsKr
若趨勢延續,今年內 AI 就可能處理需人類數天完成的任務;2027年,甚至可能達到數周量級。
在基準測試上也呈現飽和趨勢:
SWE-bench(真實軟件工程):兩年內從個位數得分到接近飽和;CORE-Bench(科研復現):15 個月內從 20% 成功率到接近飽和;METR 測試顯示,Claude Mythos Preview 已能連續工作至少 16 小時。
02
—Anthropic內部證據:AI已深度參與開發
構建前沿模型主要分為工程(寫代碼、搭建基礎設施、訓練模型)和研究(設計實驗、解讀結果、決定下一步)兩大類。
在工程領域:Claude能接手不完全明確的問題,自主找出解決方案。人類只需提供目標,無需提供具體方法。
在研究領域:Claude已能在執行明確實驗時匹配甚至超越熟練人類,但在大方向判斷和目標選擇上,仍存在明顯差距。這正是當前AI與“自主設計繼任者”之間的關鍵鴻溝。
代碼產出爆炸式增長:
截至2026年5月,Anthropic合并到主代碼庫的代碼中, 超過80%由Claude撰寫(2025年2月Claude Code推出前,這一比例僅為個位數)。
2025年開始,工程師每天合并的代碼行數顯著上升;2026年,隨著模型自主工作時間延長,斜率進一步陡峭。
2026年第二季度,典型工程師的日代碼合并量是2024年的 8倍。
![]()
圖源:Anthropic
漢化:MarsKr
盡管代碼行數不是完美指標(更重視質量而非數量),但這清晰反映了生產力加速。員工主觀調查也顯示:2026年3月,中位員工認為使用Mythos Preview后,產出提升約4倍。
Claude不僅寫得多,還寫得越來越好:
工程師干預、糾正Claude的比例持續下降。
在最開放的任務上,2026年5月成功率達 76%(半年提升50個百分點)。
示例:一次例行升級導致數萬訓練任務崩潰,Claude僅用約2小時就定位問題并修復(人類通常需2-3天)。
代碼質量方面:2025年底Claude代碼略遜于人類,如今已接近持平,預計年內將超越。Anthropic現在使用Claude自動審查代碼變更,甚至能捕捉到頂尖工程師之前遺漏的部分bug。
研究能力同樣突飛猛進:
在優化明確實驗目標時,Claude從2025年的~3x加速提升到2026年的~52x(人類熟練研究員需4-8小時達4x)。
2026年4月,Claude驅動的代理完成了首個端到端開放研究項目:在AI安全問題上,自主提出假設、測試、迭代,恢復了97%的性能差距(人類兩名研究員一周約23%)。
在開放調查任務中,模型判斷“下一步最佳行動”的能力也在提升。
一位Anthropic員工感慨:“我大約一年前開始深度依賴Claude,現在已經5個月沒親自寫代碼了。”
03
—未來工作形態:人類角色正在收窄
證據顯示,人類在AI開發各環節中的角色正在縮小:
代碼質量持平后,人類可能徹底停止寫代碼,轉向審查。但審查速度若跟不上生成速度,將成為新瓶頸。
實驗執行自動化后,瓶頸轉向“哪些實驗值得做”。
人類當前的比較優勢在于研究品位與判斷力:選擇重要問題、判斷結果可信度、識別死胡同等。
但即使人類僅負責“方向設定”,AI也能讓每個人“駕馭”遠超以往的工作量,從而實現復合加速。
04
—三種可能的未來
趨勢放緩,但當前能力廣泛擴散
指數曲線可能轉為S曲線,規模收益遞減。新架構或供應鏈(能源、芯片)成為限制。即使能力凍結在當前水平,世界也會巨變:100人公司可做1000人公司的事,網絡安全等領域的瓶頸已從“發現漏洞”轉向“快速修復”。
持續復合效率提升
AI開發高度自動化,人類負責方向與判斷。組織生產力大幅躍升,知識工作和政府服務將被重塑。但同時可能被用于監控、操縱等有害用途。瓶頸會轉移(Amdahl定律),如何快速識別并解決新瓶頸將成為關鍵能力。
完全遞歸自我改進
AI自主設計繼任者,進步速度由算力決定。人類轉向監督與驗證,“虛擬實驗室”主導研發。這一能力將快速轉移到其他科學領域。經濟和社會形態可能劇變,但許多現實瓶頸(如臨床試驗、治理節奏)仍由人類世界決定。
05
—我們該怎么辦?
如果能有效放緩前沿AI開發,為社會適應和對齊研究贏得時間,將是好事。但單方面放緩可能讓最不謹慎的行動者領先。
Anthropic認為,建立可驗證的全球協調機制至關重要。我們將開展研究并推動構建相關系統,以便在多國前沿實驗室達成一致時,能可靠驗證各方確實暫停或放緩開發。
![]()
圖源:Anthropic
漢化:MarsKr
未來幾個月,我們將組織政策制定者、研究者、公民社會和AI公司的對話,共同探討遞歸自我改進的含義及協調方案。歡迎更多外部聲音參與這場至關重要的審議。
AI的未來,不僅取決于技術,更取決于我們今天的選擇。
參考
https://www.anthropic.com/institute/recursive-self-improvement
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.