Anthropic 表示,AI 行業正邁向能夠自主構建未來幾代前沿模型的系統。
![]()
幾十年來,我們一直在電影和流行文化中看到這樣的情景;如今看來,科幻已不再是虛構。根據 Anthropic 發布的新研究,人工智能系統正開始幫助構建下一代 AI 模型。該公司表示,這一趨勢最終可能導致 AI 系統在極少人類干預的情況下自行設計和改進自己。
Anthropic 在其研究機構 Anthropic Institute 發布的一篇新博文中概述了這一警告。該公司稱,行業邁向“遞歸式自我改進”的速度可能比許多政府和機構預期的更快。
這一概念描述的是一種未來圖景:一個 AI 模型開發出自身的下一個版本。目前,研究人員仍在指導這一過程。但 Anthropic 表示,在公司內部,AI 已經在編程、調試和技術研究方面承擔了越來越大的份額。
AI 開發加速
Anthropic 援引內部數據,展示了 AI 工具如今對軟件工程工作的貢獻速度有多快。該公司稱,截至 2026 年 5 月,Claude 生成的代碼已占合并到 Anthropic 系統中代碼的 80% 以上。而在 2025 年初 Claude Code 推出之前,這個數字還停留在低個位數。
我們的內部數據顯示,Claude 正在加速 AI 開發——這可能是一條通往遞歸式自我改進,即 AI 自主構建更強大繼任者的路徑。
它的發展速度比我們想象的還要快,其影響值得更多關注。
— Anthropic (@AnthropicAI) 2026 年 6 月 4 日
該公司還表示,隨著這些變化,工程生產力也大幅提升。Anthropic 工程師現在每天合并的代碼量大約是 2024 年的八倍。
Anthropic 聯合創始人兼政策主管 Jack Clark 表示,公司希望立法者和機構了解接下來可能發生的情況。“我們一直發現,最好的做法就是讓這個概念社會化,讓大家對即將到來的事情有所認識,”Clark 在一份新聞稿中說道。
Clark 補充說,AI 的進步似乎正在加速,而非放緩。他稱,這一轉變可能推動醫學、科學和其他技術領域取得重大進展。
基準測試快速進步
Anthropic 還重點介紹了跟蹤 AI 在軟件工程和科研任務中表現的公開基準測試。
該公司表示,AI 系統現在能在更長時間內、無需人工干預的情況下完成日益復雜的任務。Anthropic 聲稱,模型能夠可靠處理的任務時長大約每四個月翻一番。
據該公司稱,2024 年初,Claude Opus 3 完成的任務僅持續幾分鐘。一年后,Claude Sonnet 3.7 已能處理約需 90 分鐘的工作。Anthropic 表示,后來的 Claude Opus 4.6 已能處理長達 12 小時的任務。
該公司還引用了 SWE-bench 基準,這是一項測試 AI 能否修復開源項目中真實代碼問題的軟件工程基準。Anthropic 稱,前沿模型在該基準上的得分在兩年內從較低水平提升到了接近飽和。
另一項基準 CORE-Bench,衡量 AI 能否復現已發表的科學研究成果。Anthropic 稱,AI 系統從 2024 年大約 20% 的復現成功率,提高到約 15 個月后近乎完美的表現。
風險與監督
Anthropic 強調,當前系統與完全自主的 AI 開發之間仍存在巨大差距。該公司表示,人類仍繼續定義目標、評判結果,并決定哪些研究方向最為重要。
盡管如此,該公司警告稱,如果監督工具無法跟上步伐,更強大的自主系統可能帶來新的風險。
“作為組織,并最終可能作為整個社會,我們需要找到驗證和核實”AI 生成工作的工具,Clark 說。他補充說,未來的系統必須始終與人類目標和公共利益保持一致。
Anthropic 計劃在未來幾個月與美國立法者討論這一問題。該公司表示,政府應做好準備,應對 AI 系統最終可能在幾乎沒有人類直接參與的情況下,幫助創造出更強大繼任者的可能性。
如果朋友們喜歡,敬請關注“知新了了”!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.