![]()
手機屏幕上看到的 Anthropic 和《復仇者聯盟2:奧創紀元》仍然蓋蒂圖片社和漫威娛樂
來源:https://interestingengineering.com/ai-robotics/anthropic-self-improvement-ai-models
幾十年來,我們在電影和流行文化中已經看到了這種趨勢;科幻似乎不再是虛構。根據 Anthropic 最新發布的研究,人工智能系統正開始幫助構建下一代人工智能模型。該公司表示,這一趨勢最終可能使人工智能系統能夠在極少人工干預的情況下進行自我設計和改進。
人類學研究所(Anthropic Institute)在其最新博客文章中發出警告。該公司表示,該行業可能會比許多政府和機構預期的更快地邁向“遞歸式自我改進”。
這一概念描繪了一個未來:一個人工智能模型能夠自主開發出自身的下一個版本。目前,研究人員仍然在指導這一過程。然而,Anthropic公司表示,人工智能已經在公司內部承擔了越來越多的編碼、調試和技術研究工作。
更快的AI開發
我們的內部數據顯示,Claude正在加速人工智能的發展——這可能是一條通往遞歸式自我改進,或者說人工智能自主構建更強大后繼者的途徑。
這一進程比我們預想的要快得多,其影響值得更多關注。https ://t.co/OVVPJO7VQx
— Anthropic (@AnthropicAI) 2026年6月4日
Anthropic公司援引內部數據顯示,人工智能工具如今對軟件工程工作的貢獻速度驚人。該公司表示,截至2026年5月,Claude生成的代碼占Anthropic系統合并代碼總量的80%以上。而在2025年初Claude Code上線之前,這一比例僅為個位數。
該公司還表示,隨著這些變革,工程效率也大幅提升。Anthropico 的工程師現在每天合并的代碼量大約是 2024 年的八倍。
人類組織聯合創始人兼政策主管杰克·克拉克表示,該公司希望立法者和機構了解接下來可能發生的情況。“我們一直認為,最好的做法是普及這一概念,讓人們了解即將發生的事情,”克拉克在一份聲明中說。
克拉克補充說,人工智能的發展似乎正在加速而非放緩。他表示,這種轉變可能會在醫學、科學和其他技術領域帶來重大進步。
基準指數快速變化
Anthropic 還重點介紹了跟蹤人工智能在軟件工程和科學研究任務中表現的公開基準。
該公司表示,人工智能系統現在無需人工干預即可在更長的時間內完成日益復雜的任務。Anthropic 聲稱,模型能夠可靠處理的任務時長大約每四個月翻一番。
據該公司稱,Claude Opus 3 在 2024 年初就能完成耗時僅幾分鐘的編碼任務。一年后,Claude Sonnet 3.7 可以處理耗時約 90 分鐘的工作。Anthropic 表示,Claude Opus 4.6 后來能夠處理耗時長達 12 小時的任務。
該公司還提到了SWE-bench,這是一個軟件工程基準測試,用于測試人工智能能否修復開源項目中實際存在的編碼問題。Anthropic表示,其前沿模型在兩年內就從該基準測試中的低分躍升至接近飽和。
另一項基準測試 CORE-Bench 用于衡量人工智能能否復現已發表的科學研究。Anthropic 公司表示,人工智能系統復現結果的準確率預計在 2024 年約為 20%,而大約 15 個月后,其性能將接近完美。
風險與監管
Anthropic強調,目前的系統與完全自主的人工智能發展之間仍然存在重大差距。該公司表示,人類仍然在定義目標、評判結果,并決定哪些研究方向最為重要。
不過,該公司警告稱,如果監管工具跟不上,更強大的自主系統可能會帶來新的風險。
克拉克表示:“作為組織,最終可能作為社會,我們需要找到驗證和確認人工智能生成成果的工具。”他還補充說,未來的系統必須始終與人類目標和公共利益保持一致。
人為因素公司計劃在未來幾個月與美國立法者討論這一問題。該公司表示,各國政府應該做好準備,應對人工智能系統最終可能在幾乎無需人類直接參與的情況下,幫助創造出更強大的繼任者的可能性。
閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.