![]()
不久前,美國AI企業Anthropic發布一篇題為《當AI構建自身》的重磅博文,用實打實的內部運營數據,戳破了行業一直以來的猜想:AI不再只是人類手里的工具,它們已經深度參與下一代人工智能的研發工作,AI造AI從科幻設想,落地成日常工作。
![]()
一邊是Claude在公司內部包攬超八成代碼編寫,研發效率成倍暴漲,技術迭代踩上加速飛輪;另一邊是手握頂尖技術的Anthropic,罕見向全球喊話,提議多國協同管控、必要時暫停前沿AI研發。一邊狂奔、一邊預警的矛盾現狀,正是當下全球AI行業最真實的縮影,遞歸自我改進的臨界點,正一步步向人類靠近。
![]()
一、從打雜到主力:Claude包攬八成代碼,程序員告別手寫日常
放在兩年前,AI幫忙補全幾行代碼、修改小范圍bug,還只是程序員提高效率的輔助手段,沒人想到短短一年多時間,AI能成為研發主力。數據顯示,2025年2月ClaudeCode正式上線之前,Anthropic內部由AI編寫并入代碼庫的內容僅占個位數,到2026年5月,這個數值飆升至80%。
工作模式的變化直接體現在工程師身上。2021至2024年,公司研發人員每日有效合入代碼量常年保持平穩;2025年AI開始自主運行調試代碼,產能曲線首次上揚;2026年模型可以獨立承接長線研發任務,曲線陡然暴漲,工程師人均產出達到2024年的8倍。不少在崗研發人員分享近況,自己已經連續五個月沒有手動敲過一行代碼,日常工作從編碼寫程序,變成梳理需求、驗收AI產出的成果。
當然Anthropic也客觀說明,8倍產能是從代碼行數統計得出,單純數字會高估實際價值,內部調研里,多數研究員客觀估算,搭載MythosPreview新版本后,個人綜合產出約是純人工時代的4倍。放眼全球同行,這種轉變早已不是個例:谷歌新上線代碼75%由Gemini生成,微軟內部三成源碼出自AI之手,國內多家頭部AI企業的自研項目,AI代碼占比也突破半數,程序員轉型代碼審核員成為行業大趨勢。
二、效率碾壓人類:修漏洞、優化實驗,AI用數小時干完人數年工作
不只是代碼量產速度領先,在解決復雜工程難題上,Claude的能力同樣實現跨越式成長。半年之內,開放性無標準答案的研發難題中,Claude解決成功率從26%攀升至76%,曾經需要人類工程師反復試錯的攻堅任務,如今AI獨立落地已成常態。
實戰案例最能直觀體現差距:一次集群故障導致上萬訓練任務崩潰,工程師只向Claude描述故障現象、開放集群權限,AI自主遍歷運行環境、定位隱蔽的參數標記,兩小時完成故障復現、漏洞修復,同等工作量人工最少需要兩三天。2026年4月的系統漏洞大掃除中,Claude一次性提交800余項代碼修復,直接把一類高頻API報錯概率壓低千倍,工程師事后核算,全部修復工作交由人工落地,需要耗費整整四年時間。
![]()
在模型訓練優化領域差距更加夸張:人類頂尖研究員耗費4到8小時,最多能把訓練效率提升4倍,而ClaudeMythosPreview優化同一段訓練代碼,直接實現52倍提速。除此之外,旗下Glasswing項目上線初期,就在全球各類軟硬件系統里篩出上萬處高危安全漏洞,行業防御的痛點從“找不到漏洞”變成“漏洞太多,補丁跟不上修復速度”。
![]()
![]()
目前業內用來衡量AI代碼質量有兩大標尺:代碼能否穩定運行、其他工程師能否看懂并二次迭代。第一條標準,Claude早已達標,人工中途叫停、修正AI任務的頻次持續走低;第二條雖仍有差距,但研發團隊預判,2026年內AI編寫代碼的綜合質量就能全面反超普通人類工程師。
三、僅剩最后一塊短板:“研究品味”,人類僅存的優勢岌岌可危
如今AI包攬了繁瑣的落地研發工作,從寫代碼、改bug、優化實驗到批量修復漏洞,重復性、試錯型的研發勞動已經被人工智能全盤接管,人類研究員僅剩一項獨有優勢:研究品味,也就是篩選研究方向、判斷課題價值、規避無效研發路徑的決策能力。
業內有一句通俗總結:天才是1%靈感加99%汗水,而當下99%的落地汗水,正在被AI快速自動化。縱觀AI發展史,真正顛覆性的架構靈感比如Transformer,數年才誕生一次,絕大多數技術迭代,都依靠反復試錯、修改缺陷、迭代優化落地,這套循環工作流恰好是Claude最擅長的領域。
在過往的技術突破里,人類曾篤定很多能力是AI無法掌握的,從理解冷笑話、模擬人類心理,到復雜邏輯解謎,這些曾經的人類專屬本領,接連被大模型逐個攻克。Anthropic團隊直言,研究品味大概率也只是AI暫時沒能吃透的技能,隨著遞歸自我改進持續落地,這項人類最后的壁壘,隨時可能被突破。
國內MiniMax、DeepSeek等廠商的自研模型同樣印證這個趨勢,M2.7大模型已經實現自主閉環迭代:自主分析實驗失敗原因、規劃修改方案、改動代碼、自測復盤,在部分研發環節自主完成半數工作量,自主迭代后模型性能提升三成,AI自主篩選課題的雛形已經出現。
四、三種未來推演:行業押注兩條路徑,60%概率迎來完全自我進化
結合當前技術進度,Anthropic對AI未來發展梳理出三種發展劇本,其中團隊最不看好發展停滯,更傾向后兩種演化方向。
第一種是增長觸頂、能力停滯。受限于芯片產能、電力供給、算力成本或是人類獨有的研究品味,AI自我改進的增長曲線抵達S型頂端,技術發展慢慢放緩。即便如此,現有AI帶來的行業變革也無法倒退,海量自動化工具已經滲透科研、制造、互聯網全產業鏈,世界回不到純人工研發時代,只是這套方案被業內判定概率最低,現階段所有AI能力曲線依舊保持上揚。
第二種是人機協同穩步加速,人類牢牢把控研發方向。AI負責全流程落地研發,人類掌舵頂層決策,小型AI團隊就能完成過去上萬人的研發體量,也是當下行業最有可能落地的未來。但高效背后暗藏隱患,這套技術既可以加速新藥研發、新材料突破,也能被用來搭建全民監控、精準信息操控系統,技術雙刃劍屬性愈發凸顯。
第三種是完整遞歸自我改進,AI脫離人類管控自主迭代下一代模型,也就是業內所說的RSI終極形態。公司聯合創始人JackClark公開預判,2028年底前實現完整自我進化的概率達到60%。一旦落地,AI迭代速度不再受人類研發效率約束,僅由可用算力決定,歷代模型的隱性缺陷會在自主迭代中持續放大,最終走向難以預判的未知方向,這也是全行業最大的安全隱患。
![]()
五、矛盾的選擇:技術狂奔卻呼吁剎車,全球協同管控成破局關鍵
整篇博文最富戲劇性的地方,就是Anthropic一邊用數據證明AI自我進化飛速提速,一邊鄭重向全球提出倡議:多國協同管控前沿AI,在必要時同步按下研發暫停鍵,留出時間完善社會制度與AI安全對齊研究。
![]()
但企業明確,盲目單方面停工毫無意義:倘若只有自律的企業放緩腳步,追逐利益的廠商會加速搶占技術優勢,最終造成行業惡性內卷。想要實現有效管控,需要全球頭部實驗室、主要經濟體同步制定可落地、可核驗的約束規則,類似核武器管控的全球協同協議,才可以平衡創新與安全。
這份呼吁發布后,行業觀點兩極分化:一部分科研人員認可風險預警,歐盟已經延后高風險AI法規落地時間、細化分層監管,美國也將頭部企業前沿模型納入政府前置安全審查;另一部分投資人與競品企業提出質疑,認為Anthropic借安全噱頭限制同行研發,為自身IPO鋪路炒作。
AI造AI的時代已經實實在在到來,遞歸自我改進的飛輪正在緩緩轉動,從80%自研代碼、數十倍研發提速,到不斷縮小的能力差距,每一組數據都是技術加速的印記。技術躍進能帶動生物醫藥、能源、高端制造全行業跨越式升級,卻也暗藏失控風險。
眼下人類正站在關鍵分界點,既不能因噎廢食停下創新腳步,也不能放任AI無約束野蠻生長,如何在技術突破和安全管控之間找到平衡點,是未來數年全球各國、各大科技企業需要共同解答的難題。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.