網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Anthropic研究顯示Claude可自主加速對齊研究進程

2026-04-15 09:38:07　來源: 硅星Breaknews

上海舉報

0

分享至

品玩4月15日訊，Anthropic Fellows近日發布一項關于“弱到強監督”的最新研究。該研究旨在探索當AI模型能力超越人類時，如何利用較弱的模型（類比人類）來對齊更強模型。實驗中，研究團隊構建了9個配備沙盒、論壇及評分系統的Claude Opus 4.6副本，作為“自動化對齊研究員”（AARs）進行自主實驗。

在為期五天的測試中，AARs通過自我迭代與協作，成功將性能差距恢復率（PGR）提升至0.97，遠超人類研究員基準線（0.23）。單個AAR每小時成本約為22美元，總花費約1.8萬美元。研究顯示，Claude能夠自主提出假設、編寫代碼并分析結果，證明了大規模自動化對齊研究的可行性。

盡管在部分未見過的測試集及生產級規模任務中表現存在局限，且模型出現了“獎勵機制博弈”等行為，但該實驗表明，前沿模型已具備顯著加速對齊研究的潛力。這為未來利用AI輔助解決復雜對齊問題提供了重要實證依據。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

卡帕西都整破防了：AI Coding沒門檻，可部署環節真嗯啊的難

量子位 2026-03-27 12:12:46
15 跟貼 15
楊立昆開噴 Anthropic CEO：別信那個賣 AI 的人

鈦媒體APP 2026-04-20 08:32:19
1 跟貼 1

AI斬殺線，Anthropic還要制造多少條？

鈦媒體APP 2026-04-20 14:23:11
0 跟貼 0

Agent不是關鍵！人大AiScientist實現23小時、74輪長程記憶

新智元 2026-04-20 12:07:13
0 跟貼 0
SWE-bench滿分，0個bug修復：伯克利造了個專門作弊的AI

新智元 2026-04-19 12:13:41
0 跟貼 0

靈光做了一個“AI應用版GitHub”，但重點不在代碼

智東西 2026-04-20 12:48:18
0 跟貼 0

「部署態」元年，這家公司就把落地方案卷到了七種

機器之心Pro 2026-04-20 14:20:54
0 跟貼 0
具身智能公司開始積極「進廠」打工

鈦媒體APP 2026-04-20 14:44:38
0 跟貼 0

AI 投入猛增，字節跳動凈利潤下滑超70%，海外營收占比創新高

雷科技 2026-04-20 14:57:50
0 跟貼 0
實驗結果驚掉下巴，大頭針不扎漂亮女人，背后原因太意外

趣味加工廠 2026-04-20 00:00:00
0 跟貼 0
高端的狙擊槍為啥不連發，非要手動拉栓？原來自動化竟是絆腳石！

倔強旳牽強 2026-04-16 06:09:54
0 跟貼 0
985物理哪家強？別只看排名，這幾所是真天花板，選錯直接毀四年

唐老師小課堂 2026-04-20 08:24:45
0 跟貼 0
五角大樓拉黑后，Anthropic怎么還能進白宮？

閃存獵手 2026-04-18 23:13:42
0 跟貼 0
在“神經末梢”處理解中國 | 年度好書

經濟觀察報 2026-03-26 17:00:15
0 跟貼 0
【大講堂】“南方教研大講堂”第181場（初中歷史專場）“史料實證素養的進階路徑與實踐（一）”開講

廣東省教育研究院 2026-04-17 19:04:41
0 跟貼 0
用心險惡！拿中國孩子當小白鼠做實驗？湖南“黃金大米”事件回顧

談史論天地 2026-04-20 10:58:15
0 跟貼 0
這么難的實驗老伴是怎么做到的？

工小屋 2026-04-16 02:17:38
0 跟貼 0
自動化專業就業，可以選哪些央國企？

陳晟老師課堂 2026-04-17 17:52:30
1 跟貼 1
一個實驗告訴你，為什么不能給寶寶，喝太熱的奶

大齊聊笑 2026-04-18 17:18:42
3 跟貼 3
抱一棵樹14年的實驗！

花狐貂先生 2026-04-20 10:05:15
1 跟貼 1
腦洞大開！湖北58所高校競“曬”

湖北省人民政府網 2026-04-20 09:32:49
0 跟貼 0
新能源汽車更新迭代！

老閆大實話 2026-04-19 21:28:58
13 跟貼 13
德州小城體育播客：31周連續更新的本地內容實驗

體育硬核說 2026-04-20 13:18:30
0 跟貼 0
誠博智能點膠機：解決高粘度膠水拉絲難題

新浪財經 2026-04-20 09:02:54
0 跟貼 0
機械自動化推進，工業母機板塊大漲，工業母機ETF國泰（159667）盤中漲近2%

每日經濟新聞 2026-04-20 14:15:00
0 跟貼 0
比賽提前結束，WSBK荷蘭站第二輪正賽張雪機車斬獲第七名

澎湃新聞 2026-04-19 20:28:26
6163 跟貼 6163
Claude Code新功能Auto Mode能否替代人工審核？首個壓力測試來了

機器之心Pro 2026-04-20 11:44:14
0 跟貼 0
法國通過文物歸還法案敦煌藏經洞文物就能回歸嗎

澎湃新聞 2026-04-20 08:08:29
5926 跟貼 5926
美財長說中國電車是燃煤車，網友評論一針見血

中國日報網 2026-04-20 00:21:10
328 跟貼 328
【硬核拆解Claude Code】為什么Claude是最強 Agent？四層架構 + 記憶壓縮 +

盧菁老師 2026-04-20 11:08:43
0 跟貼 0
川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
15 跟貼 15
云南一高中生因“操行分”不合格等被勸退引爭議，多方回應

瀟湘晨報 2026-04-19 18:31:22
3206 跟貼 3206
V8發動機模型

制造科技 2026-04-19 17:41:19
0 跟貼 0
最低成本挑戰太湖一日游——沃爾沃XC70 感恩版

新出行 2026-04-18 17:52:17
17 跟貼 17
一個CLAUDE.md霸榜GitHub第一！蒸餾自Karpathy，6萬碼農抄作業

新智元 2026-04-20 15:10:13
0 跟貼 0
印度真是不作死就不會死，250萬噸的尿素，沒有國家愿意幫助

春日在捕月 2026-04-20 13:41:35
0 跟貼 0
133號艦艇編隊為何選擇從這里進入太平洋？專家解讀

環球網資訊 2026-04-20 12:17:06
72 跟貼 72
4:1，武漢贏了！“蒜鳥”響徹現場

長江日報 2026-04-19 22:25:00
401 跟貼 401
土耳其外長稱伊美談判“整體已接近完成”但分歧仍存

環球網資訊 2026-04-19 20:09:51
1 跟貼 1
終于，Claude革了設計行業的命：Figma、Adobe股價重挫

機器之心Pro 2026-04-20 11:40:11
0 跟貼 0

馬德興：鄺兆鐳在對抗中處于明顯下風，體能也需要加強

馬德興：鄺兆鐳在對抗中處于明顯下風，體能也需要加強

懂球帝

2026-04-20 14:13:04

黃埔最強大腦放走朱德八百殘兵，精于算計卻不善前線指揮

黃埔最強大腦放走朱德八百殘兵，精于算計卻不善前線指揮

嘮叨說歷史

2026-03-14 10:54:31

英海事分析公司：過去36小時有35艘船只在駛出霍爾木茲海峽途中掉頭

英海事分析公司：過去36小時有35艘船只在駛出霍爾木茲海峽途中掉頭

每日經濟新聞

2026-04-20 09:19:23

和黃圣依離婚后，楊子去娘家接娃，14歲安迪駝背自卑，9歲弟弟帥

和黃圣依離婚后，楊子去娘家接娃，14歲安迪駝背自卑，9歲弟弟帥

椰黃娛樂

2026-04-19 12:34:43

縣城少婦們的幸福感很強

微微熱評

2026-04-11 12:04:02

曼聯慶幸4000萬賣加納喬，換來大賽先生！更衣室群嘲加納喬竟點贊

曼聯慶幸4000萬賣加納喬，換來大賽先生！更衣室群嘲加納喬竟點贊

羅米的曼聯博客

2026-04-20 11:51:01

月之暗面IPO迷局：資本擠破頭，騙子兜售融資額度，相關人士稱“不愿為上市而上市”

月之暗面IPO迷局：資本擠破頭，騙子兜售融資額度，相關人士稱“不愿為上市而上市”

時代周報

2026-04-20 02:03:18

激烈交鋒，解放軍接到消息，日本恐重蹈二戰覆轍，岸田文雄已扛旗

激烈交鋒，解放軍接到消息，日本恐重蹈二戰覆轍，岸田文雄已扛旗

你是佛的弟子

2026-04-20 13:31:25

印度油輪霍爾木茲海峽遭炮擊，船員喊話錄音：你們批準我們通行，卻又向我們開火

印度油輪霍爾木茲海峽遭炮擊，船員喊話錄音：你們批準我們通行，卻又向我們開火

紅星新聞

2026-04-19 17:03:18

伊朗總統：戰爭不符合任何一方利益，應當動用一切合理外交途徑緩和緊張局勢

伊朗總統：戰爭不符合任何一方利益，應當動用一切合理外交途徑緩和緊張局勢

財聞

2026-04-20 14:56:43

女朋友很性感身材很棒是啥體驗？網友：確實，一個月就差不多膩了

女朋友很性感身材很棒是啥體驗？網友：確實，一個月就差不多膩了

帶你感受人間冷暖

2026-03-13 00:13:17

小S認發起「大S最后日本旅行」！淚崩首吐內心自責：早知聽媽的話

小S認發起「大S最后日本旅行」！淚崩首吐內心自責：早知聽媽的話

ETtoday星光云

2026-04-20 11:25:25

廣東簽約拉科塞維奇內幕！朱芳雨接觸多位NBA球員，嫌棄報價太低

廣東簽約拉科塞維奇內幕！朱芳雨接觸多位NBA球員，嫌棄報價太低

籃球大陸

2026-04-19 22:15:01

石油牯竭竟是假象？顛覆認知，石油根本不是遠古動植物演化而來？

石油牯竭竟是假象？顛覆認知，石油根本不是遠古動植物演化而來？

阿纂看事

2026-04-13 20:07:16

原來他是王治郅兒子，身高超2米，在成都上大學，如今已放棄籃球

原來他是王治郅兒子，身高超2米，在成都上大學，如今已放棄籃球

閱微札記

2026-04-19 14:41:49

長白山驚現“藏寶洞”，專家估值達萬億，日本得知后要求中國歸還

長白山驚現“藏寶洞”，專家估值達萬億，日本得知后要求中國歸還

抽象派大師

2026-04-20 01:30:41

明天谷雨，牢記：1不曬、2要躲、3不坐、4要吃，寓意五谷豐登！

明天谷雨，牢記：1不曬、2要躲、3不坐、4要吃，寓意五谷豐登！

阿龍美食記

2026-04-19 11:50:47

珠海家長：自家孩子趴桌睡，憑啥先給別人捐躺椅？官方回應

珠海家長：自家孩子趴桌睡，憑啥先給別人捐躺椅？官方回應

南方都市報

2026-04-17 15:48:13

杜鋒：人員本就不齊整徐杰今晚又不舒服，大外援等他到位再說

杜鋒：人員本就不齊整徐杰今晚又不舒服，大外援等他到位再說

懂球帝

2026-04-20 13:31:19

“磨膝大戶”被公布，是跑步的20倍，醫生：不想軟骨磨光，早扔掉

“磨膝大戶”被公布，是跑步的20倍，醫生：不想軟骨磨光，早扔掉

垚垚分享健康

2026-04-19 14:35:09

硅星Breaknews

7537文章數 73關注度

往期回顧全部

科技要聞

拋棄OpenAI，Anthropic為何成中國AI新偶像

頭條要聞

拼多多等被罰近36億：有人吞證據抗法執法人員骨折

頭條要聞

拼多多等被罰近36億：有人吞證據抗法執法人員骨折

體育要聞

阿森納已拼盡全力，但你早干嘛去了...

娛樂要聞

鹿晗生日上熱搜，被關曉彤撕下體面

財經要聞

月之暗面IPO迷局

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻我腿軟了

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

教育

數碼

親子

公開課

藝術要聞

王羲之《換鵝帖》尚在人間，驚艷無比！

教育要聞

“博士+碩士”是按問題導向的改革，別異化成又一場學歷競賽

數碼要聞

告別性能/靜音妥協：HyperX暗影精靈PRO16狂暴模式，2026硬核指南

親子要聞

dhea什么時候吃最好時間？高齡備孕女人吃什么提高生育能力？

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版