亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Nature重磅:首個“AI科學家”的誕生!實現(xiàn)端到端自動化科研,撰寫論文通過頂會同行評審

0
分享至

撰文丨王聰

編輯丨王多魚

排版丨水成文

2024 年 8 月,Sakana AI 公司、不列顛哥倫比亞大學、牛津大學的研究人員組成的研究團隊在預印本平臺 arXiv 推出首個旨在全面自動化科學流程的人工智能工具——“AI 科學家”(AI scientist),其能夠完成科學發(fā)現(xiàn)的整個周期——從提出想法到驗證想法再到撰寫科學論文。

如今,一年多過去了,可供研究人員使用的 AI 研究助手種類繁多,其中一些也能夠像“AI 科學家”那樣進行自主研究甚至撰寫科學論文。

而現(xiàn)在, “AI 科學家”再次完成了一個新壯舉——其完成了首個通過人類專家同行評審的完全 AI 生成論文 ,從 研究想法、編寫代碼、運行實驗、繪制和分析數(shù)據(jù),到撰寫完整的科學論文,均由“AI 科學家”自主完成。

2026 年 3 月 25 日,研究團隊在國際頂尖學術(shù)期刊Nature上發(fā)表了題為:Towards end-to-end automation of AI research 的研究論文,更新了 2024 年的這篇描述“AI 科學家”的預印本論文,對其能力進行了適度調(diào)整,進一步展示了“AI 科學家”將生成的三篇原創(chuàng)研究論文提交給了一個頂級機器學習會議——國際學習表征會議(ICLR),其中一篇論文通過人類專家同行評審后被接收,且評分超過了該會議接收論文的平均值。

這一成就展示了 AI 在科學貢獻方面日益增強的能力,并預示著科學研究方式可能發(fā)生的范式轉(zhuǎn)變。研究團隊表示,如果負責任地開發(fā),“AI 科學家”等自主系統(tǒng)能夠極大地加速科學發(fā)現(xiàn)。


什么是“AI 科學家”?

“AI 科學家”是一個端到端自動化科學研究全過程的 AI 系統(tǒng),由一系列“智能體”(Agent)構(gòu)成,這些智能體建立在現(xiàn)有的大語言模型(LLM)之上(例如 GPT-4o 或 Claude Sonnet 4)。

它能夠自主完成從研究構(gòu)思到論文發(fā)表的整個科研生命周期,包括——

1、生成研究想法:在用戶指定的機器學習研究子領(lǐng)域中,迭代生成高水平的研究方向和假設(shè);

2、執(zhí)行實驗:編寫代碼、運行實驗、可視化結(jié)果;

3、撰寫論文:按照標準機器學習會議論文格式,使用 LaTeX 模板逐節(jié)撰寫完整論文;

4、進行同行評審:通過自動評審系統(tǒng)評估論文的科學質(zhì)量。

這個“AI 科學家”有兩種工作模式:基于模板的模(使用人類提供的代碼模板作為起點)和模板自由的模式(完全自主生成代碼并進行更廣泛的科學探索)。


“AI 科學家”工作流程

突破:AI 論文通過同行評審

為了驗證“AI 科學家”的實際能力,研究團隊進行了一項大膽的實驗:將完全由“AI 科學家”生成的研究論文提交給國際學習表征會議(ICLR)的一個研討會進行同行評審。ICLR 是由圖靈獎得主Yoshua Bengio楊立昆于 2013 年創(chuàng)立的深度學習領(lǐng)域?qū)W術(shù)會議,其與 NeurIPS、ICML 并稱為機器學習領(lǐng)域主要會議,在谷歌學術(shù)會議期刊排名中位列全球前十。

整個實驗過程完全透明且符合倫理規(guī)范:

  • 會議組織者事先知情并同意;

  • 人類評審專家被告知有部分論文是 AI 生成的,但不知道具體是哪幾篇;

  • 所有 AI 生成的論文在評審后都會被撤回,避免在科學界建立明確標準前設(shè)定先例。

結(jié)果令人震驚:“AI 科學家”提交的三篇 AI 生成論文中,有一篇獲得了人類評審專家的平均分 6.33 分(個人評分分別為 6、7、6),成為第一篇完全由 AI 生成并通過了標準的科學同行評審流程的研究論文,這一分數(shù)超過了該研討會接收論文的平均分數(shù)。這篇題為:Compositional regularization: Unexpected obstacles in enhancing neural network generalization(組合正則化:增強神經(jīng)網(wǎng)絡(luò)泛化能力中的意外障)的論文報告了一個負面結(jié)果,與研討會關(guān)注“有趣負面結(jié)果”的主題高度契合。


“AI 科學家”生成的一篇論文的精選部分,該論文已通過同行評審,在頂級機器學習會議的研討會上被接受

自動評審系統(tǒng):與人類評審者媲美

“AI 科學家”不僅能夠生成論文,還配備了“自動評審器”來評估論文質(zhì)量。這個自動評審系統(tǒng)的表現(xiàn)如何?

根據(jù)論文中的對比數(shù)據(jù),自動評審器在關(guān)鍵指標上與人類評審者表現(xiàn)相當甚至更優(yōu):

  • 平衡準確率:自動評審器 69% vs 人類評審者 66%;

  • F1 分數(shù):自動評審器 0.62 vs 人類評審者 0.49;

  • 曲線下面積(AUC):自動評審器 0.69 vs 人類評審者 0.65。

即使在訓練數(shù)據(jù)截止日期后的 2025 年的新論文上,自動評審器仍保持 66% 的平衡準確率,與人類評審者水平相當。

系統(tǒng)工作原理:四階段科研流程

“AI 科學家”按照四個主要階段順序工作——

第一階段:想法生成與篩選,系統(tǒng)迭代生成研究想法檔案,為每個方向生成描述性標題、研究理由和實驗計劃。然后通過連接語義學者API和網(wǎng)絡(luò)訪問工具,篩選掉與現(xiàn)有文獻過于相似的想法。

第二階段:實驗執(zhí)行與可視化,系統(tǒng)執(zhí)行提出的實驗計劃,可視化結(jié)果,并為后續(xù)寫作做好筆記記錄。在模板自由模式下,系統(tǒng)會從零開始生成代碼,并通過樹搜索優(yōu)化實驗執(zhí)行。

第三階段:論文撰寫,系統(tǒng)使用筆記和圖表,按照會議論文模板逐節(jié)填充內(nèi)容,通過查詢獲取相關(guān)文獻,并在 20 輪比較中為論文添加適當引用。

第四階段:自動評審,生成的論文由自動評審系統(tǒng)評估,提供數(shù)值評分、優(yōu)缺點列表和接受/拒絕的二元決策。


“AI 科學家”工作的四個階段

意義與局限:科學研究的范式轉(zhuǎn)變

這項研究的成功標志著 AI 在科學貢獻能力上的重大進步,可能預示著科學研究方式的范式轉(zhuǎn)變。如果負責任地開發(fā),這種自主系統(tǒng)可以極大地加速科學發(fā)現(xiàn)。

當然,研究團隊也坦誠指出了當前系統(tǒng)的局限性:三篇提交論文中只有一篇被接受,且研討會接受率(70%)遠高于主會議(32%);提交的論文尚不能達到頂尖論文的標準;常見失敗模式包括想法幼稚、實現(xiàn)錯誤、方法嚴謹性不足、實驗錯誤和多種類型的幻覺。

未來展望與倫理考量

隨著 AI 系統(tǒng)能力的指數(shù)級增長和成本的指數(shù)級下降,“AI 科學家”的性能有望大幅提升。未來,同樣的方法可以應用于其他科學領(lǐng)域,例如自動化化學實驗室。

然而,自動化論文生成能力也帶來了重要的倫理和社會關(guān)切——可能壓垮同行評審系統(tǒng)、人為夸大研究資歷、未經(jīng)適當認可地挪用他人想法、消除科學家工作崗位、進行不道德或危險的實驗等等。

研究團隊強調(diào),在科學界建立明確的披露和評估標準前,需要謹慎推進這類 AI 系統(tǒng)的應用,確保它們被用于促進而非破壞科學誠信。

“AI 科學家”生成并通過同行評審的論文,是 AI 發(fā)展史上的一個重要里程碑。它不僅是技術(shù)能力的展示,更是對傳統(tǒng)科研模式的深刻挑戰(zhàn)。當 AI 開始涉足人類智慧的最高殿堂——科學發(fā)現(xiàn)時,我們既看到了加速進步的巨大潛力,也面臨著重新定義科研倫理邊界的緊迫任務。

論文鏈接

https://www.nature.com/articles/s41586-026-10265-5

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
快檢查自家陽臺!有人家里已大量出現(xiàn),官方提醒:千萬別摸

快檢查自家陽臺!有人家里已大量出現(xiàn),官方提醒:千萬別摸

環(huán)球網(wǎng)資訊
2026-04-18 16:23:18
為什么全國人民都在拒接電話?

為什么全國人民都在拒接電話?

黯泉
2026-04-18 17:00:56
中國斯諾克傳捷報!趙心童拒絕被逆轉(zhuǎn),張安達5-3,德比大戰(zhàn)來襲

中國斯諾克傳捷報!趙心童拒絕被逆轉(zhuǎn),張安達5-3,德比大戰(zhàn)來襲

劉姚堯的文字城堡
2026-04-18 21:23:11
決裂?姆巴佩硬剛皇馬!拒絕克洛普執(zhí)教,力挺一人入主

決裂?姆巴佩硬剛皇馬!拒絕克洛普執(zhí)教,力挺一人入主

奶蓋熊本熊
2026-04-19 00:32:00
一條煙、一瓶酒,2026年5月起,連茶葉盒都得過紀檢這道關(guān)

一條煙、一瓶酒,2026年5月起,連茶葉盒都得過紀檢這道關(guān)

周哥一影視
2026-04-17 19:29:59
恒大超級蛀蟲劉永灼:甚至比許家印還能攬財,狂燒千億終落法網(wǎng)

恒大超級蛀蟲劉永灼:甚至比許家印還能攬財,狂燒千億終落法網(wǎng)

小曙說娛
2026-04-19 00:27:45
遺憾!張雪車隊無緣3連冠:極限反超 第三被罰變第四 無緣領(lǐng)獎臺

遺憾!張雪車隊無緣3連冠:極限反超 第三被罰變第四 無緣領(lǐng)獎臺

念洲
2026-04-18 20:40:05
234萬平方公里大國,海岸線僅37公里:準內(nèi)陸國到底有多憋屈

234萬平方公里大國,海岸線僅37公里:準內(nèi)陸國到底有多憋屈

兔斯基聊科學
2026-04-18 10:45:36
要徹底離開?格林:這可能是最后一次和庫里打球,感激這一年!

要徹底離開?格林:這可能是最后一次和庫里打球,感激這一年!

愛體育
2026-04-18 22:04:20
滾出中國!云南潑水節(jié)炸出一群“男流氓”,潑女性“臟水”太齷齪

滾出中國!云南潑水節(jié)炸出一群“男流氓”,潑女性“臟水”太齷齪

奇思妙想草葉君
2026-04-18 02:30:58
“五一”假期大批航班取消

“五一”假期大批航班取消

每日經(jīng)濟新聞
2026-04-18 22:20:39
美軍計劃在國際水域登臨并扣押與伊朗有關(guān)船只

美軍計劃在國際水域登臨并扣押與伊朗有關(guān)船只

財聯(lián)社
2026-04-18 23:23:03
王嘉爾在多倫多開演唱會,發(fā)現(xiàn)觀眾席揮舞中國國旗,立即伸手接過跑回舞臺高舉,全場歡呼沸騰

王嘉爾在多倫多開演唱會,發(fā)現(xiàn)觀眾席揮舞中國國旗,立即伸手接過跑回舞臺高舉,全場歡呼沸騰

觀威海
2026-04-16 10:20:05
以色列發(fā)動大規(guī)模空襲

以色列發(fā)動大規(guī)模空襲

中國經(jīng)濟網(wǎng)
2026-04-17 17:46:03
大瓜!健身房教練和4個女學員XX

大瓜!健身房教練和4個女學員XX

新浪財經(jīng)
2026-04-17 19:46:07
71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
我在伊拉克開工廠,娶了4個老婆,雖然年入千萬,如今卻很焦慮!

我在伊拉克開工廠,娶了4個老婆,雖然年入千萬,如今卻很焦慮!

千秋文化
2026-04-16 20:12:45
美軍封鎖霍爾木茲,巴基斯坦反將一軍,為伊朗送去最需要的東西

美軍封鎖霍爾木茲,巴基斯坦反將一軍,為伊朗送去最需要的東西

空天力量
2026-04-18 13:09:10
中東,突發(fā)大消息!伊朗革命衛(wèi)隊向油輪開火!伊朗最高領(lǐng)袖發(fā)聲

中東,突發(fā)大消息!伊朗革命衛(wèi)隊向油輪開火!伊朗最高領(lǐng)袖發(fā)聲

證券時報e公司
2026-04-18 20:38:43
光通信風口轉(zhuǎn)向:別盯光模塊,MLCC才是下一個核心主線

光通信風口轉(zhuǎn)向:別盯光模塊,MLCC才是下一個核心主線

普陀動物世界
2026-04-18 20:12:11
2026-04-19 02:36:49
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科學研究
9227文章數(shù) 145055關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

體育要聞

時隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應潘宏彬去世,拒談喪禮細節(jié)

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

本地
家居
手機
公開課
軍事航空

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

家居要聞

法式線條 時光靜淌

手機要聞

榮耀600系列參數(shù)、外觀全曝光

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

解放軍護衛(wèi)艦與外艦纏斗20小時 細節(jié)披露

無障礙瀏覽 進入關(guān)懷版