網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

當AI學會自己寫論文：清華AutoSOTA正在重寫科研規則

2026-04-13 17:48:48　來源: 研學世家

北京舉報

0

分享至

一、科研人員的深夜困局

凌晨兩點的實驗室，顯示器藍光映照著疲憊的面容。你盯著那行代碼，只為讓模型準確率從89.5%提升到90.2%。這0.7%的進步，消耗了你三個月的青春。

這是當代AI研究者的集體困境。SOTA——這個被奉為圭臬的"當前最佳水平"指標，正在以一種近乎殘酷的方式重塑科研生態。我們追逐它，仰望它，最終也被它困住。

回望Transformer的進化史：2017年橫空出世，此后七年，全球頂尖實驗室圍繞這一架構進行了數千次迭代。GLUE基準測試上的性能曲線從75%艱難爬升至90%，背后是無數研究者被鎖死在參數調優中的創造力損耗。

問題由此浮現：當最聰明的頭腦都被綁定在重復性優化中，誰來承擔真正的原創性突破？

二、破局者登場：AutoSOTA的野望

清華大學與北京中關村學院聯合發布的AutoSOTA，給出了一個顛覆性的答案。

這不是又一個自動化調參工具。AutoSOTA指向的是端到端的AI科研自動化——從文獻研讀到實驗設計，從代碼實現到結果分析，直至新SOTA模型的完整產出。

其架構設計頗具深意。多智能體協作框架模擬人類科研團隊的分工邏輯：有的智能體負責創新構思，有的專攻實驗執行，有的承擔結果診斷。它們圍繞同一目標自主協同，在頂層規劃與底層執行之間形成閉環。

這意味著科研智能體首次具備了獨立完成"提出假設-驗證假設-迭代優化"完整鏈條的能力。

三、一周105個SOTA：數據背后的真相

實驗結果令人側目。

在為期一周的封閉測試中，AutoSOTA以前一年頂會論文為起點，成功發現105個性能顯著提升的新模型。其中超過60%展現出結構性創新，平均性能提升接近10%。

這組數據的關鍵不在于數量，而在于質量分布。六成模型的"新穎結構設計"證明，系統并非在既有路徑上機械搜索，而是在未知設計空間中主動探索。

10%的平均提升幅度同樣值得玩味。對比人類研究者數月打磨換來1%增量的常態，這種效率躍遷暗示著科研生產關系的深層變革。

四、重新定義SOTA：從指標崇拜到價值回歸

AutoSOTA的真正沖擊力，在于它迫使整個行業重新審視一個根本命題：SOTA刷新是否等同于科學突破？

當性能優化可以被智能體系統高效接管，人類科學家的核心價值將遷移至問題定義、方向識別與底層機制構想。這是一種人機協作的新范式：機器承擔密集型、長周期的優化過程，人類專注于不可替代的原創性思考。

由此觀之，AutoSOTA更像一臺"創造力放大器"。它的使命不是取代科學家的靈感，而是將人類從低效重復的實驗勞作中解放出來。

科研的本質從來不是"把已有模型再推高一點"。真正重要的，是面對尚未被清晰定義、尚未被系統探索的宏大問題。

五、未來已來：科研自動化的臨界點

AutoSOTA的發布標志著一個轉折。它證明了科研智能體在AI研究自動化領域的巨大潛力，更預示了一種可能性：當性能優化成為智能體的標準能力，科學研究將回歸其最珍貴的起點。

那個起點是人類提出最大膽的問題，探索最未知的方向，追求絕對不可替代的原創性突破。

七年Transformer優化史，人類走了漫長的路。而AutoSOTA用一周時間證明，這條路可以有不同的走法。

重要的不是機器能跑多快，而是人類終于可以跑得不同。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

21歲小伙賣豬肉幫助撫養6個弟妹：羨慕同齡人上大學或出去打工，希望爸媽別再生了

極目新聞 2026-04-21 22:03:17
5201 跟貼 5201
渡船以渡車為主渡客為輔，女子慢悠悠上船被直接落下

南陽日報 2026-04-21 18:57:27
171 跟貼 171

謝鋒:中國大蒜做夢也沒想到會被美列為"國家安全威脅"

極目新聞 2026-04-22 08:45:19
292 跟貼 292

大爺駕駛MPV強穿掛壁公路，出來時全車被刮花

荔枝新聞 2026-04-22 05:14:55
91 跟貼 91
寧德時代麒麟凝聚態電池發布，最高續航1500公里

新京報 2026-04-21 20:38:22
1551 跟貼 1551

中國軍艦大片震撼上新：雷達一開周圍都是透明的

環球網資訊 2026-04-22 09:00:22
649 跟貼 649

專家號剛放出就瞬間"秒空" 上海三甲醫院緊急報警

大風新聞 2026-04-22 15:12:13
0 跟貼 0
俄軍總參謀長稱已完全控制盧甘斯克地區

財聯社 2026-04-21 17:16:23
2207 跟貼 2207

云南一幼童十余天反復咳痰帶血，氣管內取出8厘米活體蠕動螞蟥

澎湃新聞 2026-04-22 11:02:28
368 跟貼 368
黎巴嫩再成戰場民眾：在這沒有人沒有失去過親近的人

新京報 2026-04-20 08:22:24
875 跟貼 875
經濟大省調研行｜吞吐之間見活力——透視長三角港口群的韌性支撐

新華社 2026-04-21 16:51:07
378 跟貼 378
上海一家奧樂齊超市銷售的經典凱撒沙拉檢出李斯特菌國標要求“不得檢出”

信網 2026-04-21 19:25:05
157 跟貼 157
開封萬歲山現“啤酒交易所”，供應商：實為啤酒自助銷售裝置，價格隨人數動態變化，還可選無酒精版

極目新聞 2026-04-21 19:55:58
296 跟貼 296
茶顏悅色深圳店用機械臂搖奶茶，有人凌晨4點半排隊：炒到100一杯

星視頻 2026-04-22 11:46:47
100 跟貼 100
國家疾控局：4月以來流感病毒和鼻病毒呈上升趨勢

央視新聞客戶端 2026-04-22 15:13:09
54 跟貼 54
億縷陽光｜在春天邂逅美好

環球網資訊 2026-04-21 20:39:50
132 跟貼 132
英國法案規定2008年后出生者終身不得購煙，將打造“第一代無煙者”

極目新聞 2026-04-22 14:32:22
10 跟貼 10
取消午休，改成16點下班，你愿意嗎？網友吵翻！

魯中晨報 2026-04-22 14:28:23
0 跟貼 0
格力回應鋁線電機爭議：相關工程機已停產，海信稱靠多三兩銅多500元時代已終結

紅星資本局 2026-04-21 20:40:16
0 跟貼 0
華晨宇多次維權勝訴

雷達財經 2026-04-22 15:47:39
0 跟貼 0
一旅客突然直直倒地昏迷！天津站候車廳，8分鐘生死救援！

環球網資訊 2026-04-22 15:56:13
0 跟貼 0
陜西一男子稱遭運輸司機“挾貨加價”：司機中途發現超載，把貨物拉回家并索高額運費；運滿滿：已墊付部分費用，將向司機追償并限制接單

三湘都市報 2026-04-22 15:56:49
0 跟貼 0
別被牙膏的“3D炫白”“醫研”騙了，那只是商標

中國能源網 2026-04-22 16:04:06
0 跟貼 0

87歲劉詩昆：住美國600平豪宅，和三婚妻子兒女雙全，享天倫之樂

87歲劉詩昆：住美國600平豪宅，和三婚妻子兒女雙全，享天倫之樂

悄悄史話

2026-04-22 12:38:34

京滬高鐵首次實現全年盈利！

新浪財經

2026-04-21 22:52:52

李湘瘦成第二個賈玲！半年狂甩五十斤，用狠勁把自己拉回上場門檻

李湘瘦成第二個賈玲！半年狂甩五十斤，用狠勁把自己拉回上場門檻

觀察鑒娛

2026-04-22 10:11:47

軍費90億卻砸120億？美印看懵，巴鐵清空中國武器，背后金主攤牌

軍費90億卻砸120億？美印看懵，巴鐵清空中國武器，背后金主攤牌

小蘭聊歷史

2026-04-18 15:27:37

鄭偉銘任天津市國資委黨委書記、主任

鄭偉銘任天津市國資委黨委書記、主任

中國經濟網

2026-04-22 14:17:11

特朗普臉被扇腫，伊朗清理戰場竟挖出一讓美國下不來臺的“大瓜”

特朗普臉被扇腫，伊朗清理戰場竟挖出一讓美國下不來臺的“大瓜”

阿七說史

2026-04-21 15:32:06

特朗普的中東騙局被戳穿，炸伊朗、逼談判是演戲，真正目標藏不住

特朗普的中東騙局被戳穿，炸伊朗、逼談判是演戲，真正目標藏不住

西樓知趣雜談

2026-04-22 11:42:50

震驚！武漢20歲男子偷走女租客鞋子，做不雅行為被行拘5日引關注

震驚！武漢20歲男子偷走女租客鞋子，做不雅行為被行拘5日引關注

火山詩話

2026-04-22 13:24:57

遲重瑞放棄繼承陳麗華百億遺產，簽字那一刻，他終于解脫了！

遲重瑞放棄繼承陳麗華百億遺產，簽字那一刻，他終于解脫了！

東方不敗然多多

2026-04-22 10:00:56

“中年返貧三件套”，正在吞掉一代人的存款

“中年返貧三件套”，正在吞掉一代人的存款

十點讀書

2026-04-18 18:36:15

范爭一輸球引發連鎖反應！中國選手未能提前鎖定4強，13冠王攪局

范爭一輸球引發連鎖反應！中國選手未能提前鎖定4強，13冠王攪局

劉姚堯的文字城堡

2026-04-22 08:41:18

面相變了！55歲離2次婚的"紙片人"魯豫與小19歲男友同居后大變樣

面相變了！55歲離2次婚的"紙片人"魯豫與小19歲男友同居后大變樣

林雁飛

2026-04-20 19:14:55

65歲退休阿姨傾訴：和3個大爺同居后，我才知道他們的真正意圖

65歲退休阿姨傾訴：和3個大爺同居后，我才知道他們的真正意圖

熱心柚子姐姐

2026-04-21 14:35:10

你拋美債，我拋中債！外資紛紛減持中國債，大量資金流向美國？

你拋美債，我拋中債！外資紛紛減持中國債，大量資金流向美國？

掉了顆大白兔糖

2026-04-22 11:57:00

廈門女子曬一人餐走紅，吃的干凈，會很舒服，網友：缺男友嗎？

廈門女子曬一人餐走紅，吃的干凈，會很舒服，網友：缺男友嗎？

餐飲新紀元

2026-04-22 07:10:35

田馥甄回應拒接《浪姐》：所有大陸綜藝都邀過，全拒絕

田馥甄回應拒接《浪姐》：所有大陸綜藝都邀過，全拒絕

陳意小可愛

2026-04-22 12:23:14

誰給日本在中國建學校開了綠燈？30年秘辛，一次講透！

誰給日本在中國建學校開了綠燈？30年秘辛，一次講透！

南宗歷史

2026-04-21 08:41:51

美媒：伊朗最高領袖穆杰塔巴已批準同美方進行談判，白宮20日一整天都在等德黑蘭，如出現進展跡象，特朗普也可能同意延長停火期限

美媒：伊朗最高領袖穆杰塔巴已批準同美方進行談判，白宮20日一整天都在等德黑蘭，如出現進展跡象，特朗普也可能同意延長停火期限

極目新聞

2026-04-21 09:44:58

中國，第二次被蛇咬？

美第奇效應

2026-04-21 21:53:03

這才是宋美齡和繼子蔣經國的一張真實合影，都是真人的容貌

這才是宋美齡和繼子蔣經國的一張真實合影，都是真人的容貌

喜歡歷史的阿繁

2026-04-16 11:17:28

專注于研學、研究生、學術領域創作！

157文章數 0關注度

往期回顧全部

科技要聞

對話梅濤：沒有視頻底座，具身智能走不遠

頭條要聞

媒體:愛奇藝AI藝人庫惹眾怒 CEO龔宇的解釋站不住腳

頭條要聞

媒體:愛奇藝AI藝人庫惹眾怒 CEO龔宇的解釋站不住腳

體育要聞

網易傳媒再度簽約法國隊和阿根廷隊

娛樂要聞

復婚無望！baby黃曉明陪小海綿零交流

財經要聞

伊朗拒絕出席特朗普宣布延長停火期限

汽車要聞

純電續航301km+激光雷達宋Pro DM-i飛馳版9.99萬起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

藝術

親子

教育

軍事航空

旅游要聞

北京歡樂谷也有摩天輪了，北京最高、6月底運營

藝術要聞

無花不風景

親子要聞

很難想象弟弟最后的表情是在想什么

教育要聞

第8課-Sightseeing + taking photos 觀光旅游和拍照

軍事要聞

特朗普宣布延長停火伊朗表態

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版