![]()
編輯丨%
20 世紀(jì)初,蘋果聯(lián)合創(chuàng)始人史蒂夫·喬布斯將計(jì)算機(jī)形容為“我們大腦的自行車”。他的靈感來自小時(shí)候看到的《Scientific American》 雜志上的一幅圖紙,圖片顯示騎自行車的人比任何動(dòng)物都更節(jié)能。
相比之下,AI 可能被稱為飛機(jī)更為恰當(dāng)些——它們比自行車更快,但更難控制,犯錯(cuò)后果可能尤其嚴(yán)重。科學(xué)家或?qū)闹蝎@利,因?yàn)榭茖W(xué)研究究其本質(zhì)是一場(chǎng)探索未知的旅程,但在全新的工作環(huán)境中,挑戰(zhàn)與挫折接踵而至。
為了高效且安全地駕馭這新時(shí)代的發(fā)展工具,學(xué)者們需要一套操作手冊(cè)。真正的問題從來不是機(jī)器是否會(huì)取代科學(xué)家,而是學(xué)者們掌握它們時(shí),會(huì)成為怎樣的存在。
這些表述來自 SciSciGPT 的開發(fā)團(tuán)隊(duì),那是一個(gè)由多個(gè)專業(yè) AI 分工協(xié)作進(jìn)行研究的工作流程。其核心是 ResearchManager 代理。它協(xié)調(diào)工作流程,將研究人員通過聊天界面輸入的自然語言查詢劃分為任務(wù),然后委派給專門從事文獻(xiàn)綜述、數(shù)據(jù)提取或分析的代理。
![]()
圖 1:SciSciGPT 模塊化設(shè)計(jì)的示意圖。
在他們的案例研究中,SciSciGPT 創(chuàng)建了一組大學(xué)合作的可視化,并測(cè)試論文中的某一圖形是否能從其存儲(chǔ)庫中的數(shù)據(jù)中復(fù)制。它完成這些研究任務(wù)的速度更快,結(jié)果也比經(jīng)驗(yàn)豐富的研究人員使用 AI 工具更高效。
在此基礎(chǔ)上,該團(tuán)隊(duì)總結(jié)了從構(gòu)建一個(gè)以研究為導(dǎo)向的人工智能代理中學(xué)到的經(jīng)驗(yàn)教訓(xùn),以及科學(xué)家在使用代理進(jìn)行科學(xué)時(shí)應(yīng)考慮的原則。
協(xié)作>自動(dòng)化
現(xiàn)如今的環(huán)境發(fā)展趨勢(shì)其實(shí)是將科學(xué)研究完全自動(dòng)化,轉(zhuǎn)向“AI 科學(xué)家”或者是“自動(dòng)實(shí)驗(yàn)室”。這些流程可能會(huì)讓人覺得復(fù)雜,但科學(xué)并不是流水線,這一切建立在解釋、爭(zhēng)論與責(zé)任之上,人類的判斷至關(guān)重要。
以牛頓棱鏡實(shí)驗(yàn)打個(gè)比方。一個(gè)全自動(dòng)系統(tǒng)可以進(jìn)行牛頓棱鏡實(shí)驗(yàn),測(cè)量白光通過棱鏡時(shí)的分裂情況,并將這些數(shù)據(jù)擬合到模型中。但牛頓做了截然不同的事:他顛倒了這一設(shè)定,將彩色光束重新組合回白光,果斷地表明顏色屬于光本身,而非玻璃。
![]()
圖 2:牛頓棱鏡實(shí)驗(yàn)。
這一行為——決定一個(gè)表面上的異常是現(xiàn)象,而非應(yīng)消除的錯(cuò)誤——是解釋上的跳躍,而非計(jì)算。自動(dòng)化工作流程設(shè)計(jì)上是平滑異常并優(yōu)化以適應(yīng),相比之下,科學(xué)家利用了意外的力量。
隨著 AI 逐漸成為研究的核心,科學(xué)將同時(shí)面臨技術(shù)與公民信任的轉(zhuǎn)折點(diǎn)。在公眾對(duì)科學(xué)信心本已脆弱的時(shí)代,正是加強(qiáng)支撐科學(xué)基礎(chǔ)、通過將透明度、可追溯性和問責(zé)性嵌入發(fā)現(xiàn)基礎(chǔ)設(shè)施來更新這一契約的時(shí)刻。全面自動(dòng)化或許能帶來一些答案,但會(huì)削弱賦予這些答案意義的公信力。
研究團(tuán)隊(duì)始終認(rèn)為,人類科學(xué)家應(yīng)保留對(duì)問題框架、驗(yàn)證路徑和對(duì)結(jié)論簽署的權(quán)威和責(zé)任。縱觀人類歷史,其實(shí)不難發(fā)現(xiàn)這是一段不斷發(fā)現(xiàn)的旅程。隨著 AI 能夠?yàn)榘l(fā)現(xiàn)做出貢獻(xiàn),核心問題不再是機(jī)器單獨(dú)能做什么,而是如何設(shè)計(jì)機(jī)器,以保持科學(xué)的問責(zé)性和可重復(fù)性。
速度意味著變革
當(dāng)失敗成本不復(fù)往日那般高昂,所有冒險(xiǎn)的計(jì)劃都變得理性起來,過去使得測(cè)試曾經(jīng)過于昂貴或耗時(shí)的問題變得切實(shí)可行。
基因組學(xué)展示了這一轉(zhuǎn)變:解碼第一個(gè)人類基因組花費(fèi)了十多年和數(shù)十億美元;如今,測(cè)序成本低于 1000 美元,耗時(shí)數(shù)小時(shí),將該領(lǐng)域從單基因研究轉(zhuǎn)變?yōu)閷?duì)整個(gè)基因組的廣泛探索。隨著轉(zhuǎn)變,帶來了新的視角,使研究人員能夠看到科學(xué)領(lǐng)域中原本難以察覺的聯(lián)系。
速度也將影響發(fā)文的聲音。降低的技術(shù)門檻和時(shí)間壁壘使小型實(shí)驗(yàn)室、新手甚至個(gè)人研究人員能夠完成曾經(jīng)需要大型團(tuán)隊(duì)和數(shù)月協(xié)調(diào)的分析。但加速發(fā)現(xiàn)的同樣力量也可能放大錯(cuò)誤。沒有反思的快速科學(xué)有可能在大規(guī)模上匯聚錯(cuò)誤。這進(jìn)一步凸顯了人機(jī)協(xié)作的重要性,而非完全自動(dòng)化。
代理應(yīng)當(dāng)更專業(yè)
SciSciGPT 是一個(gè)自然的首個(gè)測(cè)試案例:科學(xué)科學(xué)數(shù)據(jù)豐富,方法論多樣,研究發(fā)現(xiàn)本身的運(yùn)作方式。但同樣的觀點(diǎn)在不同學(xué)科中同樣適用。每個(gè)領(lǐng)域都有其基礎(chǔ)——其教材、數(shù)據(jù)集、工具和標(biāo)準(zhǔn)。
AI 研究代理在不同領(lǐng)域表現(xiàn)不同,但應(yīng)遵循相同的基本規(guī)則:結(jié)果應(yīng)可追溯,方法可驗(yàn)證,職責(zé)明確分配。制定這些規(guī)則需要多方協(xié)調(diào),目標(biāo)是建立一個(gè)共享的公私互作框架——例如,建立日志代理決策的統(tǒng)一標(biāo)準(zhǔn),使得在一個(gè)實(shí)驗(yàn)室運(yùn)行的分析可以被另一個(gè)實(shí)驗(yàn)室審計(jì)或復(fù)現(xiàn)。
![]()
圖 3:一些實(shí)驗(yàn)室正試圖通過“AI 科學(xué)家”從頭到尾完成項(xiàng)目來自動(dòng)化研究工作。
SciSciGPT 團(tuán)隊(duì)表明,AI 對(duì)于科學(xué)的裨益廣泛存在于各種學(xué)科之中,但他們?cè)诜治龃髮W(xué)課程大綱時(shí),卻察覺到了系統(tǒng)性不匹配:人工智能教育主要集中在計(jì)算機(jī)科學(xué)、數(shù)學(xué)和工程領(lǐng)域,而那些本可以同樣受益的學(xué)科——從醫(yī)學(xué)、心理學(xué)到經(jīng)濟(jì)學(xué)——提供的培訓(xùn)遠(yuǎn)少得多 。
而與這種現(xiàn)象共同存在的,是學(xué)術(shù)界依然圍繞著各系的壁壘組織,隨著知識(shí)負(fù)擔(dān)的增加,交流的鴻溝逐步加深。科學(xué)政策制定者應(yīng)認(rèn)識(shí)到這些,支持跨學(xué)科、促進(jìn)人工智能專家與領(lǐng)域科學(xué)家持續(xù)合作的機(jī)構(gòu)式結(jié)構(gòu)。
信任必須樹立
自行車與飛機(jī)遇難的后果各不相同——這就是人們?cè)?AI 代理面前面臨的規(guī)模差異。當(dāng) AI 發(fā)展,失敗不僅會(huì)給單個(gè)研究者帶來不便;它們可能誤導(dǎo)領(lǐng)域,轉(zhuǎn)移資金,削弱公眾對(duì)科學(xué)的信任。
大型語言模型(LLM)的一個(gè)關(guān)鍵優(yōu)勢(shì)是它們能夠?qū)懽鳌_@意味著 LLM 可以用純文字記錄所做的一切。在 SciSciGPT 項(xiàng)目中,系統(tǒng)生成的每一步、每行代碼和每一個(gè)決策都被 LLM 自動(dòng)記錄。結(jié)果是大量數(shù)據(jù),但卻具有變革性。即使其中最優(yōu)秀的學(xué)生做實(shí)驗(yàn),也無法期望看到或重建每一步操作所導(dǎo)致的結(jié)果。
但這也帶來了另一個(gè)問題:信息過多。
正確的設(shè)計(jì)可以包括結(jié)構(gòu)化的來源,突出決策的初衷,而不僅僅是做了什么,并通過分層總結(jié),使關(guān)鍵偏差和決策一目了然。
想要足夠的透明度?那可能需要自行構(gòu)建。AI 需要配備嚴(yán)謹(jǐn)?shù)目茖W(xué)來源記錄和審計(jì)追蹤工具。如果做得好,AI 代理能為科學(xué)最深層的挑戰(zhàn)之一——可重復(fù)性——提供強(qiáng)有力的回應(yīng)。
AI 帶來的機(jī)遇
飛機(jī)帶來了對(duì)飛行員的需求,AI 自然也是。
AI 代理人可能會(huì)提出一些想法——無論是理論構(gòu)建、異常顯現(xiàn)還是假設(shè)設(shè)計(jì)——起初看起來很陌生。問題在于科學(xué)家是否受過訓(xùn)練,將這些視為噪音,還是從中學(xué)習(xí)。結(jié)果可能是人機(jī)共進(jìn)化:適應(yīng)最快的科學(xué)家可能成為明天發(fā)現(xiàn)的節(jié)奏。
但這對(duì)科學(xué)家和整個(gè)科學(xué)界都構(gòu)成風(fēng)險(xiǎn)。對(duì)科學(xué)家來說,風(fēng)險(xiǎn)在于技能流失。借助 GPS 導(dǎo)航工具開車很方便,但會(huì)讓司機(jī)對(duì)路線記憶變得模糊。智能體可能讓研究人員提高生產(chǎn)力,但卻讓他們對(duì)挑戰(zhàn) AI 的準(zhǔn)備不足。
相關(guān)鏈接:https://www.nature.com/articles/s41586-025-09922-y
在這種環(huán)境下,如果許多研究者依賴相同的藥物堆棧,科學(xué)就面臨同質(zhì)化的風(fēng)險(xiǎn)。人們時(shí)常擔(dān)心,雖然 AI 可能提升個(gè)體的質(zhì)量或表現(xiàn),但可能會(huì)減少集體多樣性。除非研究者們有意抵消,否則產(chǎn)出將會(huì)極大程度上趨于收斂。
從長(zhǎng)遠(yuǎn)來看,設(shè)計(jì)多樣化的思維和方法至關(guān)重要,這需要培養(yǎng)多種模型——采用不同的框架或思維方式——從多元視角和獎(jiǎng)勵(lì)異議的制度規(guī)范來解決問題。
重塑科學(xué)視角
像 SciSciGPT 這樣的系統(tǒng)仍然模仿當(dāng)前的發(fā)現(xiàn)模式,加快了其進(jìn)程,拓寬了所提問的問題范圍。但人類與 AI 共發(fā)現(xiàn)的未來不必遵循熟悉的形式。
比如,當(dāng)鋼筋混凝土出現(xiàn)時(shí),建筑師最初用它們模仿砌體,將新結(jié)構(gòu)隱藏在舊設(shè)計(jì)背后。真正的突破在于他們認(rèn)識(shí)到墻壁不再需要承重:建筑物可以被玻璃包裹,催生了紐約聯(lián)合國秘書處和巴黎的維爾之家等現(xiàn)代主義標(biāo)志。
這是一種重要的思想轉(zhuǎn)變,在逐漸充滿 AI 代理的當(dāng)下必須牢記。
還記得 SciSciGPT 團(tuán)隊(duì)打的兩個(gè)比方嗎?將交通成本與體重進(jìn)行對(duì)比,顯示騎自行車的人站在底部——最高效的移動(dòng)者。坐飛機(jī)卻是:成本高昂、效率低下卻大膽,開辟了曾經(jīng)難以想象的領(lǐng)域。前者提醒我們要設(shè)計(jì)以效率和超越為目標(biāo);后者則警示一套完善的信任體系與操作規(guī)則的必要性。
原文鏈接:https://www.nature.com/articles/d41586-026-00665-y
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.