網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

如何成為負(fù)責(zé)人AI駕駛員：確保科學(xué)家搭乘科技發(fā)展趨勢(shì)的五種方法

2026-03-03 14:22:20　來源: ScienceAI

河北舉報(bào)

分享至

編輯丨%

20 世紀(jì)初，蘋果聯(lián)合創(chuàng)始人史蒂夫·喬布斯將計(jì)算機(jī)形容為“我們大腦的自行車”。他的靈感來自小時(shí)候看到的《Scientific American》雜志上的一幅圖紙，圖片顯示騎自行車的人比任何動(dòng)物都更節(jié)能。

相比之下，AI 可能被稱為飛機(jī)更為恰當(dāng)些——它們比自行車更快，但更難控制，犯錯(cuò)后果可能尤其嚴(yán)重。科學(xué)家或?qū)闹蝎@利，因?yàn)榭茖W(xué)研究究其本質(zhì)是一場(chǎng)探索未知的旅程，但在全新的工作環(huán)境中，挑戰(zhàn)與挫折接踵而至。

為了高效且安全地駕馭這新時(shí)代的發(fā)展工具，學(xué)者們需要一套操作手冊(cè)。真正的問題從來不是機(jī)器是否會(huì)取代科學(xué)家，而是學(xué)者們掌握它們時(shí)，會(huì)成為怎樣的存在。

這些表述來自 SciSciGPT 的開發(fā)團(tuán)隊(duì)，那是一個(gè)由多個(gè)專業(yè) AI 分工協(xié)作進(jìn)行研究的工作流程。其核心是 ResearchManager 代理。它協(xié)調(diào)工作流程，將研究人員通過聊天界面輸入的自然語言查詢劃分為任務(wù)，然后委派給專門從事文獻(xiàn)綜述、數(shù)據(jù)提取或分析的代理。

圖 1：SciSciGPT 模塊化設(shè)計(jì)的示意圖。

在他們的案例研究中，SciSciGPT 創(chuàng)建了一組大學(xué)合作的可視化，并測(cè)試論文中的某一圖形是否能從其存儲(chǔ)庫中的數(shù)據(jù)中復(fù)制。它完成這些研究任務(wù)的速度更快，結(jié)果也比經(jīng)驗(yàn)豐富的研究人員使用 AI 工具更高效。

在此基礎(chǔ)上，該團(tuán)隊(duì)總結(jié)了從構(gòu)建一個(gè)以研究為導(dǎo)向的人工智能代理中學(xué)到的經(jīng)驗(yàn)教訓(xùn)，以及科學(xué)家在使用代理進(jìn)行科學(xué)時(shí)應(yīng)考慮的原則。

協(xié)作＞自動(dòng)化

現(xiàn)如今的環(huán)境發(fā)展趨勢(shì)其實(shí)是將科學(xué)研究完全自動(dòng)化，轉(zhuǎn)向“AI 科學(xué)家”或者是“自動(dòng)實(shí)驗(yàn)室”。這些流程可能會(huì)讓人覺得復(fù)雜，但科學(xué)并不是流水線，這一切建立在解釋、爭(zhēng)論與責(zé)任之上，人類的判斷至關(guān)重要。

以牛頓棱鏡實(shí)驗(yàn)打個(gè)比方。一個(gè)全自動(dòng)系統(tǒng)可以進(jìn)行牛頓棱鏡實(shí)驗(yàn)，測(cè)量白光通過棱鏡時(shí)的分裂情況，并將這些數(shù)據(jù)擬合到模型中。但牛頓做了截然不同的事：他顛倒了這一設(shè)定，將彩色光束重新組合回白光，果斷地表明顏色屬于光本身，而非玻璃。

圖 2：牛頓棱鏡實(shí)驗(yàn)。

這一行為——決定一個(gè)表面上的異常是現(xiàn)象，而非應(yīng)消除的錯(cuò)誤——是解釋上的跳躍，而非計(jì)算。自動(dòng)化工作流程設(shè)計(jì)上是平滑異常并優(yōu)化以適應(yīng)，相比之下，科學(xué)家利用了意外的力量。

隨著 AI 逐漸成為研究的核心，科學(xué)將同時(shí)面臨技術(shù)與公民信任的轉(zhuǎn)折點(diǎn)。在公眾對(duì)科學(xué)信心本已脆弱的時(shí)代，正是加強(qiáng)支撐科學(xué)基礎(chǔ)、通過將透明度、可追溯性和問責(zé)性嵌入發(fā)現(xiàn)基礎(chǔ)設(shè)施來更新這一契約的時(shí)刻。全面自動(dòng)化或許能帶來一些答案，但會(huì)削弱賦予這些答案意義的公信力。

研究團(tuán)隊(duì)始終認(rèn)為，人類科學(xué)家應(yīng)保留對(duì)問題框架、驗(yàn)證路徑和對(duì)結(jié)論簽署的權(quán)威和責(zé)任。縱觀人類歷史，其實(shí)不難發(fā)現(xiàn)這是一段不斷發(fā)現(xiàn)的旅程。隨著 AI 能夠?yàn)榘l(fā)現(xiàn)做出貢獻(xiàn)，核心問題不再是機(jī)器單獨(dú)能做什么，而是如何設(shè)計(jì)機(jī)器，以保持科學(xué)的問責(zé)性和可重復(fù)性。

速度意味著變革

當(dāng)失敗成本不復(fù)往日那般高昂，所有冒險(xiǎn)的計(jì)劃都變得理性起來，過去使得測(cè)試曾經(jīng)過于昂貴或耗時(shí)的問題變得切實(shí)可行。

基因組學(xué)展示了這一轉(zhuǎn)變：解碼第一個(gè)人類基因組花費(fèi)了十多年和數(shù)十億美元；如今，測(cè)序成本低于 1000 美元，耗時(shí)數(shù)小時(shí)，將該領(lǐng)域從單基因研究轉(zhuǎn)變?yōu)閷?duì)整個(gè)基因組的廣泛探索。隨著轉(zhuǎn)變，帶來了新的視角，使研究人員能夠看到科學(xué)領(lǐng)域中原本難以察覺的聯(lián)系。

速度也將影響發(fā)文的聲音。降低的技術(shù)門檻和時(shí)間壁壘使小型實(shí)驗(yàn)室、新手甚至個(gè)人研究人員能夠完成曾經(jīng)需要大型團(tuán)隊(duì)和數(shù)月協(xié)調(diào)的分析。但加速發(fā)現(xiàn)的同樣力量也可能放大錯(cuò)誤。沒有反思的快速科學(xué)有可能在大規(guī)模上匯聚錯(cuò)誤。這進(jìn)一步凸顯了人機(jī)協(xié)作的重要性，而非完全自動(dòng)化。

代理應(yīng)當(dāng)更專業(yè)

SciSciGPT 是一個(gè)自然的首個(gè)測(cè)試案例：科學(xué)科學(xué)數(shù)據(jù)豐富，方法論多樣，研究發(fā)現(xiàn)本身的運(yùn)作方式。但同樣的觀點(diǎn)在不同學(xué)科中同樣適用。每個(gè)領(lǐng)域都有其基礎(chǔ)——其教材、數(shù)據(jù)集、工具和標(biāo)準(zhǔn)。

AI 研究代理在不同領(lǐng)域表現(xiàn)不同，但應(yīng)遵循相同的基本規(guī)則：結(jié)果應(yīng)可追溯，方法可驗(yàn)證，職責(zé)明確分配。制定這些規(guī)則需要多方協(xié)調(diào)，目標(biāo)是建立一個(gè)共享的公私互作框架——例如，建立日志代理決策的統(tǒng)一標(biāo)準(zhǔn)，使得在一個(gè)實(shí)驗(yàn)室運(yùn)行的分析可以被另一個(gè)實(shí)驗(yàn)室審計(jì)或復(fù)現(xiàn)。

圖 3：一些實(shí)驗(yàn)室正試圖通過“AI 科學(xué)家”從頭到尾完成項(xiàng)目來自動(dòng)化研究工作。

SciSciGPT 團(tuán)隊(duì)表明，AI 對(duì)于科學(xué)的裨益廣泛存在于各種學(xué)科之中，但他們?cè)诜治龃髮W(xué)課程大綱時(shí)，卻察覺到了系統(tǒng)性不匹配：人工智能教育主要集中在計(jì)算機(jī)科學(xué)、數(shù)學(xué)和工程領(lǐng)域，而那些本可以同樣受益的學(xué)科——從醫(yī)學(xué)、心理學(xué)到經(jīng)濟(jì)學(xué)——提供的培訓(xùn)遠(yuǎn)少得多。

而與這種現(xiàn)象共同存在的，是學(xué)術(shù)界依然圍繞著各系的壁壘組織，隨著知識(shí)負(fù)擔(dān)的增加，交流的鴻溝逐步加深。科學(xué)政策制定者應(yīng)認(rèn)識(shí)到這些，支持跨學(xué)科、促進(jìn)人工智能專家與領(lǐng)域科學(xué)家持續(xù)合作的機(jī)構(gòu)式結(jié)構(gòu)。

信任必須樹立

自行車與飛機(jī)遇難的后果各不相同——這就是人們?cè)?AI 代理面前面臨的規(guī)模差異。當(dāng) AI 發(fā)展，失敗不僅會(huì)給單個(gè)研究者帶來不便；它們可能誤導(dǎo)領(lǐng)域，轉(zhuǎn)移資金，削弱公眾對(duì)科學(xué)的信任。

大型語言模型（LLM）的一個(gè)關(guān)鍵優(yōu)勢(shì)是它們能夠?qū)懽鳌＿@意味著 LLM 可以用純文字記錄所做的一切。在 SciSciGPT 項(xiàng)目中，系統(tǒng)生成的每一步、每行代碼和每一個(gè)決策都被 LLM 自動(dòng)記錄。結(jié)果是大量數(shù)據(jù)，但卻具有變革性。即使其中最優(yōu)秀的學(xué)生做實(shí)驗(yàn)，也無法期望看到或重建每一步操作所導(dǎo)致的結(jié)果。

但這也帶來了另一個(gè)問題：信息過多。

正確的設(shè)計(jì)可以包括結(jié)構(gòu)化的來源，突出決策的初衷，而不僅僅是做了什么，并通過分層總結(jié)，使關(guān)鍵偏差和決策一目了然。

想要足夠的透明度？那可能需要自行構(gòu)建。AI 需要配備嚴(yán)謹(jǐn)?shù)目茖W(xué)來源記錄和審計(jì)追蹤工具。如果做得好，AI 代理能為科學(xué)最深層的挑戰(zhàn)之一——可重復(fù)性——提供強(qiáng)有力的回應(yīng)。

AI 帶來的機(jī)遇

飛機(jī)帶來了對(duì)飛行員的需求，AI 自然也是。

AI 代理人可能會(huì)提出一些想法——無論是理論構(gòu)建、異常顯現(xiàn)還是假設(shè)設(shè)計(jì)——起初看起來很陌生。問題在于科學(xué)家是否受過訓(xùn)練，將這些視為噪音，還是從中學(xué)習(xí)。結(jié)果可能是人機(jī)共進(jìn)化：適應(yīng)最快的科學(xué)家可能成為明天發(fā)現(xiàn)的節(jié)奏。

但這對(duì)科學(xué)家和整個(gè)科學(xué)界都構(gòu)成風(fēng)險(xiǎn)。對(duì)科學(xué)家來說，風(fēng)險(xiǎn)在于技能流失。借助 GPS 導(dǎo)航工具開車很方便，但會(huì)讓司機(jī)對(duì)路線記憶變得模糊。智能體可能讓研究人員提高生產(chǎn)力，但卻讓他們對(duì)挑戰(zhàn) AI 的準(zhǔn)備不足。

相關(guān)鏈接：https://www.nature.com/articles/s41586-025-09922-y

在這種環(huán)境下，如果許多研究者依賴相同的藥物堆棧，科學(xué)就面臨同質(zhì)化的風(fēng)險(xiǎn)。人們時(shí)常擔(dān)心，雖然 AI 可能提升個(gè)體的質(zhì)量或表現(xiàn)，但可能會(huì)減少集體多樣性。除非研究者們有意抵消，否則產(chǎn)出將會(huì)極大程度上趨于收斂。

從長(zhǎng)遠(yuǎn)來看，設(shè)計(jì)多樣化的思維和方法至關(guān)重要，這需要培養(yǎng)多種模型——采用不同的框架或思維方式——從多元視角和獎(jiǎng)勵(lì)異議的制度規(guī)范來解決問題。

重塑科學(xué)視角

像 SciSciGPT 這樣的系統(tǒng)仍然模仿當(dāng)前的發(fā)現(xiàn)模式，加快了其進(jìn)程，拓寬了所提問的問題范圍。但人類與 AI 共發(fā)現(xiàn)的未來不必遵循熟悉的形式。

比如，當(dāng)鋼筋混凝土出現(xiàn)時(shí)，建筑師最初用它們模仿砌體，將新結(jié)構(gòu)隱藏在舊設(shè)計(jì)背后。真正的突破在于他們認(rèn)識(shí)到墻壁不再需要承重：建筑物可以被玻璃包裹，催生了紐約聯(lián)合國秘書處和巴黎的維爾之家等現(xiàn)代主義標(biāo)志。

這是一種重要的思想轉(zhuǎn)變，在逐漸充滿 AI 代理的當(dāng)下必須牢記。

還記得 SciSciGPT 團(tuán)隊(duì)打的兩個(gè)比方嗎？將交通成本與體重進(jìn)行對(duì)比，顯示騎自行車的人站在底部——最高效的移動(dòng)者。坐飛機(jī)卻是：成本高昂、效率低下卻大膽，開辟了曾經(jīng)難以想象的領(lǐng)域。前者提醒我們要設(shè)計(jì)以效率和超越為目標(biāo)；后者則警示一套完善的信任體系與操作規(guī)則的必要性。

原文鏈接：https://www.nature.com/articles/d41586-026-00665-y

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.