![]()
編輯丨coisini
面向科學發現的人工智能系統已展現出巨大潛力,但現有方法大多仍屬私有技術,且以批處理模式運行,每個研究周期需要數小時,無法實現研究人員的實時引導。
最近,一篇題為《Rethinking the AI Scientist: Interactive Multi-Agent Workflows for Scientific Discovery》的研究論文提出了一個多智能體系統 ——Deep Research,能在以分鐘計的時間內完成交互式科學研究。
![]()
論文地址:https://arxiv.org/abs/2601.12542
Deep Research 包含用于規劃、數據分析、文獻檢索和新穎性檢測的專用智能體,并通過一個持久的全局狀態統一協調,以在迭代的研究周期中保持上下文連貫。
該系統支持兩種操作模式以適應不同工作流程:半自主模式包含選擇性人工檢查點;全自主模式用于擴展性研究。
Deep Research
Deep Research 通過構建基于智能體的交互式環境,將研究周期從小時級縮短至分鐘級,從而實現對研究過程的實時主動引導,無需等待可能需要完全重做才能探索新方向的批量結果,有效解決了現有 AI 驅動研究工具的關鍵局限。
該系統包含四個專門化智能體:
- 協調智能體(orchestrator agent),負責在研究周期中維護持久的世界狀態(world state);
- 數據分析智能體,通過迭代式代碼生成與知識庫構建來分解復雜分析任務;
- 文獻檢索智能體,綜合來自異構學術數據庫的證據;
- 新穎性檢測智能體,依據現有文獻,對所提假設進行新穎性評估。
![]()
該系統支持兩種運行模式。半自主模式引入人機協同交互,打造真正的「科學家協作者」體驗:研究人員可在單次工作會話中迭代式指導并優化 AI 研究過程,根據實時涌現的洞察及時調整研究方向,而無需等待數小時的批處理結果 —— 傳統方式往往需要完全重新執行才能探索替代假設。全自主模式則可在無人工干預檢查點的情況下執行擴展研究周期,適用于對目標明確的研究任務進行系統性探索。
研究團隊現已開源協調智能體 ——BioAgents 框架,但生物數據分析和生物文獻檢索組件尚未發布。未來的開發將側重于擴展數據庫覆蓋范圍,通過改進語義表征來優化新穎性檢測,并將基準驗證延伸至更多科學領域。
![]()
BioAgents 開源地址:https://github.com/bio-xyz/BioAgents
![]()
實驗評估
Deep Research 在 BixBench 計算生物學基準測試上取得了 SOTA 性能,同時提供了交互式、人機協同的工作流,這與現有系統普遍采用的批處理方法形成鮮明對比。
![]()
數據分析智能體在開放式問題上的準確率達到 48.8%:
![]()
在含「Refusal」選項的多選題上準確率為 55.2%:
![]()
在不含該選項的多選題上準確率為 64.5%:
![]()
這些結果超越了 Edison Analysis、K-Dense Analyst、Kepler 和 GPT-5 等現有基線。
詳細的案例研究證實,Deep Research 的性能優勢源于正確的數據結構化與統計執行,而非依賴于對答案選項的先驗知識。
![]()
感興趣的讀者可以閱讀論文原文,了解更多研究內容。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.