網易首頁 > 網易號 > 正文申請入駐

研究周期縮短至分鐘級，開源系統解決AI研究工具關鍵局限

2026-01-27 18:09:44　來源: ScienceAI

河北舉報

分享至

編輯丨coisini

面向科學發現的人工智能系統已展現出巨大潛力，但現有方法大多仍屬私有技術，且以批處理模式運行，每個研究周期需要數小時，無法實現研究人員的實時引導。

最近，一篇題為《Rethinking the AI Scientist: Interactive Multi-Agent Workflows for Scientific Discovery》的研究論文提出了一個多智能體系統 ——Deep Research，能在以分鐘計的時間內完成交互式科學研究。

論文地址：https://arxiv.org/abs/2601.12542

Deep Research 包含用于規劃、數據分析、文獻檢索和新穎性檢測的專用智能體，并通過一個持久的全局狀態統一協調，以在迭代的研究周期中保持上下文連貫。

該系統支持兩種操作模式以適應不同工作流程：半自主模式包含選擇性人工檢查點；全自主模式用于擴展性研究。

Deep Research

Deep Research 通過構建基于智能體的交互式環境，將研究周期從小時級縮短至分鐘級，從而實現對研究過程的實時主動引導，無需等待可能需要完全重做才能探索新方向的批量結果，有效解決了現有 AI 驅動研究工具的關鍵局限。

該系統包含四個專門化智能體：

協調智能體（orchestrator agent），負責在研究周期中維護持久的世界狀態（world state）；
數據分析智能體，通過迭代式代碼生成與知識庫構建來分解復雜分析任務；
文獻檢索智能體，綜合來自異構學術數據庫的證據；
新穎性檢測智能體，依據現有文獻，對所提假設進行新穎性評估。

該系統支持兩種運行模式。半自主模式引入人機協同交互，打造真正的「科學家協作者」體驗：研究人員可在單次工作會話中迭代式指導并優化 AI 研究過程，根據實時涌現的洞察及時調整研究方向，而無需等待數小時的批處理結果 —— 傳統方式往往需要完全重新執行才能探索替代假設。全自主模式則可在無人工干預檢查點的情況下執行擴展研究周期，適用于對目標明確的研究任務進行系統性探索。

研究團隊現已開源協調智能體 ——BioAgents 框架，但生物數據分析和生物文獻檢索組件尚未發布。未來的開發將側重于擴展數據庫覆蓋范圍，通過改進語義表征來優化新穎性檢測，并將基準驗證延伸至更多科學領域。

BioAgents 開源地址：https://github.com/bio-xyz/BioAgents

實驗評估

Deep Research 在 BixBench 計算生物學基準測試上取得了 SOTA 性能，同時提供了交互式、人機協同的工作流，這與現有系統普遍采用的批處理方法形成鮮明對比。

數據分析智能體在開放式問題上的準確率達到 48.8%：

在含「Refusal」選項的多選題上準確率為 55.2%：

在不含該選項的多選題上準確率為 64.5%：

這些結果超越了 Edison Analysis、K-Dense Analyst、Kepler 和 GPT-5 等現有基線。

詳細的案例研究證實，Deep Research 的性能優勢源于正確的數據結構化與統計執行，而非依賴于對答案選項的先驗知識。

感興趣的讀者可以閱讀論文原文，了解更多研究內容。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.