網易首頁 > 網易號 > 正文 申請入駐

AI讀不懂文檔結構?計算所重構Agentic RAG文檔推理能力

0
分享至


新智元報道

編輯:LRST

【新智元導讀】DeepRead讓AI像人一樣閱讀文檔:利用OCR識別章節結構,先精準定位相關段落,再完整讀取上下文,避免碎片化檢索。實驗顯示,其長文檔問答準確率提升17%,能自動跳過冗余信息,精準提取財報、論文等復雜內容,無需額外知識圖譜,輕量高效。

大語言模型的工具使用能力正推動RAG從靜態的一次性檢索,向自主、多輪的證據獲取進化,Agentic RAG已成為解決復雜問答任務的核心方向。

但現有主流Agentic Search框架普遍存在一個關鍵痛點——結構盲:它們將長文檔視為無差別的扁平文本塊,忽略了文檔原生的層級組織(如章節、段落)和順序邏輯,導致檢索碎片化、證據遺漏、冗余操作等問題頻發。

比如說,人類查詢「ACL論文投稿要求」時,會先翻閱目錄找到「投稿指南」章節,再逐段精讀關鍵信息。

但傳統Agentic Search(如Search-o1)卻只能通過不斷給出新的query反復檢索,可能遺漏「頁碼限制」「格式要求」等未被關鍵詞覆蓋的內容,還會重復獲取已瀏覽過的片段。


這種「結構盲」帶來三大問題:

  1. 證據碎片化:將文檔拆分為固定大小的文本塊,破壞語義連貫性,迫使智能體拼接零散片段;

  2. 檢索冗余:缺乏全局結構認知,反復檢索同類信息,浪費計算資源;

  3. 信息遺漏:依賴關鍵詞匹配,無法捕獲章節內隱含的相關信息。

而現代OCR技術已能精準提取文檔的層級結構和閱讀順序,這為解決「結構盲」提供了基礎——讓智能體學會利用這些原生結構,而非忽視它們。

中國科學院計算技術研究所團隊提出的DeepRead,核心創新是將文檔結構轉化為智能體可理解、可操作的坐標系統,通過兩大工具協同實現類人推理,整體框架參考下圖。


論文:https://arxiv.org/abs/2602.05014

代碼:https://github.com/Zhanli-Li/DeepRead


文檔結構建模:給每個段落分配「坐標」

DeepRead首先通過OCR工具將原始文檔轉化為結構化Markdown格式,構建雙維度結構模型:

  • 層級維度:區分標題(如章節)和內容段落,記錄標題的父子關系(如「2.方法」包含「2.1模型設計」);

  • 順序維度:給每個段落分配唯一坐標(doc_id, sec_id, para_idx),即「文檔ID-章節ID-段落索引」,讓每個文本片段都有明確的位置標識。

同時,DeepRead會將輕量化的目錄(TOC)注入系統提示,讓智能體掌握全局結構,無需加載全量文檔內容,平衡上下文開銷與結構感知能力。

兩大核心工具:Retrieve與ReadSection的協同

DeepRead為智能體配備兩個互補工具,模擬人類「快速定位+深度閱讀」的行為:

  • Retrieve(掃描式定位):接收語義查詢,返回Top-K相關段落及其坐標,同時支持「掃描窗口」(在召回的段落加上前后各1段),模擬人類快速瀏覽上下文的行為;

  • ReadSection(聚焦式閱讀):接收坐標范圍(如doc_id=1, sec_id=3, start_para=0, end_para=5),返回該范圍內的連續、保序段落,重構完整語義上下文,徹底解決碎片化問題。

兩者形成閉環:Retrieve負責「找方向」,快速鎖定相關章節;ReadSection負責「深挖掘」,獲取完整證據,避免關鍵詞檢索的局限性。

涌現行為:自主學會「定位再閱讀」

無需手動編碼規則或是特定指令,DeepRead可自主進化出類人推理策略:先通過Retrieve獲取結構錨點,再調用ReadSection精讀相關章節。實驗顯示,90%以上的查詢會遵循這一范式,且工具調用比例會自適應任務特性——ContextBench(長文檔推理)更依賴ReadSection,FinanceBench(金融數據提取)更依賴Retrieve。


實驗結果

跨場景的顯著提升

研究人員在四大基準數據集(涵蓋單文檔/合成多文檔數據集)上驗證了DeepRead的效果,核心結果參考下表


關鍵亮點包括:

  1. 長文檔推理突破:在需長距離依賴的ContextBench上,DeepRead準確率從74.5%提升至91.5%,提升幅度達17.0%,驗證了結構感知對長文檔的價值;

  2. 多文檔融合優勢:在基于QASPER(學術論文問答)和SyllabusQA(課程大綱對比)合成的多文檔數據集上表現優越,分別提升7.7%和13.8%,證明結構感知能有效跨文檔整合證據;

  3. 魯棒性驗證:通過DeepSeek-V3.2、GLM-4.7、Qwen3-235B三大獨立法官評估,結果一致率達88.58%,確保提升并非偶然。


值得注意的是,DeepRead的優勢并非來自「更多的檢索片段」——即使Search-o1允許檢索更多文本塊,仍無法彌補結構缺失的差距;而盲目擴展上下文(expand)可能會降低DeepRead在部分任務上的性能,因為結構化閱讀已能提供足夠連貫的證據,冗余文本只會引入噪聲。

案例直觀感受:從「關鍵詞拼湊」到「章節精讀」

以FinanceBench中的亞馬遜營收計算任務為例:

  • 傳統Search-o1風格的Agentic Search需反復檢索「2016營收」「2017凈銷售額」等關鍵詞,可能混淆「預估數據」與「實際財報數據」;

  • DeepRead則先通過Retrieve定位到「合并利潤表」章節,再用ReadSection讀取完整表格,精準提取2016年135987百萬美元、2017年177866百萬美元的凈銷售額,計算出30.8%的同比增長率。


總結

DeepRead的核心價值在于:挖掘文檔原生結構先驗,用輕量坐標系統和協同工具,實現了Agentic RAG的結構感知升級。

相比構建復雜知識圖譜的方案,DeepRead無需額外結構化成本,僅通過OCR解析和工具設計,就在長文檔、多文檔任務上實現顯著提升,兼具實用性和效率。

參考資料:

https://arxiv.org/abs/2602.05014

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
鄭少秋4個女兒:老大55歲自縊,老二38歲抑郁,老三老四享盡父愛

鄭少秋4個女兒:老大55歲自縊,老二38歲抑郁,老三老四享盡父愛

照見古今
2026-04-08 18:17:49
小S首談大S去世前細節,承認她執意帶姐姐去日本 后悔沒聽S媽的話

小S首談大S去世前細節,承認她執意帶姐姐去日本 后悔沒聽S媽的話

白面書誏
2026-04-20 19:15:05
太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

橙星文娛
2026-04-17 13:19:56
一張封面讓以色列炸鍋,大使怒罵,雜志不道歉,最后視頻曝光

一張封面讓以色列炸鍋,大使怒罵,雜志不道歉,最后視頻曝光

海綿芝士局
2026-04-20 16:17:16
關注丨剛剛,全線跳水!伊朗,突然宣布

關注丨剛剛,全線跳水!伊朗,突然宣布

錢眼
2026-04-20 20:12:47
何猷君家保姆買彩票中了3000萬,保姆樂壞了,拒不辭職!轉頭第一句話是:你想要什么,我都買給你

何猷君家保姆買彩票中了3000萬,保姆樂壞了,拒不辭職!轉頭第一句話是:你想要什么,我都買給你

LULU生活家
2026-04-20 14:34:28
許家印認罪!2.4萬億窟窿,家族只拿走500億,其余真金白銀去哪了

許家印認罪!2.4萬億窟窿,家族只拿走500億,其余真金白銀去哪了

小嵩
2026-04-20 13:52:49
最后時刻簽了,高市將全面梭哈?中日航班已停飛,解放軍準時出海

最后時刻簽了,高市將全面梭哈?中日航班已停飛,解放軍準時出海

起喜電影
2026-04-21 01:20:08
女子利用天氣預報頻繁購買飛機延誤險,5年買中900多次,獲賠近300萬,被抓時:我符合保險理賠要求

女子利用天氣預報頻繁購買飛機延誤險,5年買中900多次,獲賠近300萬,被抓時:我符合保險理賠要求

譚老師地理大課堂
2026-04-15 20:11:42
37歲福原愛官宣生下三胎,現任丈夫居然是此前出軌門男主,母子平安

37歲福原愛官宣生下三胎,現任丈夫居然是此前出軌門男主,母子平安

好乒乓
2026-04-20 11:14:45
惡心!浙江新娘吐槽,18萬禮金被拿走15萬,結婚像給婆婆賺養老錢

惡心!浙江新娘吐槽,18萬禮金被拿走15萬,結婚像給婆婆賺養老錢

火山詩話
2026-04-20 08:59:19
張雪回應比賽提前結束:如果繼續比賽可能引發安全事故;“賽車圈還是很干凈的,每個人都為了自己的信仰拼搏”

張雪回應比賽提前結束:如果繼續比賽可能引發安全事故;“賽車圈還是很干凈的,每個人都為了自己的信仰拼搏”

大風新聞
2026-04-20 10:28:40
6月1日起全國工地統一用工新規,明確60歲以上農民工上崗標準

6月1日起全國工地統一用工新規,明確60歲以上農民工上崗標準

阿嚼影視評論
2026-04-20 21:02:56
失蹤足足5天后,美軍終于承認:價值16億的最強無人機在中東沒了

失蹤足足5天后,美軍終于承認:價值16億的最強無人機在中東沒了

混沌錄
2026-04-20 20:32:11
女騎手兩年暴漲35%,女司機猛增75%,中年女人為何搶著跑車?

女騎手兩年暴漲35%,女司機猛增75%,中年女人為何搶著跑車?

老特有話說
2026-04-17 17:19:57
中國男子在中東教漢語,娶三位本地姑娘,生下混血,卻坦言養不起

中國男子在中東教漢語,娶三位本地姑娘,生下混血,卻坦言養不起

三農老歷
2026-04-15 19:17:15
“最難對付的敵人”:周末,真主黨消滅以軍超過一個排!

“最難對付的敵人”:周末,真主黨消滅以軍超過一個排!

勝研集
2026-04-20 18:04:11
當年勸烏克蘭“為民生投降”,如今同一番話,原封不動送給伊朗

當年勸烏克蘭“為民生投降”,如今同一番話,原封不動送給伊朗

老馬拉車莫少裝
2026-03-18 13:51:32
1999年,69歲禹作敏獄中難耐孤寂,死前曾向李瑞環提出:我想回家

1999年,69歲禹作敏獄中難耐孤寂,死前曾向李瑞環提出:我想回家

華人星光
2026-04-20 09:59:15
殲10直飛伊朗,美以都沒敢攔!誰也沒想到,背后藏著一個天大的局

殲10直飛伊朗,美以都沒敢攔!誰也沒想到,背后藏著一個天大的局

尋墨閣
2026-04-20 18:51:46
2026-04-21 09:15:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15023文章數 66792關注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

牛彈琴:特朗普成美伊談判最大障礙 伊朗果然勃然大怒

頭條要聞

牛彈琴:特朗普成美伊談判最大障礙 伊朗果然勃然大怒

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經要聞

減速機訂單已排到明年!

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

健康
數碼
本地
房產
時尚

干細胞抗衰4大誤區,90%的人都中招

數碼要聞

16GB能當20GB用!華為超空間內存技術適配計劃公布:Mate X7系列6月推送

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

房產要聞

大規模商改住!海口西海岸,這波項目要贏麻了!

“爆冷”又如何?陳法拉的人生本就是一場逆襲大戲

無障礙瀏覽 進入關懷版