无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

告別碎片化記憶:中科院開源輕量級內存原生Agent記憶系統Mandol

0
分享至



隨著 LLM Agent 在智能客服、個人助理、社交陪伴和醫療輔助等場景中的應用拓展,其交互模式正從單輪問答走向長周期、多任務的持續協作。

在這一過程中,Agent 的記憶模塊不僅需要存儲跨會話、多類型的信息,如對話內容、用戶意圖、實體狀態和事件脈絡,還需要在復雜查詢中提供準確、可追溯且低延遲的證據支撐。

然而,當前主流記憶系統通常依賴向量數據庫、圖數據庫和關系型存儲的異構組合,容易造成記憶表示碎片化、跨庫查詢開銷高;同時,其檢索機制多采用 RAG 式的被動相似度匹配,容易引入噪聲、遺漏關聯線索且缺乏 Token 預算控制,導致檢索質量不穩定。

針對這些挑戰,中國科學院軟件研究所等機構的研究團隊提出了 Mandol:一種凝聚式內存原生分層記憶系統,其核心思想是將碎片化的記憶表示與異構存儲凝聚為統一的內存原生架構。



  • 論文標題:Mandol: An Agglomerative Agent Memory System for Long-Term Conversations
  • arXiv 論文鏈接:https://arxiv.org/pdf/2606.29778
  • 項目地址:https://github.com/AgentCombo/Mandol



Mandol 通過分層記憶模型、統一內存語義數據結構和智能量化檢索機制三方面協同設計,將碎片化的記憶表示與存儲凝聚為統一架構,為 Agent 提供兼顧表示能力、檢索效率與上下文質量的記憶底座。

在 LoCoMo 和 LongMemEval 兩項公開長對話記憶評測基準上,Mandol 在所比較的代表性開源記憶系統中取得最優總體準確率;在以 GPT-4.1-mini 作為回答生成模型的設置下,其整體準確率分別達到 92.21% 和 88.40%。在 10 QPS(即每秒接收 10 個查詢請求)并發負載下,Mandol 的平均檢索延遲為 82.2 ms,相比最快基線實現約 5.4 倍加速;平均插入延遲為 39.7 ms,相比最快基線實現約 4.8 倍加速。并且,在消費級筆記本硬件上,Mandol 的延遲仍低于現有系統,展現出優異的端側部署潛力。

從「碎片化存儲」到「被動檢索」:核心瓶頸在哪里?

實際應用中,Agent 面臨的記憶查詢復雜且多樣,從簡單的事實提取到需要多跳推理的復雜問題。尤其是以下三類查詢,對記憶系統帶來了嚴重挑戰:

強時序性檢索:如「去年暑假我去北歐旅行期間訂了哪些酒店,總花費多少?」,系統需精準回溯用戶在不同城市的多次住宿記錄、準確關聯時間與花費信息,并進行匯總。這要求系統具備對長周期內多個時序事件的精確提取與聚合能力。

跨會話多跳推理:如用戶在一次會話中提及「我對海鮮過敏」,幾天后又在另一會話中描述「吃完晚飯后皮膚起了大片紅疹」。系統需將過敏史與當前癥狀進行跨會話的邏輯拼接與推理,得出可能的過敏反應結論,而非孤立地檢索關鍵詞。

動態狀態更新與去噪:如用戶的購房偏好從「郊區大戶型」變更為「市區學區房」。系統必須準確跟蹤狀態變化,在回答「根據我的最新需求推薦幾個樓盤」時僅依據最新約束條件,自動覆蓋陳舊偏好,避免對當前決策的干擾。

面對上述需求,當前主流 Agent 記憶系統(如 Mem0、Zep、MemOS 等)在架構和檢索機制上存在三個主要問題。

第一,記憶信息難以統一表示。向量嵌入支持語義相似性匹配,卻難以顯式表達邏輯結構與時序關系;知識圖譜擁有結構化表達能力,但其固定模式對動態語義和演化支持不足。二者缺乏統一表征框架,導致記憶信息分散在不同結構中,查詢時難以獲得完整視圖。

第二,跨庫查詢開銷大。復雜的混合查詢需要在向量數據庫、圖數據庫和其他存儲之間進行跨庫編排,會產生高昂的序列化與 I/O 開銷,難以滿足低延遲交互要求。

第三,查詢精度與 Token 消耗難以兼顧。傳統 RAG 式「被動相似度匹配」檢索存在兩個突出問題:檢索結果易引入噪聲、沖突或遺漏多跳推理線索;Token 消耗缺乏有效約束,簡單查詢可能浪費上下文窗口,復雜查詢的關鍵證據鏈卻常因截斷而丟失。

Mandol 的三項核心設計:表示、存儲與檢索的一體化設計

針對上述挑戰,Mandol 從記憶模型、存儲架構和檢索機制三個維度進行了系統性設計。

設計一:分層記憶模型 —— 以結構化語義圖實現統一表征

Mandol 將記憶組織為兩個層次:

基礎記憶層負責直接存儲原始交互信息,以記憶單元(封裝原始信息與語義向量)、記憶空間(提供多粒度邏輯隔離)以及顯式關系(時序、引用、狀態更新等)和隱式語義關系,構建統一的結構化語義圖。

高階抽象記憶層則由大模型自動從基礎記憶中提煉出情景記憶(事件鏈)、語義記憶(實體關系圖)和情感記憶(用戶偏好演化鏈)等抽象知識。

兩層之間通過可追溯鏈接保持雙向關聯,確保任何抽象推理結論均可溯源至原始對話證據。這一設計既保留了基礎層的完整信息,又提供了支持推理的高階抽象視圖,針對統一表示問題給出了一種系統化方案。

在結構化語義圖中,基礎層的記憶單元以節點形式存在,顯式關系邊通過規則解析直接建立,隱式語義邊則在查詢時按需從向量索引中獲取。高階層在此基礎上進一步抽象:事件鏈以時序和因果邊連接事件節點,實體圖以引用和屬性邊組織實體關系,偏好演化鏈以狀態更新邊追蹤用戶偏好的變化軌跡。

例如,當一個簡短的對話片段「預訂了一間胡同民宿」被增強為帶有時空上下文的事件節點后,Mandol 不僅將其與同一次旅行的其他事件(如「航班延誤」 「參觀故宮」)建立時序邊,還通過語義索引與之前會話中的「計劃預訂王府井酒店」建立跨會話的隱式關聯,并在此基礎上抽象出一條狀態更新邊,完整刻畫住宿偏好從「王府井酒店」到「胡同民宿」的演化過程。所有抽象節點均保留指向原始基礎單元的引用,為后續的精確檢索提供了既細粒度又可推理的數據基礎。



設計二:內存原生語義數據結構 —— 消除跨庫查詢延遲

異構多庫架構是查詢延遲的主要來源。針對這一問題,Mandol 提出了基于內存語義數據結構的統一存儲架構,設計了SemanticMap與SemanticGraph協同工作的原生內存數據結構,在單一地址空間內實現鍵值存儲、向量索引與圖結構的原生融合。

SemanticMap 融合傳統鍵值存儲和向量結構,解決記憶單元的多模態數據存儲與語義查詢問題,并支持通過記憶空間標簽進行上下文邏輯隔離;SemanticGraph 負責統一管理顯式記憶關系與隱式語義關聯:顯式關系以結構化邊直接存儲在圖中,隱式語義關聯則依托 SemanticMap 中的向量索引按需檢索并動態返回相似鄰居,從而避免預先枚舉和物化所有潛在語義邊。兩者相互關聯,在物理層面實現結構化語義圖的統一存儲視圖。

在此基礎上,Mandol 提供了一套原子化混合檢索算子,覆蓋記憶單元查詢、空間查詢、關系查詢和多跳查詢等操作,將向量匹配、圖遍歷等操作統一封裝為內存內的高效執行單元,顯著減少了異構存儲帶來的高 I/O 延遲。此外,活躍記憶層通過異步分頁機制連接嵌入式持久化后端 DuckDB,用于冷數據或長期存儲。



設計三:智能量化檢索機制 —— 在 Token 預算內構建高質量上下文

Mandol 將檢索任務重新定義為「在有限 Token 預算下構建高質量上下文」,并構建了無需大模型介入的量化檢索流程。

其核心方法是:首先通過查詢自適應的智能路由進行預算分配與多源并行召回(即根據查詢特征選取部分高階記憶和基礎記憶進行檢索),確保記憶信息的完整覆蓋;隨后對召回結果進行記憶源內部量化去噪與跨記憶源沖突消解,去除噪聲與冗余信息;最終在 Token 預算約束下完成上下文的精簡與生成,兼顧相關性與多樣性,從而在有限開銷內獲得高信息密度的證據上下文。



實驗:總體準確率領先,效率大幅提升,部署友好

研究團隊在 LoCoMo 和 LongMemEval 兩項長對話記憶評測基準上對 Mandol 進行了全面驗證。

在檢索質量上,以 GPT-4.1-mini 作為生成模型、GPT-4o-mini 作為評估模型的設置下,Mandol 在 LoCoMo 和 LongMemEval 上分別取得 92.21% 和 88.40% 的整體準確率,在所比較的代表性開源記憶系統中取得最優總體結果。尤其在多跳推理、時序推理與知識更新等復雜查詢類型上,Mandol 展現出較強優勢。

值得注意的是,即使采用更輕量的檢索后端模型(Qwen3-Embedding-0.6B 與 bge-reranker-v2-m3),Mandol 仍在總體準確率和多數關鍵任務上超過使用更大檢索模型的對比系統,同時將 Token 消耗降低了 17.4%–20.0%。這一結果說明,其性能增益主要來自記憶組織與檢索機制的結構性優勢,而非單純依賴更大規模的嵌入或重排序模型。



在系統性能方面,在 10 QPS 并發負載的服務器環境中(NVIDIA H800 GPU),Mandol 的平均檢索延遲僅為 82.2 ms,相比最快基線實現約 5.4 倍加速;平均記憶插入延遲為 39.7 ms,相比最快基線實現約 4.8 倍加速。

值得注意的是,在本地消費級設備(筆記本 NVIDIA RTX 5090)的補充實驗中,Mandol 的延遲仍低于現有系統,顯示出優異的本地部署潛力。這種顯著的效率優勢,根源在于其進程內內存原生架構徹底避免了數據庫往返和跨庫協調開銷。



在資源消耗上,Mandol 同樣表現良好。其內存占用適中,且因消除了對外部數據庫服務及其網絡通信的依賴,完成標準長對話負載的整體耗時僅為對比系統的 1/4.2 至 1/9.9,展現出良好的本地部署潛力。



結語

Mandol 通過凝聚式的分層記憶模型、內存原生統一存儲與智能量化檢索三項核心創新,為 Agent 提供了一個兼顧高精度、低延遲和輕量化部署的記憶系統解決方案。該系統已在 GitHub 開源,便于研究者復現、試用和進一步開發。得益于內存原生架構,Mandol 無需依賴外部數據庫服務,可在消費級設備上高效運行,為端側 Agent 的記憶管理提供了新的可能。

對于正在構建需要可靠長期記憶的對話 Agent、推薦 Agent 或陪伴 Agent 等的研究與工程團隊而言,Mandol 提供了一個兼具精度、性能和工程實用價值的選擇。

【ICML 2026首爾 · 云帆AI Talent Meetup】最后報名中,快來晚宴現場Pick你感興趣的同行者~

7月9日晚,首爾ICML會場旁,上海人工智能實驗室、上??萍即髮W、上海創智學院、階躍星辰、Sharpa Robotics等20余家上海頂尖AI單位現場設展,開放100+崗位。專場招聘、學術分享、圓桌交流、自由Networking、晚宴一站式搞定。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
穆帥眼光封神!1.5 億水貨世界杯現形,皇馬放棄直接避開大坑

穆帥眼光封神!1.5 億水貨世界杯現形,皇馬放棄直接避開大坑

奶蓋熊本熊
2026-07-05 03:12:46
俄羅斯陷“斷油”危機,普京承認燃油短缺,烏無人機持續打擊俄能源設施

俄羅斯陷“斷油”危機,普京承認燃油短缺,烏無人機持續打擊俄能源設施

網易新聞出品
2026-07-04 11:47:04
1-1,成都蓉城經典領先換前鋒,韋世豪成浪射王 海牛殘陣太頑強了

1-1,成都蓉城經典領先換前鋒,韋世豪成浪射王 海牛殘陣太頑強了

替補席看球
2026-07-05 21:01:56
王永珀現狀:現身世界杯,娶金融高材生妻子,今定居洛杉磯不回國

王永珀現狀:現身世界杯,娶金融高材生妻子,今定居洛杉磯不回國

老踲系戲精北鼻
2026-07-05 17:34:27
日本提高華人簽證費后,韓國宣布了!

日本提高華人簽證費后,韓國宣布了!

安安說
2026-07-04 11:33:48
京圈大佬集體全啞火,3 部大片累計虧超 5 億,觀眾憑啥買單?

京圈大佬集體全啞火,3 部大片累計虧超 5 億,觀眾憑啥買單?

知法而形
2026-07-01 23:22:31
1-1大冷門,中超第14逼平中超第1,楊聰救主,青島海牛2輪不敗

1-1大冷門,中超第14逼平中超第1,楊聰救主,青島海牛2輪不敗

側身凌空斬
2026-07-05 20:58:03
伊朗已故最高領袖哈梅內伊兒子現身葬禮

伊朗已故最高領袖哈梅內伊兒子現身葬禮

參考消息
2026-07-05 19:28:09
你買的什么車?后悔了嗎?網友:哈弗h6,感覺是家里得有礦才敢買

你買的什么車?后悔了嗎?網友:哈弗h6,感覺是家里得有礦才敢買

另子維愛讀史
2026-07-05 20:41:19
臺風黃色預警持續 “美莎克”帶來大暴雨、特大暴雨

臺風黃色預警持續 “美莎克”帶來大暴雨、特大暴雨

極目新聞
2026-07-05 07:00:59
浙江商人用23年時間,從身無分文的窮小子,成了佛得角總理、市長的座上賓!“我在贊助的足球俱樂部,就是沃齊尼亞曾經服役的那一家”

浙江商人用23年時間,從身無分文的窮小子,成了佛得角總理、市長的座上賓!“我在贊助的足球俱樂部,就是沃齊尼亞曾經服役的那一家”

都市快報橙柿互動
2026-07-04 22:02:53
給泰山安裝刀片刺網,在古代要被砍頭

給泰山安裝刀片刺網,在古代要被砍頭

黔有虎
2026-07-03 16:49:25
汽油已跌950元/噸后或繼續下調,下次7月17日調價,油價大降中

汽油已跌950元/噸后或繼續下調,下次7月17日調價,油價大降中

豬友巴巴
2026-07-05 14:30:05
中國走則萬物落!面對印尼的鎳礦收割,中企用21天拆除生產線回國

中國走則萬物落!面對印尼的鎳礦收割,中企用21天拆除生產線回國

老謝談史
2026-07-04 12:49:39
表現好也不能亂收禮 墨西哥全隊退還百萬美元名表

表現好也不能亂收禮 墨西哥全隊退還百萬美元名表

體壇周報
2026-07-05 22:00:11
知名感冒藥停產沖上熱搜!全國銷量暴跌55%,網友吵翻

知名感冒藥停產沖上熱搜!全國銷量暴跌55%,網友吵翻

21世紀經濟報道
2026-07-04 00:21:21
《特立獨行》3天票房倒掛,26位明星也撐不起,導演破防發長文

《特立獨行》3天票房倒掛,26位明星也撐不起,導演破防發長文

花語舞者
2026-07-05 14:15:35
特朗普再"玩"AI,將自己"刻"上土豪金總統山:我將是美國最偉大總統

特朗普再"玩"AI,將自己"刻"上土豪金總統山:我將是美國最偉大總統

靚仔情感
2026-07-05 21:14:32
肖戰這5部寶藏劇,部部好評如潮,每部都值得反復刷

肖戰這5部寶藏劇,部部好評如潮,每部都值得反復刷

小微看電影
2026-07-05 17:22:05
WTT美國大滿貫:男單4強出爐!日本世界冠軍1:4被淘汰,黑馬晉級

WTT美國大滿貫:男單4強出爐!日本世界冠軍1:4被淘汰,黑馬晉級

國乒二三事
2026-07-05 12:50:02
2026-07-05 23:36:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
13442文章數 142688關注度
往期回顧 全部

科技要聞

華為:邏輯折疊將大幅提升麒麟CPU核心頻率

頭條要聞

未獲明確同意民辦社康給女患者打激素 處罰決定書披露

頭條要聞

未獲明確同意民辦社康給女患者打激素 處罰決定書披露

體育要聞

姆巴佩點走巴拉圭:巴黎三代左鋒傳承

娛樂要聞

霉霉婚禮照片泄露 有四人違規

財經要聞

揭秘跨境“對敲”換匯黑產

汽車要聞

方程豹鈦9內飾曝光 用上了長聯屏設計/下半年上市

態度原創

教育
時尚
親子
旅游
手機

教育要聞

將牛拴在樹上繩長5米,每平米草重5斤,??沙詭捉锊菽?/h3>

3年賺46億,楊冪喊出一個安徽富豪

親子要聞

奉勸大家:超市里這5種食物少給孩子吃,看似有營養,實則沒好處

旅游要聞

佛得角爆紅掀旅游熱,從廣州出發機票搜索量飆升184倍

手機要聞

CMOS集體變「方」!不只是手機,所有影像硬件都要變了

無障礙瀏覽 進入關懷版