網易首頁 > 網易號 > 正文 申請入駐

高效智能體幕后推手是誰?一篇綜述帶你從記憶×工具學習×規劃看透

0
分享至



隨著大模型能力的躍遷,業界關注點正在從 “模型能不能做” 快速轉向 “智能體能不能落地”。過去一年可以看到大量工作在提升智能體的有效性(effectiveness):如何讓它更聰明、更穩、更會用工具、更能完成復雜任務。

但在真實應用里,另一個更 “硬” 的問題常常決定能否上線:高效性(efficiency)。智能體即便表現很好,如果每次都要消耗大量算力、時間與調用成本,也很難在生產環境大規模部署。

基于這一視角,論文整理并撰寫了一篇面向 “高效智能體” 的綜述,系統梳理當前主要方法,并從三個最關鍵的機制出發組織全文框架:記憶 — 工具學習 — 規劃。論文從設計范式出發對代表性方法進行歸納總結,聚焦那些以效率為目標或能夠提升效率的核心設計與實現路徑,從而更清晰地呈現智能體在真實落地場景中的成本 — 性能權衡。



  • 論文地址:https://arxiv.org/abs/2601.14192
  • GitHub 地址:https://github.com/yxf203/Awesome-Efficient-Agents



一、智能體記憶:

讓 “會記” 更省、更準、更可擴展



智能體要做長任務,離不開記憶。但把歷史一股腦塞進提示詞,會帶來 token 暴漲和智能體處理長上下文能力下降。因此,高效記憶系統的關鍵在于把 “長歷史” 加工成 “可用、可檢索、可復用” 的信息資產。

論文按記憶生命周期梳理三步:構建 — 管理 — 訪問。

  • 記憶構建:通過概括、壓縮與結構化把 “長對話” 轉成 “可用記憶”。一類是留在推理鏈路的工作記憶,文本式直觀但吃上下文,隱式式更像緩存,可減少重復編碼;另一類是外置為可檢索系統的外部記憶,先將信息壓成小單元再按需召回,包括條目式、圖式與分層式。此外論文也提到要警惕過度壓縮帶來的信息損失,即需要考慮如何在降成本與保真之間取得平衡。
  • 記憶管理:防止 “存爆炸”,也避免 “取太慢”。規則式快但可能誤刪重要內容,大模型式更聰明但更貴,混合式則按層級或場景組合兩者策略,在效果與成本之間取得折中。
  • 記憶訪問:選什么 + 怎么用。訪問分記憶選擇與記憶整合,通過檢索或訓練等方式挑選記憶,再用壓縮過濾或隱式注入減少 token 與重復編碼。

另外,多智能體記憶也成為新趨勢。相較于只靠通信,近年更多工作開始引入 “記憶” 這一概念來支撐規模化協作,論文將其概括為:共享記憶 / 本地記憶 / 混合記憶三類。

二、工具學習:

讓 “會用工具” 更少調用、更少等待、更少走彎路



工具讓智能體從 “會說” 變成 “能做”,但成本也最容易在工具鏈路里失控。論文按三條主線梳理提效思路:工具選擇 — 工具調用 — 工具融合推理。

  • 工具選擇:目標是 “更快選對、少塞進 prompt”。相關方法包括外部檢索器、多標簽分類,以及將工具映射為特殊 token 等思路,核心都是在大量工具中更快、更準地選出最需要的那幾個。
  • 工具調用:核心是 “少等、少調、少走彎路”。典型路線包括邊生成邊調用、并行化調用,以及利用成本感知調用與測試時高效擴展來削減冗余調用;進一步還可通過面向效率的后訓練把 “短軌跡、少調用” 寫進策略本身。
  • 工具融合推理:讓模型學會 “該不該用、何時用、用幾次”。代表性方向包括選擇性調用,引導智能體只在必要時才發起工具調用;以及成本約束策略優化,在保證效果的同時對冗余交互與過長軌跡施加懲罰,從而學到更短、更省的工具使用策略。

三、智能體規劃:

在 “深度” 與 “寬度” 上同時省下來



規劃決定智能體如何在多步決策空間里行動。效率問題要么來自單體推理 “想太深、搜太貴”,要么來自多體協作 “聊太多、通信太重”。因此論文從兩條線展開:單智能體規劃與多智能體協作規劃。



四、基準與評測(Benchmark):

沒有 “可比的尺”,就談不上 “可落地的效率”

在談記憶、工具學習與規劃的提效方案之前,先要把 “尺子” 定清楚:高效到底怎么量?

論文強調,效率必須建立在有效性之上。省了資源卻顯著掉性能,不算高效。因此論文采用的定義是:在給定預算下取得更好的效果,或在相近效果下消耗更少資源。

基于這一視角,論文先梳理了以有效性為主的 benchmark,并進一步匯總了與效率相關的評測內容:一方面,整理了在 benchmark 中顯式納入效率信號(成本、延遲、調用次數等)的評測設置;另一方面,總結了智能體方法中常用的效率指標,用于刻畫 “省在哪兒、省多少”。

五、挑戰與展望

論文同時也提出了目前的一些挑戰與展望:

1)統一評測框架:指標口徑統一,模塊開銷邊界清楚,才能真正讓各個智能體方法可比可復現。

2)智能體的隱式推理(Latent Reasoning):大模型側的隱式推理正在升溫,但面向智能體的研究仍相對稀缺。由于智能體鏈路更長、更復雜,還要處理工具調用、規劃與記憶等環節,如何把中間推理 “做在隱式空間里”、在不掉效果的前提下降低成本,既是挑戰,也是機會。

3)面向部署設計:在多智能體場景下,需要把部署成本納入考量,核心問題是投入產出比。也就是說,增加智能體帶來的收益,是否足以覆蓋新增的開銷。

4)多模態效率:多模態智能體發展很快,但效率研究仍相對欠缺。文本智能體的一些提效思路可以借鑒,但是直接遷移卻并不容易,因為多模態智能體的感知輸入、行為空間與任務結構更復雜、交互成本更高。因此,如何在多模態場景下系統地兼顧效果與成本,仍是亟待解決的關鍵問題。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
2013年,江青拍攝的照片以34萬元的高價拍出,毛澤東曾稱贊并題詞

2013年,江青拍攝的照片以34萬元的高價拍出,毛澤東曾稱贊并題詞

南書房
2026-04-21 07:25:06
為鼓勵大學畢業生回爐讀技校,北京推出全日制大學生技師班

為鼓勵大學畢業生回爐讀技校,北京推出全日制大學生技師班

映射生活的身影
2026-04-21 12:57:40
A股:今天突破4100了,做好準備,明天周四行情分析!

A股:今天突破4100了,做好準備,明天周四行情分析!

明心
2026-04-22 15:17:44
AI時代的豪華汽車該是什么樣子?從魏牌V9X上或許能看到答案

AI時代的豪華汽車該是什么樣子?從魏牌V9X上或許能看到答案

大眾侃車
2026-04-22 17:11:49
被藍莓騙了!真正的花青素大戶,其實就是這5種,幾元錢的東西!

被藍莓騙了!真正的花青素大戶,其實就是這5種,幾元錢的東西!

椰青美食分享
2026-04-22 08:44:44
唐伯虎真跡現身美國,世上僅此一件,網友:讓當代書家汗顏

唐伯虎真跡現身美國,世上僅此一件,網友:讓當代書家汗顏

幸福娃3790
2025-12-04 11:10:09
美軍扣船不到48小時,中美在安理會大吵一架,孫磊對各國作出表率

美軍扣船不到48小時,中美在安理會大吵一架,孫磊對各國作出表率

基斯默默
2026-04-22 10:19:14
CBA常規賽大結局!最后一輪這7支球隊輸球就變天,遼寧也不例外

CBA常規賽大結局!最后一輪這7支球隊輸球就變天,遼寧也不例外

寒律
2026-04-22 16:39:29
美國悔得腸子都青了,開戰前美國還是世界霸主,現在地位不保了

美國悔得腸子都青了,開戰前美國還是世界霸主,現在地位不保了

起喜電影
2026-04-22 08:13:00
老了才明白:父母一旦超過80歲,立刻停止幾種行為,否則晚景凄涼

老了才明白:父母一旦超過80歲,立刻停止幾種行為,否則晚景凄涼

觀星賞月
2026-04-22 16:11:38
越來越清晰:只剩革命衛隊問題還沒解決,未來會被內外聯合絞殺嗎

越來越清晰:只剩革命衛隊問題還沒解決,未來會被內外聯合絞殺嗎

民間胡扯老哥
2026-04-21 05:45:15
取消午休,改成16點下班,你愿意嗎?網友吵翻!

取消午休,改成16點下班,你愿意嗎?網友吵翻!

深圳晚報
2026-04-21 22:55:30
央國企的幾大亂象:關系戶橫行、巨大的虛假繁榮......

央國企的幾大亂象:關系戶橫行、巨大的虛假繁榮......

燈錦年
2026-04-22 17:16:25
王近山不經請示干掉日本戰地觀戰團,毛主席:早就聽說有個王瘋子

王近山不經請示干掉日本戰地觀戰團,毛主席:早就聽說有個王瘋子

鶴羽說個事
2026-04-20 22:56:36
大快人心!張敬軒復出泡湯,霍汶希被拖下水,英皇如坐針氈

大快人心!張敬軒復出泡湯,霍汶希被拖下水,英皇如坐針氈

一盅情懷
2026-04-21 19:20:32
萊斯特城跌入第三級別聯賽,但十年前上演童話的主角們將重聚

萊斯特城跌入第三級別聯賽,但十年前上演童話的主角們將重聚

仰臥撐FTUer
2026-04-22 18:16:13
特斯拉 Model Y 新版本現身!值得期待

特斯拉 Model Y 新版本現身!值得期待

花果科技
2026-04-22 15:35:37
劉少奇位次何以反超周恩來?長征殘兵營里死守一張底牌

劉少奇位次何以反超周恩來?長征殘兵營里死守一張底牌

人生錄
2026-04-21 20:24:11
趙心童即便衛冕成功也成不了世界第1!特魯姆普:大熱必死你小心

趙心童即便衛冕成功也成不了世界第1!特魯姆普:大熱必死你小心

風過鄉
2026-04-22 13:16:46
凱倫.威爾遜:“今年的斯諾克世錦賽冠軍將在這4位球員中出現、也包括我自己”

凱倫.威爾遜:“今年的斯諾克世錦賽冠軍將在這4位球員中出現、也包括我自己”

寒律
2026-04-22 15:18:30
2026-04-22 19:23:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12831文章數 142633關注度
往期回顧 全部

科技要聞

對話梅濤:沒有視頻底座,具身智能走不遠

頭條要聞

三甲醫院科主任被舉報"巨額財產來源不明" 舉報人發聲

頭條要聞

三甲醫院科主任被舉報"巨額財產來源不明" 舉報人發聲

體育要聞

網易傳媒再度簽約法國隊和阿根廷隊

娛樂要聞

復婚無望!baby黃曉明陪小海綿零交流

財經要聞

伊朗拒絕出席 特朗普宣布延長停火期限

汽車要聞

純電續航301km+激光雷達 宋Pro DM-i飛馳版9.99萬起

態度原創

房產
本地
數碼
家居
手機

房產要聞

狂搶284輪!中海海口再拿重磅宅地!

本地新聞

春色滿城關不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

數碼要聞

Beats發布3米USB-C數據線:售229元 最高240W快充

家居要聞

極簡繪夢 克制和諧

手機要聞

小米澎湃OS 3 Beta版推送“龍蝦”智能體Xiaomi miclaw

無障礙瀏覽 進入關懷版