網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

超越單體智能｜多智能體系統(tǒng)的協(xié)作、歸因與自我演化綜述

2026-05-31 19:46:15　來(lái)源: 機(jī)器之心Pro

天津舉報(bào)

分享至

本文由西安交通大學(xué) MOE KLINNS Lab 聯(lián)合華中師范大學(xué)、聯(lián)想人工智能技術(shù)中心、悉尼大學(xué)等機(jī)構(gòu)的研究者共同完成。共同第一作者為齊世豪、馬杰、邢瑞、郭威、黃瀟，通訊作者為來(lái)自西安交通大學(xué)網(wǎng)絡(luò)空間安全學(xué)院的馬杰特聘研究員（副教授）。

過(guò)去兩年，AI 智能體正在從「會(huì)對(duì)話的模型」變成能夠理解任務(wù)、拆解步驟、調(diào)用工具、維護(hù)記憶并根據(jù)反饋調(diào)整行為的系統(tǒng)。當(dāng)任務(wù)復(fù)雜到單個(gè)智能體難以完成時(shí)，研究者開(kāi)始把多個(gè)智能體組織起來(lái)，讓它們分工協(xié)作。但系統(tǒng)規(guī)模擴(kuò)大后，問(wèn)題也隨之復(fù)雜。

任務(wù)失敗時(shí)，錯(cuò)誤可能來(lái)自智能體能力、角色分配、通信過(guò)程、工具調(diào)用，也可能在多輪交互中被逐步放大。更進(jìn)一步，系統(tǒng)能否根據(jù)失敗經(jīng)驗(yàn)調(diào)整角色、通信結(jié)構(gòu)或協(xié)作流程，仍是當(dāng)前研究面臨的重要問(wèn)題。

圍繞這些問(wèn)題，研究團(tuán)隊(duì)撰寫(xiě)了一篇系統(tǒng)綜述，面向 LLM 多智能體系統(tǒng)提供了一個(gè)完整的觀察框架：從單個(gè)智能體的能力基礎(chǔ)，到多智能體協(xié)作，再到系統(tǒng)失敗后的歸因，以及基于失敗經(jīng)驗(yàn)的自我演化。

論文標(biāo)題：Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems
論文鏈接： https://arxiv.org/abs/2605.14892
項(xiàng)目倉(cāng)庫(kù)： https://github.com/mira-ai-lab/awesome-mas-life

圖 1：LIFE 框架總覽圖

一、多智能體系統(tǒng)，不只是「多幾個(gè) Agent」

今天的 LLM 智能體，已經(jīng)不再是簡(jiǎn)單的輸入輸出模塊。圍繞大語(yǔ)言模型，研究者加入了推理、記憶、規(guī)劃、工具使用等機(jī)制，使其能夠理解任務(wù)、制定計(jì)劃、調(diào)用外部工具，并根據(jù)執(zhí)行結(jié)果調(diào)整后續(xù)動(dòng)作。這些能力構(gòu)成了多智能體系統(tǒng)的基礎(chǔ)。推理能力決定智能體能否處理復(fù)雜指令，記憶能力決定它能否利用歷史信息，規(guī)劃能力決定它能否拆解長(zhǎng)程任務(wù)，工具使用能力則決定它能否突破模型自身的知識(shí)和執(zhí)行邊界。

如果缺少穩(wěn)定的單體能力，多智能體協(xié)作很容易變成多個(gè)不穩(wěn)定模塊的疊加。協(xié)作并不會(huì)自動(dòng)帶來(lái)更強(qiáng)的智能，反而可能放大錯(cuò)誤、增加溝通成本，并讓系統(tǒng)表現(xiàn)更難預(yù)測(cè)。

圖 2：LLM-based Agent 的能力模塊示意圖

二、協(xié)作：讓智能體從個(gè)體走向組織

多智能體系統(tǒng)的核心首先是協(xié)作。

在現(xiàn)有研究中，協(xié)作機(jī)制通常圍繞角色、通信、調(diào)度和交互模式展開(kāi)。角色決定不同智能體的職責(zé)，通信決定信息如何在智能體之間流動(dòng)，調(diào)度決定任務(wù)如何推進(jìn)，交互模式則與具體任務(wù)密切相關(guān)。代碼生成、科學(xué)發(fā)現(xiàn)、網(wǎng)頁(yè)操作、復(fù)雜問(wèn)答、游戲環(huán)境，對(duì)協(xié)作方式的要求并不相同，很難依靠一種固定流程覆蓋所有場(chǎng)景。

這些設(shè)計(jì)讓智能體從「單點(diǎn)能力」進(jìn)入「組織能力」。它們不再只是各自輸出答案，而是通過(guò)分工、溝通和調(diào)度共同完成更復(fù)雜的目標(biāo)。與此同時(shí)，協(xié)作也會(huì)放大系統(tǒng)的不確定性。一個(gè)早期判斷可能影響后續(xù)分工，一次不完整的信息傳遞可能改變整個(gè)任務(wù)路徑，一個(gè)工具調(diào)用錯(cuò)誤也可能被后續(xù)智能體繼續(xù)引用。多智能體系統(tǒng)越像一個(gè)組織，就越需要理解組織內(nèi)部的問(wèn)題從何而來(lái)。

圖 3：多智能體協(xié)作中的角色、通信與調(diào)度結(jié)構(gòu)

三、歸因：理解失敗，而不只是記錄失敗

在單智能體系統(tǒng)中，失敗往往可以回到一個(gè)相對(duì)清晰的輸入輸出過(guò)程里分析。但在多智能體系統(tǒng)中，失敗很少只來(lái)自一個(gè)孤立步驟。一個(gè)早期錯(cuò)誤判斷可能影響后續(xù)任務(wù)分解，一次不準(zhǔn)確的工具調(diào)用也可能被后續(xù)智能體當(dāng)成可靠證據(jù)繼續(xù)使用。

因此，多智能體系統(tǒng)需要的不只是最終評(píng)測(cè)分?jǐn)?shù)，還需要對(duì)失敗過(guò)程的分析。故障歸因要追問(wèn)的是：失敗發(fā)生在哪個(gè)階段？涉及哪些智能體？錯(cuò)誤來(lái)自能力不足、角色設(shè)計(jì)、通信機(jī)制、調(diào)度策略，還是環(huán)境交互？錯(cuò)誤又是如何在系統(tǒng)內(nèi)部傳播的？

現(xiàn)有很多研究更關(guān)注如何構(gòu)造協(xié)作流程、如何提高最終性能，卻較少討論系統(tǒng)失敗之后如何診斷。但如果沒(méi)有歸因，多智能體系統(tǒng)的改進(jìn)就很容易變成盲目試錯(cuò)。系統(tǒng)表現(xiàn)不好，并不直接說(shuō)明應(yīng)該改模型、改提示詞、改角色分工、改通信協(xié)議，還是改整個(gè)組織結(jié)構(gòu)。在這篇綜述中，歸因被放在協(xié)作與演化之間，作用是把系統(tǒng)失敗轉(zhuǎn)化為可診斷、可修復(fù)的問(wèn)題。

圖 4：多智能體系統(tǒng)中的錯(cuò)誤傳播與故障歸因示意圖

四、自我演化：從修正輸出，到改進(jìn)系統(tǒng)

如果歸因關(guān)注「哪里出了問(wèn)題」，自我演化關(guān)注的則是「系統(tǒng)如何因此變得更好」。很多智能體系統(tǒng)已經(jīng)引入了反思機(jī)制：模型總結(jié)失敗原因，修改下一輪回答，或者調(diào)整提示詞。這類(lèi)方法有價(jià)值，但對(duì)于多智能體系統(tǒng)來(lái)說(shuō)還不夠。

因?yàn)槎嘀悄荏w系統(tǒng)的改進(jìn)對(duì)象不只是某個(gè)智能體的輸出，也可能是整個(gè)系統(tǒng)結(jié)構(gòu)。

Agentic Self-Evolution：面向單個(gè)智能體自身的演化，主要更新提示詞、記憶或參數(shù)等內(nèi)部組件，讓智能體在后續(xù)任務(wù)中表現(xiàn)得更穩(wěn)定。
Systemic Self-Evolution：面向多智能體系統(tǒng)內(nèi)部結(jié)構(gòu)的演化，關(guān)注通信拓?fù)洹⒅悄荏w組合、共享記憶等系統(tǒng)級(jí)組件，讓多個(gè)智能體之間的協(xié)作方式能夠隨任務(wù)和反饋調(diào)整。
Meta Self-Evolution：面向系統(tǒng)設(shè)計(jì)空間的演化，通過(guò)積累歷史設(shè)計(jì)經(jīng)驗(yàn)或訓(xùn)練生成器，自動(dòng)產(chǎn)生更適合不同任務(wù)的多智能體架構(gòu)。

這意味著，多智能體系統(tǒng)的自我演化并不只是「讓模型反思」一下。它更接近一種系統(tǒng)級(jí)調(diào)整：根據(jù)任務(wù)表現(xiàn)和失敗反饋，持續(xù)修改自身的行為、結(jié)構(gòu)和協(xié)作方式。

圖 5：從失敗歸因到系統(tǒng)自我演化的閉環(huán)

五、LIFE 框架：理解多智能體系統(tǒng)的完整生命周期

這篇綜述提出的 LIFE progression，可以理解為對(duì) LLM 多智能體系統(tǒng)運(yùn)行過(guò)程的一種梳理。它包含四個(gè)連續(xù)階段：

Individual Intelligence：個(gè)體智能，關(guān)注單個(gè)智能體的推理、記憶、規(guī)劃和工具使用能力；
Multi-Agent Collaboration：多智能體協(xié)作，關(guān)注角色、通信、調(diào)度和交互機(jī)制；
Failure Attribution：故障歸因，關(guān)注系統(tǒng)失敗后的定位、解釋和診斷；
Self-Evolution：自我演化，關(guān)注系統(tǒng)如何根據(jù)反饋持續(xù)調(diào)整自身。

以往綜述往往分別討論個(gè)體能力、多智能體協(xié)作或自我改進(jìn)。LIFE 框架則把這些方向放到同一個(gè)生命周期中觀察：個(gè)體能力提供協(xié)作基礎(chǔ)，協(xié)作機(jī)制帶來(lái)系統(tǒng)級(jí)復(fù)雜性，故障歸因讓失敗過(guò)程變得可分析，自我演化則把診斷結(jié)果轉(zhuǎn)化為后續(xù)改進(jìn)。

因此，LIFE 關(guān)注的不只是「有哪些方法」，而是一個(gè)多智能體系統(tǒng)如何運(yùn)行、如何失敗，以及如何在失敗之后調(diào)整。

六、未來(lái)展望

LLM 多智能體系統(tǒng)已經(jīng)展示出處理復(fù)雜任務(wù)的潛力，但要走向長(zhǎng)期可靠的應(yīng)用，仍需要在幾個(gè)關(guān)鍵方向上繼續(xù)推進(jìn)。

更全面的評(píng)測(cè)體系：現(xiàn)有評(píng)測(cè)仍然偏重任務(wù)成功率，而多智能體系統(tǒng)還需要考察通信效率、角色貢獻(xiàn)、錯(cuò)誤傳播、環(huán)境適應(yīng)性和長(zhǎng)期穩(wěn)定性。
更靈活的協(xié)作結(jié)構(gòu)：當(dāng)前很多系統(tǒng)仍依賴(lài)人工設(shè)定角色、流程和通信方式。未來(lái)的系統(tǒng)需要根據(jù)任務(wù)需求動(dòng)態(tài)調(diào)整組織方式，包括角色分配、通信路徑、調(diào)度策略和協(xié)作結(jié)構(gòu)。
更有效的歸因與修復(fù)閉環(huán)：多智能體系統(tǒng)的失敗往往跨越多個(gè)角色和多輪交互。歸因的價(jià)值不應(yīng)停留在解釋錯(cuò)誤，而應(yīng)進(jìn)一步指導(dǎo)系統(tǒng)修復(fù)，例如調(diào)整提示詞、重新分配角色、修改工具調(diào)用方式或優(yōu)化整體流程。
更可控的自我演化機(jī)制：當(dāng)系統(tǒng)開(kāi)始調(diào)整自身結(jié)構(gòu)時(shí)，效率、安全和對(duì)齊問(wèn)題會(huì)變得更加重要。未來(lái)的自我演化不能只是搜索更高性能的結(jié)構(gòu)，還需要在成本、穩(wěn)定性和可控性之間取得平衡。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.