網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

RouteMoA：無需預推理的動態路由，實現高效多智能體混合

2026-05-05 15:04:19　來源: 機器之心Pro

河北舉報

0

分享至

本篇論文已被 ACL 2026 接收，主要作者來自上海交通大學自動化與感知學院 IWIN 中心團隊。團隊負責人為關新平教授，指導老師為陳彩蓮教授和樂心怡教授，合作作者還包括南洋理工大學陶大程教授。其他作者來自騰訊、上海人工智能實驗室、香港中文大學等機構。第一作者王驥澤為上海交通大學博士生，研究方向為大模型智能體。

近年來，大語言模型的發展，正在從 “單模型能力提升” 走向 “多模型協作”。這是一個很自然的方向：既然不同模型各有所長，有的擅長數學，有的擅長代碼，有的更懂醫學，那為什么不讓它們協同起來，共同解決更復雜的問題？

Mixture-of-Agents（MoA）正是在這樣的背景下提出的。它通過讓多個模型并行生成、逐層交互、反復融合，往往能夠得到比單一模型更強的結果。問題也很明顯：性能提升的同時，成本和延遲也隨之迅速上升。

在標準 MoA 中，每一輪通常都要調用多個模型，再基于它們的輸出進行篩選和融合。但究竟該讓哪些模型參與、哪些模型可以跳過，往往缺乏明確的選擇機制。模型越多、層數越深，整體開銷就越高，在大規模模型池場景下，系統效率和可擴展性都會面臨很大挑戰。

也正因如此，研究者開始嘗試讓 MoA 變稀疏。例如，一些方法如 Sparse MoA 會先讓模型池中的所有模型生成回答，再通過額外的評審模型進行打分和篩選，只保留一部分模型進入后續協作。這樣雖然減少了后續融合的負擔，但本質上仍然繞不開一個問題：為了決定該選誰，系統還是得先讓所有模型都推理一遍。

于是，這篇工作的核心問題就變得非常直接：我們真的需要先讓所有模型都回答一遍，才能決定該選誰嗎？

論文標題：RouteMoA: Dynamic Routing without Pre-Inference Boosts Efficient Mixture-of-Agents
論文鏈接：https://arxiv.org/abs/2601.18130
代碼鏈接：https://github.com/Jize-W/RouteMoA

一句話總結：RouteMoA 的核心思想是，通過在推理前進行模型能力預測，避免對所有模型進行無效推理。

現有方法的問題：

效率瓶頸不在融合，而在全量推理

當前 MoA 系列方法的一個共同假設是：要判斷哪個模型更好，必須先看到它的輸出。因此，無論是經典 MoA，還是引入 judge 的 Sparse MoA，本質上都繞不開一個步驟：所有模型先推理 -> 再篩選 -> 再融合。

這帶來兩個問題：

第一，計算成本無法下降。即使最后只用少數模型，前面已經為所有模型付出了推理代價。

第二，難以擴展到大模型池。當模型數量增加時，全量推理會迅速變得不可承受，甚至超出上下文限制。

也就是說，瓶頸并不在 “如何選”，而在 “選之前已經太貴了”。

RouteMoA：

把 “選模型” 前移到推理之前

RouteMoA 的關鍵創新，是把模型選擇從 “后驗判斷” 變成 “先驗預測 + 輕量修正”。

整個流程可以分為三個步驟：

1. 先驗篩選：不推理，也能判斷誰更可能做對

RouteMoA 引入了一個輕量級 scorer，只根據用戶 query，就預測每個模型的潛在表現。這個過程不需要調用大模型推理，只做一個粗粒度打分，把模型池縮小到一個潛力子集。本質上，這是在做一件過去被忽略的事情：用 query 本身的信息，提前判斷模型能力匹配度。

2. 后驗修正：用已有輸出做低成本評審

初篩不可避免會有誤差，因此 RouteMoA 引入了 mixture-of-judges：

self-assessment：模型對自己的答案打分
cross-assessment：高質量模型評估其他模型

關鍵在于：這些評估只基于已經生成的輸出，不引入額外推理調用。也就是說，系統通過已有信息進行糾錯，而不是再算一輪。

3. 綜合排序：性能、成本、延遲一起優化

最終，RouteMoA 在模型選擇時不僅僅考慮性能，而是同時考慮：

輸出質量
token 成本
推理延遲

從而在實際系統中實現一個更接近工程最優的決策，而不是單純追求 accuracy。

實驗結果：

少花 90% 的錢，反而更強

在包含 15 個模型的大規模模型池實驗中，RouteMoA 的結果非常直觀：

成本降低 89.8%
延遲降低 63.6%
同時整體準確率相對 MoA 和 SMoA 有所提升

這說明一件事：減少無效計算，不僅不會傷害性能，反而會讓系統更專注于對的模型。

一個關鍵洞察：

多模型系統的本質是稀疏的

論文中一個非常重要的觀察是：在絕大多數 query 上，真正關鍵的模型只占少數。只要初始階段能把這些模型保留下來，后續協作就足以放大正確答案。實驗中，scorer 在 Top-3 內命中正確模型的概率接近 98%，這意味著：系統并不需要看所有答案，只需要別漏掉對的模型。

進一步分析：

失敗不在選錯模型，而在融合階段

一個很有意思的發現是，在失敗案例中：

超過 50% 的錯誤來自最終答案融合（aggregation drift）
而真正因為選錯模型的比例要低得多

可見，多模型系統的瓶頸正在發生轉移：從 “選誰來回答”，轉向 “如何整合多個答案”。

總結：多模型時代，調度很重要

RouteMoA 的意義，并不只是一個更高效的 MoA 變體，而是提供了一種新的范式：

不再默認所有模型都要參與
而是先判斷誰值得參與
再用協作機制校正和放大正確答案

換句話說，隨著多模型協作的興起，系統層的調度與協同，正變得與模型能力同樣重要。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

對話孫天澍：AI時代，企業家要從“管人”到“架構智能體”

經濟觀察報 2026-05-05 11:17:25
4 跟貼 4
時隔兩周中國AI大模型周調用量再超美國，騰訊Hy3 preview (free)位居榜首，DeepSeek-V4-Flash上榜環比增344%

每日經濟新聞 2026-05-04 10:04:06
82 跟貼 82

強化學習的進化：從PPO到MaxRL，LLM推理訓練的算法演進史

機器之心Pro 2026-05-05 14:16:31
0 跟貼 0

Anthropic聯創定下deadline：2028年AI實現自我進化，沒有人類了

機器之心Pro 2026-05-05 15:18:37
1 跟貼 1
700多個「壞模型」喂出AI測謊儀？Anthropic審計神器讓AI自曝黑料

新智元 2026-05-05 13:16:24
0 跟貼 0

ACL 2026｜AI for聾啞群體，港理工開源思考型手語翻譯模型

機器之心Pro 2026-05-05 15:22:29
0 跟貼 0

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
由豆包付費想到，AI到底會長成一門什么生意

鈦媒體APP 2026-05-05 17:33:14
0 跟貼 0

大模型API的大眾點評來了：7×24小時實測，毫秒級延遲智能路由

量子位 2026-02-02 11:48:44
2 跟貼 2
世界模型讓智能體預知未來？這篇新范式研究給了一個反直覺的答案

機器之心Pro 2026-05-05 15:17:00
0 跟貼 0
“DeepSeek版Claude Code”，Github 2.3k星

量子位 2026-05-04 14:03:17
15 跟貼 15
男子上一秒還在質疑導航的準確性，下一秒拐彎后瞬間相信了

南陽日報 2026-05-04 19:41:02
233 跟貼 233
領導執迷不悟對實驗走火入魔，結果毀了一座城

影中見影 2026-05-03 00:00:00
0 跟貼 0
莫氏雞煲上線湯料包5分鐘售罄4000多份，累計賣出4萬多份，總銷售額破160萬元，記者實測：1分鐘搶到兩包

極目新聞 2026-05-04 09:46:46
8264 跟貼 8264
工程師擴到100人，代碼能跑，人卻崩了

我是一個粉刷匠2 2026-05-05 09:58:46
0 跟貼 0
CMU開源首份Agentic Search日志數據，把Agent拆開給你看

機器之心Pro 2026-02-09 12:05:13
0 跟貼 0
GIM和港大這篇ACL主會，把量化因子挖掘重做了一遍

機器之心Pro 2026-05-05 14:21:56
0 跟貼 0
景區裝電梯無痛爬山被質疑過度開發

極目新聞 2026-05-02 17:18:12
4162 跟貼 4162
時光服圣騎士新技能解讀，史詩級爆發，歷史上竟然有相似機制

一起玩魔獸硬核哥 2026-05-03 22:49:35
0 跟貼 0
第三種古文字消失三千年，為何比埃及象形文字更先進？

灰度測試中 2026-05-05 09:48:44
0 跟貼 0
媒體：霍爾木茲海峽一聲驚雷炸響戰爭的引信已經點燃

國是直通車 2026-05-04 21:08:48
29 跟貼 29
寫給女兒的話：能被用上的才是好建議

時光慢郵啊 2026-05-04 12:24:47
0 跟貼 0
“張雪機車”車隊：核心目標是沖擊年度總冠軍

央視新聞客戶端 2026-05-04 20:13:33
842 跟貼 842
中國人和美國人的大腦差異，比人類和尼安德特人的還要大

萬物雜志 2026-05-05 06:35:02
3 跟貼 3
彩彈瘋狂浪費非失誤，實戰裝填機制暗藏原因

暖陽喵 2026-05-03 11:06:13
1 跟貼 1
帥化民說，季麟連話糙理不糙。鄭麗文的決策是正確的

行者服不服 2026-05-03 03:41:40
0 跟貼 0
監控下的一幕，真正的彪悍不要辯解，最好的決策來自快速出手

搞怪趣星球 2026-05-05 08:55:53
1 跟貼 1
實探鄭州中牟蒜地：免費抽蒜薹持續近一個月，有人從海南專程來，農戶提供午餐

環球網資訊 2026-05-05 09:36:24
474 跟貼 474
玻璃硬盤光谷量產！2毫米厚，可存儲2.5萬部高清電影

極目新聞 2026-05-04 23:00:07
153 跟貼 153
深圳樓市，咨詢量爆了

南方都市報 2026-05-05 11:04:16
1778 跟貼 1778
這絕對是最逆天的匹配機制了

谷谷追劇人 2026-05-05 11:17:24
1 跟貼 1
俄羅斯宣布與烏克蘭實施勝利日�；�

財聯社 2026-05-05 09:57:03
2057 跟貼 2057
費爾頓說詹姆斯不如科比？這不重要！詹姆斯和喬丹才能爭GOAT！

歷史第一人梅西 2026-05-05 14:41:18
5 跟貼 5
5月5日5點55分，GPT-5.5自己選客人開派對！Codex反超Claude Code

新智元 2026-05-05 17:07:29
0 跟貼 0
科學老師帶三年級學生組裝并發射火箭模型，檢驗課堂成果

星視頻 2026-05-03 10:46:21
0 跟貼 0
五一假期，多地升級版政府食堂獲點贊

澎湃新聞 2026-05-04 22:16:20
107 跟貼 107
無人售貨機的幕后，原來是人工幫忙算賬，網友：原來這就是人工智能

星沙時報 2026-05-05 11:26:17
0 跟貼 0
國乒女團3-1戰勝波蘭隊晉級16強

央視新聞 2026-05-04 21:20:32
449 跟貼 449
一個詞的戰場：China背后藏著多少認知博弈

爬蟲飼養員 2026-05-05 00:00:51
0 跟貼 0
委員建議取消學術不端人員教職或學位，如何評價這一建議？可行性如何？

卷阿 2026-05-05 06:32:11
0 跟貼 0

記者：哈登和火箭過去幾年一直有意重聚，兩次機會最終均未達成

記者：哈登和火箭過去幾年一直有意重聚，兩次機會最終均未達成

懂球帝

2026-05-05 12:16:06

1998年數萬華人遭屠殺，中國為何沒出兵？26年后答案讓人沉默

1998年數萬華人遭屠殺，中國為何沒出兵？26年后答案讓人沉默

哄動一時啊

2026-02-17 22:21:25

擊中俄軍導彈艦，空襲莫斯科！“勝利日停火”測試美烏關系

擊中俄軍導彈艦，空襲莫斯科！“勝利日�；稹睖y試美烏關系

鷹眼Defence

2026-05-04 18:17:10

林徽因落選的國徽方案，網友看后感嘆：審美確實厲害，但真不合適

林徽因落選的國徽方案，網友看后感嘆：審美確實厲害，但真不合適

浩渺青史

2026-04-17 13:55:15

為什么國家不關掉網絡游戲？網友評論：真相看完一身冷汗！

為什么國家不關掉網絡游戲？網友評論：真相看完一身冷汗！

夜深愛雜談

2026-03-17 22:10:59

查爾斯三世呼吁反對孤立主義堅決支持烏克蘭對抗俄羅斯

查爾斯三世呼吁反對孤立主義堅決支持烏克蘭對抗俄羅斯

世界探索發現

2026-05-02 21:17:58

體壇：徐正源在鐵人待遇遠低于成都時期；沈陽將建設專業球場

體壇：徐正源在鐵人待遇遠低于成都時期；沈陽將建設專業球場

懂球帝

2026-05-05 14:00:08

首個寒門冠軍！吳宜澤成名路：父親賣房打三份工，跟趙心童大不同

首個寒門冠軍！吳宜澤成名路：父親賣房打三份工，跟趙心童大不同

小潌拍客在北漂

2026-05-05 14:27:41

5.5世乒賽國乒陣容目的明確：王楚欽一單，梁靖崑二單林詩棟三單

5.5世乒賽國乒陣容目的明確：王楚欽一單，梁靖崑二單林詩棟三單

郝小小看體育

2026-05-05 17:06:29

臺灣終于等來同心領頭人！兩岸統一大勢，誰也擋不�。�

臺灣終于等來同心領頭人！兩岸統一大勢，誰也擋不��！

故事終將光明磊落

2026-05-04 11:01:41

浙大研究：阿爾茲海默癥早期不是記性差，而是身上6表現，需注意

浙大研究：阿爾茲海默癥早期不是記性差，而是身上6表現，需注意

墜入二次元的海洋

2026-05-05 15:07:41

漫展女生穿裙子躺地上被男生圍觀拍攝，網友忍不住為小黃魚喊冤

漫展女生穿裙子躺地上被男生圍觀拍攝，網友忍不住為小黃魚喊冤

映射生活的身影

2026-05-04 21:04:08

美軍在霍爾木茲護航？只是在安全水域指路！美油企賺歡：單日出口量創520萬桶歷史新高

美軍在霍爾木茲護航？只是在安全水域指路！美油企賺歡：單日出口量創520萬桶歷史新高

紅星新聞

2026-05-04 18:35:19

大特務毛人鳳子女現狀：長子是富士康董事長，三子是著名愛國華僑

大特務毛人鳳子女現狀：長子是富士康董事長，三子是著名愛國華僑

史之銘

2026-05-02 22:37:25

曼聯名宿：簽33歲爭議中場，比砸錢新星更值

曼聯名宿：簽33歲爭議中場，比砸錢新星更值

賽場名場面

2026-05-05 16:35:30

我絕經后第七年見紅，老伴含淚騙我說小問題，結果是虛驚一場

我絕經后第七年見紅，老伴含淚騙我說小問題，結果是虛驚一場

曉艾故事匯

2026-04-27 08:29:53

謝幕！5月2日，吳京《鏢人》8萬，張藝謀《驚蟄》4萬，下映吧！

謝幕！5月2日，吳京《鏢人》8萬，張藝謀《驚蟄》4萬，下映吧！

另子維愛讀史

2026-05-03 10:34:35

美媒看好雷霆，斯瑪特談亞歷山大直言不諱！湖人想勝，3點成關鍵

美媒看好雷霆，斯瑪特談亞歷山大直言不諱！湖人想勝，3點成關鍵

魚崖大話籃球

2026-05-05 14:09:40

38歲老板娘淪為陪睡工具：揭秘黑茶高端騙局，入局者10有9個離婚

38歲老板娘淪為陪睡工具：揭秘黑茶高端騙局，入局者10有9個離婚

云景侃記

2026-02-12 22:21:30

世錦賽落幕！誕生4個贏家+3個輸家，吳宜澤、趙心童、墨菲全在列

世錦賽落幕！誕生4個贏家+3個輸家，吳宜澤、趙心童、墨菲全在列

侃球熊弟

2026-05-05 05:52:45

機器之心Pro

專業的人工智能媒體

12917文章數 142642關注度

往期回顧全部

科技要聞

傳蘋果考慮讓英特爾、三星代工設備處理器

頭條要聞

四川一企業盜采河水作飲用水售賣十年當地回應

頭條要聞

四川一企業盜采河水作飲用水售賣十年當地回應

體育要聞

全世界都等著看他笑話，他帶國米拿下冠軍

娛樂要聞

英皇25周年演唱會張敬軒被救護車拉走

財經要聞

瀏陽煙花往事

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

時尚

親子

游戲

數碼

本地新聞

用青花瓷的方式，打開西溪濕地

夏天最經典的銀色，貴氣十足！

親子要聞

千萬別讓孩子養成這4個壞毛病

“百萬元”買不到國產大作的廁所!玩家:美少女不需要

數碼要聞

消息稱聯想旗下摩托羅拉“高端定位1.5K LCD面板”擱淺

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版