无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Hermes新功能上線!比Opus 4.8和GPT-5.5還猛

0
分享至


AI應用風向標(ZhidxcomAI)
作者|畢偉豪
編輯|漠影

智東西6月30日報道,現(xiàn)在,F(xiàn)able 5和Mythos 5等頂尖閉源模型沒法使用,就算能用,單一模型也總有搞不定的問題,那么,想要高質(zhì)量輸出結果的用戶該怎么辦呢

近日,Hermes Agent上線了MoA(Mixture of Agents)功能,支持用戶自由組合多種模型作為虛擬模型使用,在Nous Research即將發(fā)布的基準測試中,這個混合模型的評分超過了Opus 4.8 和GPT-5.5


一、Fable 5、Mythos 5被禁,多模型組合成為潮流

Nous Research在官推上說了這樣一句話:“最強大的模型是受限的,只有少數(shù)人才能獲得訪問權限。”這句話明晃晃地指向了Fable 5等模型被封禁的事件。


在這種背景下,不難看出,MoA這個混合模型模式的終極目的,是用開源模型的組合達到頂尖閉源模型的水準,就像Hermes Agent聯(lián)合創(chuàng)始人Teknium說的,他們正在測試各種開源模型組合,看看是否能用更便宜的模型達到Opus的水平。

這種多模型組合比肩頂尖模型的思路,最近其實有不少實踐的例子,比如前段時間日本AI獨角獸Sakana AI發(fā)布的Sakana Fugu系列編排器模型,會根據(jù)任務選擇最佳的模型來處理,和MoA的思路非常相似。


而MoA的技術也在很久之前就已存在了,2024年6月Together AI曾發(fā)表過一篇論文《Mixture-of-Agents Enhances Large Language Model Capabilities》,核心是多LLM組合,每一層模型都會參考上一層模型的輸出,再繼續(xù)生成自己的回答。同時,論文也將模型分成了兩類,也就是現(xiàn)在Hermes所用的參考模型和聚合模型。


當用戶提出問題時,參考模型會先對問題進行分析判斷,然后給出參考意見,隨后由聚合模型來綜合判斷,并調(diào)用工具執(zhí)行具體任務。

參考模型只生成意見、不會使用任何工具,也不能執(zhí)行任何命令。這種模式可以發(fā)揮不同模型的獨特優(yōu)勢,集各家之所長,讓擅長規(guī)劃的模型來提意見,讓長于實踐的模型來完成任務。

使用這個模式也很簡單,以桌面版為例,只需要在設置里點開模型選項,向下翻就可以看到Mixture of Agents的選項了,直接選擇你想用的模型進行組合即可,默認狀態(tài)下是兩個參考模型和一個聚合模型,也可以自己手動添加多個參考模型。


二、實測做游戲更絲滑,Token消耗量相差不大

海外有博主專門做了實測,用兩種組合方式分別生成了游戲和交互頁面,實測結果發(fā)現(xiàn),使用MoA任務完成的時間并不一定會變長,會因為模型選擇的不同而發(fā)生變化,同時,Token的消耗量也沒有想象中恐怖

博主先是測試了一個小游戲的制作,使用Three.js開發(fā)一個原力海盜訓練競技場游戲,為了對比效果,他先使用單一模型glm-5.2來做測試,輸入提示詞:


Hermes花費了0.38美元,用時13分鐘搞定了這個游戲,可以看到,單一glm-5.2模型生成的游戲效果整體上還不錯,但是在移動速度和流暢程度上存在一些問題,比如飛船很難躲避敵人的攻擊,可玩性稍弱。


隨后博主啟用了MoA,用kimi-k2.6和minimax-m3做參考模型,glm-5.2做聚合模型,然后新開對話,輸入同樣的提示詞。


這一次,Hermes花費了0.47美元,用時35分鐘完成任務,價格比單一模型稍高一些,時間上翻了接近三倍。雖然在時間和成本上更高,但MoA模式下的生成效果也明顯更好,可以看到其移動速度、流暢程度以及關卡合理性都比單一模型的輸出結果好很多。


隨后,博主又使用頂尖閉源模型GPT-5.5進行了測試,這一次是讓Hermes生成一個可交互的動漫多元宇宙儀表盤,包括火影忍者、海賊王、龍珠等IP。對照組依舊是單一模型,使用GPT-5.5執(zhí)行任務,由于是訂閱制,因此博主直言沒辦法核算成本。


Hermes用了接近7分鐘完成任務,設計的儀表盤中間的光球周圍的光圈有一些簡單,缺少質(zhì)感,但交互上非常流暢。


隨后博主用了三個grok模型做參考模型,GPT-5.5為聚合模型進行同樣的測試,令他意想不到的是,MoA模式下的Hermes生成速度竟然更快,博主推測可能是由于使用了grok快速模型的原因。


能看到這次的生成結果明顯更有質(zhì)感,尤其是中間的光球設計感很強,整體交互也非常絲滑,而且點擊不同的星球還有遠近景的切換。


結語:未來比拼的,不只是模型

過去,大模型競爭幾乎都是圍繞著“誰家的模型更強”展開的,用戶需要不斷切換不同模型,在編程、寫作、推理之間尋找最適合的那個。

但MoA、Sakana Fugu等已然在另一個思路上前進:與其等待一個“萬能模型”,不如讓多個擅長不同能力的模型共同完成一項任務

這種走向“編排”的趨勢,其實剛好符合Agent的要求,模型是底層能力,Agent負責組織不同模型協(xié)作,讓規(guī)劃能力強的模型負責思考,讓執(zhí)行能力強的模型負責落地

當然,目前MoA需要承擔更高的推理成本,在部分任務上耗時也會明顯增加,并不是所有場景都值得開啟。但隨著推理成本持續(xù)下降、開源模型能力不斷提升,多模型協(xié)作很可能會成為Agent未來的默認工作方式

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
微軟計劃裁員數(shù)千人,涉及銷售、咨詢、游戲部門

微軟計劃裁員數(shù)千人,涉及銷售、咨詢、游戲部門

澎湃新聞
2026-07-01 15:24:27
扎心了!“我生君未富”,一博主舉出大廠大量現(xiàn)實案例,評論沸騰

扎心了!“我生君未富”,一博主舉出大廠大量現(xiàn)實案例,評論沸騰

火山詩話
2026-06-30 05:52:05
NBA勇士隊重磅消息!3名主力球員做出3種選擇!

NBA勇士隊重磅消息!3名主力球員做出3種選擇!

林子說事
2026-07-01 00:29:48
49歲的她穿條睡褲去看球,竟把全場貴婦裝秒成了渣

49歲的她穿條睡褲去看球,竟把全場貴婦裝秒成了渣

娛圈觀察員
2026-07-01 00:54:24
還未開戰(zhàn)先引爆!中國男籃6月28日抵達沈陽,趙繼偉郭士強遭包圍,曾凡博傷情成謎

還未開戰(zhàn)先引爆!中國男籃6月28日抵達沈陽,趙繼偉郭士強遭包圍,曾凡博傷情成謎

生活新鮮市
2026-07-01 17:03:58
什么都敢吃的中國人,為什么唯獨不吃這三種動物?是真的不能吃?

什么都敢吃的中國人,為什么唯獨不吃這三種動物?是真的不能吃?

始于初見見
2026-06-29 17:26:34
中國已經(jīng)成為全球第一個集體拒接電話的國家

中國已經(jīng)成為全球第一個集體拒接電話的國家

黯泉
2026-06-26 10:44:35
心理學有個理論叫心理圍獵:故意激怒你的人,本質(zhì)從不是跟你過不去,而是逼你在情緒失控中亮出這兩個讓他拿捏你一輩子的把柄

心理學有個理論叫心理圍獵:故意激怒你的人,本質(zhì)從不是跟你過不去,而是逼你在情緒失控中亮出這兩個讓他拿捏你一輩子的把柄

心理觀察局
2026-07-01 08:52:03
內(nèi)斗加劇!中國第三刀反制落下,加速日財政崩盤,麻生布局后事

內(nèi)斗加劇!中國第三刀反制落下,加速日財政崩盤,麻生布局后事

照亮你的前行之路
2026-07-01 07:16:58
每年奪命近100萬!比蛇毒還陰的”世界第一毒“,無數(shù)人深受其害

每年奪命近100萬!比蛇毒還陰的”世界第一毒“,無數(shù)人深受其害

混沌錄
2026-06-29 17:05:32
德國放棄后,英國也取消萬噸驅(qū)逐艦采購計劃

德國放棄后,英國也取消萬噸驅(qū)逐艦采購計劃

環(huán)球時報國際
2026-07-01 07:43:55
重慶市一位副廳級官員領刑16年,因重病獲準監(jiān)外執(zhí)行

重慶市一位副廳級官員領刑16年,因重病獲準監(jiān)外執(zhí)行

黃桷樹財經(jīng)
2026-07-01 08:45:50
51歲TVB患癌女星于睡夢中離世,她曾自曝被騙光積蓄,為治療賣掉出嫁金器

51歲TVB患癌女星于睡夢中離世,她曾自曝被騙光積蓄,為治療賣掉出嫁金器

紅星新聞
2026-06-09 14:08:38
第1天,13人簽約,1換7!湖人大地震

第1天,13人簽約,1換7!湖人大地震

體育新角度
2026-07-01 15:55:30
狀態(tài)封神!奪冠大勢已定?僅四支勁旅可攔法國世界杯登頂之路!

狀態(tài)封神!奪冠大勢已定?僅四支勁旅可攔法國世界杯登頂之路!

田先生籃球
2026-07-01 09:21:37
一場白玉蘭慶功宴,楊紫在內(nèi)娛江湖地位人情冷暖,展現(xiàn)得淋漓盡致

一場白玉蘭慶功宴,楊紫在內(nèi)娛江湖地位人情冷暖,展現(xiàn)得淋漓盡致

胡一舸南游y
2026-07-01 15:38:26
上海律師太卷了!黃浦區(qū)看守所單純生活會見,有人卷到500一次

上海律師太卷了!黃浦區(qū)看守所單純生活會見,有人卷到500一次

火山詩話
2026-07-01 07:23:00
加盟廣東成首選?CBA第一內(nèi)線大殺器或被交易,曾被杜鋒點名要人

加盟廣東成首選?CBA第一內(nèi)線大殺器或被交易,曾被杜鋒點名要人

緋雨兒
2026-07-01 14:18:36
搬好小板凳,哈蘭德將與加布里埃爾在世界杯1/8決賽正面對決

搬好小板凳,哈蘭德將與加布里埃爾在世界杯1/8決賽正面對決

懂球帝
2026-07-01 04:12:20
中央決定:程福波任國務院國資委黨委書記

中央決定:程福波任國務院國資委黨委書記

新京報
2026-06-30 19:18:26
2026-07-01 18:15:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術發(fā)展,和技術應用帶來的千行百業(yè)產(chǎn)業(yè)變革。
12159文章數(shù) 117113關注度
往期回顧 全部

科技要聞

Claude Code被曝“植入木馬”識別中國用戶

頭條要聞

"霉霉"婚禮慶典細節(jié)披露:千人出席禁用手機 封街3天

頭條要聞

"霉霉"婚禮慶典細節(jié)披露:千人出席禁用手機 封街3天

體育要聞

賣球衣救子的門將,把德國撲出了世界杯

娛樂要聞

張凌赫:我連心疼你都隔著時差

財經(jīng)要聞

新氧貸款:宣傳年化15%,實際頂格24%

汽車要聞

半程收官 上汽集團銷量突破200萬輛

態(tài)度原創(chuàng)

家居
親子
本地
公開課
軍事航空

家居要聞

傳奇筑 日常詩

親子要聞

小挖掘機陪媽媽去上班

本地新聞

強烈建議,全國高校都向這所大學看齊!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美伊代表前往多哈 談判方式出現(xiàn)"重大倒退"

無障礙瀏覽 進入關懷版