无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Hermes新功能上線!比Opus 4.8和GPT-5.5還猛

0
分享至


AI應用風向標(公眾號:ZhidxcomAI)
作者|畢偉豪
編輯|漠影

智東西6月30日報道,現在,Fable 5和Mythos 5等頂尖閉源模型沒法使用,就算能用,單一模型也總有搞不定的問題,那么,想要高質量輸出結果的用戶該怎么辦呢

近日,Hermes Agent上線了MoA(Mixture of Agents)功能,支持用戶自由組合多種模型作為虛擬模型使用,在Nous Research即將發布的基準測試中,這個混合模型的評分超過了Opus 4.8 和GPT-5.5


一、Fable 5、Mythos 5被禁,多模型組合成為潮流

Nous Research在官推上說了這樣一句話:“最強大的模型是受限的,只有少數人才能獲得訪問權限。”這句話明晃晃地指向了Fable 5等模型被封禁的事件。


在這種背景下,不難看出,MoA這個混合模型模式的終極目的,是用開源模型的組合達到頂尖閉源模型的水準,就像Hermes Agent聯合創始人Teknium說的,他們正在測試各種開源模型組合,看看是否能用更便宜的模型達到Opus的水平。

這種多模型組合比肩頂尖模型的思路,最近其實有不少實踐的例子,比如前段時間日本AI獨角獸Sakana AI發布的Sakana Fugu系列編排器模型,會根據任務選擇最佳的模型來處理,和MoA的思路非常相似。


而MoA的技術也在很久之前就已存在了,2024年6月Together AI曾發表過一篇論文《Mixture-of-Agents Enhances Large Language Model Capabilities》,核心是多LLM組合,每一層模型都會參考上一層模型的輸出,再繼續生成自己的回答。同時,論文也將模型分成了兩類,也就是現在Hermes所用的參考模型和聚合模型。


當用戶提出問題時,參考模型會先對問題進行分析判斷,然后給出參考意見,隨后由聚合模型來綜合判斷,并調用工具執行具體任務。

參考模型只生成意見、不會使用任何工具,也不能執行任何命令。這種模式可以發揮不同模型的獨特優勢,集各家之所長,讓擅長規劃的模型來提意見,讓長于實踐的模型來完成任務。

使用這個模式也很簡單,以桌面版為例,只需要在設置里點開模型選項,向下翻就可以看到Mixture of Agents的選項了,直接選擇你想用的模型進行組合即可,默認狀態下是兩個參考模型和一個聚合模型,也可以自己手動添加多個參考模型。


二、實測做游戲更絲滑,Token消耗量相差不大

海外有博主專門做了實測,用兩種組合方式分別生成了游戲和交互頁面,實測結果發現,使用MoA任務完成的時間并不一定會變長,會因為模型選擇的不同而發生變化,同時,Token的消耗量也沒有想象中恐怖

博主先是測試了一個小游戲的制作,使用Three.js開發一個原力海盜訓練競技場游戲,為了對比效果,他先使用單一模型glm-5.2來做測試,輸入提示詞:


Hermes花費了0.38美元,用時13分鐘搞定了這個游戲,可以看到,單一glm-5.2模型生成的游戲效果整體上還不錯,但是在移動速度和流暢程度上存在一些問題,比如飛船很難躲避敵人的攻擊,可玩性稍弱。


隨后博主啟用了MoA,用kimi-k2.6和minimax-m3做參考模型,glm-5.2做聚合模型,然后新開對話,輸入同樣的提示詞。


這一次,Hermes花費了0.47美元,用時35分鐘完成任務,價格比單一模型稍高一些,時間上翻了接近三倍。雖然在時間和成本上更高,但MoA模式下的生成效果也明顯更好,可以看到其移動速度、流暢程度以及關卡合理性都比單一模型的輸出結果好很多。


隨后,博主又使用頂尖閉源模型GPT-5.5進行了測試,這一次是讓Hermes生成一個可交互的動漫多元宇宙儀表盤,包括火影忍者、海賊王、龍珠等IP。對照組依舊是單一模型,使用GPT-5.5執行任務,由于是訂閱制,因此博主直言沒辦法核算成本。


Hermes用了接近7分鐘完成任務,設計的儀表盤中間的光球周圍的光圈有一些簡單,缺少質感,但交互上非常流暢。


隨后博主用了三個grok模型做參考模型,GPT-5.5為聚合模型進行同樣的測試,令他意想不到的是,MoA模式下的Hermes生成速度竟然更快,博主推測可能是由于使用了grok快速模型的原因。


能看到這次的生成結果明顯更有質感,尤其是中間的光球設計感很強,整體交互也非常絲滑,而且點擊不同的星球還有遠近景的切換。


結語:未來比拼的,不只是模型

過去,大模型競爭幾乎都是圍繞著“誰家的模型更強”展開的,用戶需要不斷切換不同模型,在編程、寫作、推理之間尋找最適合的那個。

但MoA、Sakana Fugu等已然在另一個思路上前進:與其等待一個“萬能模型”,不如讓多個擅長不同能力的模型共同完成一項任務

這種走向“編排”的趨勢,其實剛好符合Agent的要求,模型是底層能力,Agent負責組織不同模型協作,讓規劃能力強的模型負責思考,讓執行能力強的模型負責落地

當然,目前MoA需要承擔更高的推理成本,在部分任務上耗時也會明顯增加,并不是所有場景都值得開啟。但隨著推理成本持續下降、開源模型能力不斷提升,多模型協作很可能會成為Agent未來的默認工作方式


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
2026年本科專業熱度10強出爐

2026年本科專業熱度10強出爐

第一財經資訊
2026-06-30 20:39:20
五星巴西,經濟搞不好,足球憑什么永遠是第一?

五星巴西,經濟搞不好,足球憑什么永遠是第一?

余豐慧
2026-06-30 20:14:16
抗美援朝戰爭,美方為什么不接著打,而是選擇向我國低頭?

抗美援朝戰爭,美方為什么不接著打,而是選擇向我國低頭?

磊子講史
2026-06-25 16:55:53
人活多久,看心率就知道?醫生:72歲后,心率保持這個范圍更健康

人活多久,看心率就知道?醫生:72歲后,心率保持這個范圍更健康

鬼菜生活
2026-06-30 20:07:21
難怪特朗普急著談判:美軍努力掩蓋的秘密,直接被美媒捅了出來

難怪特朗普急著談判:美軍努力掩蓋的秘密,直接被美媒捅了出來

娛樂的宅急便
2026-06-30 16:34:53
內馬爾為何在巴西踢日本時!一分鐘都沒上,主帥賽后首次給出答案

內馬爾為何在巴西踢日本時!一分鐘都沒上,主帥賽后首次給出答案

余憁搞笑段子
2026-06-30 19:21:22
磷酸鐵鋰九年老化全過程:從滿電到報廢,衰減曲線詳解

磷酸鐵鋰九年老化全過程:從滿電到報廢,衰減曲線詳解

阿芒娛樂說
2026-06-26 03:28:04
詹姆斯確定離開湖人,東契奇祝福,網友好奇下賽季會去哪隊

詹姆斯確定離開湖人,東契奇祝福,網友好奇下賽季會去哪隊

愛吃冰棍的小痞子
2026-07-01 08:00:04
44歲全智賢香港晚宴亮相,斗雞眼明顯,體態欠佳

44歲全智賢香港晚宴亮相,斗雞眼明顯,體態欠佳

悠悠說世界
2026-06-30 22:40:59
民心所向!四川航空發布,7月底全部回遷雙流,終于不用再跑天府了

民心所向!四川航空發布,7月底全部回遷雙流,終于不用再跑天府了

原廣工業
2026-06-30 13:34:38
萬萬沒料到,即將下臺的武契奇突然宣布,塞爾維亞將走西方路線

萬萬沒料到,即將下臺的武契奇突然宣布,塞爾維亞將走西方路線

面包夾知識
2026-06-30 23:19:33
1997年,英國歸還了香港,為何拒絕歸還沒什么經濟價值的馬島?

1997年,英國歸還了香港,為何拒絕歸還沒什么經濟價值的馬島?

鶴羽說個事
2026-07-01 03:21:35
數據中心遭反對,SpaceX推星鏈半價服務救場

數據中心遭反對,SpaceX推星鏈半價服務救場

鳳凰網科技
2026-07-01 07:44:16
專家發現:吃一個西紅柿,就等于喝了一大口可樂,真的還是假的?

專家發現:吃一個西紅柿,就等于喝了一大口可樂,真的還是假的?

健康之光
2026-06-30 22:10:03
我說實話,再也不想看見這個男人了!

我說實話,再也不想看見這個男人了!

BenSir本色說
2026-06-30 01:11:23
鹽貝健人:既然賽前豪言壯語卻輸球,遭巴西球員挑釁也是理所當然

鹽貝健人:既然賽前豪言壯語卻輸球,遭巴西球員挑釁也是理所當然

畫夕
2026-07-01 08:49:01
1米85跳高女神胡麟鵬宣布結婚,老公是22歲同行,比她小8歲

1米85跳高女神胡麟鵬宣布結婚,老公是22歲同行,比她小8歲

米修體育
2026-06-30 04:40:14
當年強令全國只生一個孩子的發起人,卻被曝出自己生了八個孩子

當年強令全國只生一個孩子的發起人,卻被曝出自己生了八個孩子

人生錄
2026-06-30 11:17:00
還是做好準備吧,一美元只能兌換5.5元人民幣時代,或許終會到來

還是做好準備吧,一美元只能兌換5.5元人民幣時代,或許終會到來

閱識
2026-01-31 15:32:50
假如日本當年沒炸珍珠港,而是全力死磕中國,結局可能恰恰相反

假如日本當年沒炸珍珠港,而是全力死磕中國,結局可能恰恰相反

鍋鍋愛歷史
2026-05-30 16:18:33
2026-07-01 09:16:49
智東西 incentive-icons
智東西
智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
12156文章數 117113關注度
往期回顧 全部

科技要聞

蘋果剛漲價!預付款消費者就被要求補差價

頭條要聞

父母花20萬為娃辦借讀發現準考證是假的 孩子無緣中考

頭條要聞

父母花20萬為娃辦借讀發現準考證是假的 孩子無緣中考

體育要聞

德國足球,臉都不要了

娛樂要聞

黃曉明淪陷!羨慕周杰倫能降住昆凌

財經要聞

中東局勢再添變數

汽車要聞

奇瑞風云A9探店 五個理由一定來看看

態度原創

家居
健康
藝術
房產
數碼

家居要聞

傳奇筑 日常詩

狂吃“糯嘰嘰”小心腸梗阻!

藝術要聞

見過毛主席寫魏碑么?世上僅此一幅!

房產要聞

TOP10單盤狂賣210億!海南樓市,上半年熱銷榜單出爐

數碼要聞

華為奪拍攝眼鏡市場第一 超越千問、小米

無障礙瀏覽 進入關懷版