无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

HyperEyes:并行多模態(tài)搜索智能體的效率革命

0
分享至



現(xiàn)有的開源多模態(tài)搜索智能體普遍受困于「裁剪 - 再搜索」的串行處理模式,面對(duì)多目標(biāo)時(shí)往往陷入交互冗長(zhǎng)、錯(cuò)誤級(jí)聯(lián)累積的泥沼。

為此,小紅書研究團(tuán)隊(duì)提出了一款全新架構(gòu)的模型:HyperEyes。通過統(tǒng)一定位與搜索的動(dòng)作空間、構(gòu)建并行可學(xué)習(xí)數(shù)據(jù)以及雙粒度效率感知強(qiáng)化學(xué)習(xí)的全棧設(shè)計(jì),HyperEyes 成功實(shí)現(xiàn)了從「搜得更深」到「搜得更寬」的并行多模態(tài)搜索范式躍遷。





  • 論文地址:https://arxiv.org/abs/2605.07177
  • 代碼地址:https://github.com/DeepExperience/HyperEyes

背景:多模態(tài)搜索智能體的「串行困局」

當(dāng)前主流的 Agent 在面對(duì)包含多個(gè)實(shí)體的復(fù)雜圖片時(shí),往往只能采用笨拙的「N 輪串行調(diào)用」策略。

這種傳統(tǒng)的處理路徑帶來了三重難以逾越的困境:首先是極大的交互冗余,原本一句話的多實(shí)體查詢被迫退化為多次單實(shí)體搜索,導(dǎo)致延遲劇增;其次是錯(cuò)誤放大的多米諾骨牌效應(yīng),前置定位一旦發(fā)生偏差,后續(xù)的搜索結(jié)果將被全部污染;最后是模型訓(xùn)練中普遍存在的獎(jiǎng)勵(lì)偏差與「信用分配」問題。

現(xiàn)有模型往往僅以「最終答案對(duì)錯(cuò)」作為唯一獎(jiǎng)勵(lì)標(biāo)準(zhǔn),這不僅會(huì)導(dǎo)致智能體為了追求表面準(zhǔn)確率而養(yǎng)成「暴力多搜」的壞習(xí)慣,引入更多噪聲;更致命的是,這種粗粒度的稀疏獎(jiǎng)勵(lì)會(huì)帶來粗暴的「連坐懲罰」—— 在那些最終失敗的探索軌跡中,原本正確、富有邏輯的中間推理和工具調(diào)用也被一并全盤否定,導(dǎo)致模型根本無法從失敗中有效汲取局部經(jīng)驗(yàn)。

方法:從動(dòng)作空間、數(shù)據(jù)到 RL 的「全棧式」效率重塑



為了讓智能體真正具備「一次出手,多目標(biāo)并發(fā)」的內(nèi)生能力,HyperEyes 研究團(tuán)隊(duì)在動(dòng)作空間、數(shù)據(jù)合成與強(qiáng)化學(xué)習(xí)三個(gè)維度上進(jìn)行了徹底的底層重構(gòu)。

傳統(tǒng)的智能體通常將「視覺裁剪」和「網(wǎng)絡(luò)搜索」作為兩個(gè)獨(dú)立的步驟,而HyperEyes 打破了這一隔離,提出了「統(tǒng)一定位即搜索」(UGS)的動(dòng)作空間重構(gòu)方案。它將視覺定位框直接作為檢索動(dòng)作的內(nèi)嵌參數(shù),使得一次函數(shù)調(diào)用就能并發(fā)攜帶多個(gè)目標(biāo)框。這一設(shè)計(jì)從物理層面徹底打通了單輪交互內(nèi)多目標(biāo)并發(fā)的通路。

然而,空有架構(gòu)還不夠,開源社區(qū)長(zhǎng)期缺乏「并行搜索」的訓(xùn)練語料。為此,研究團(tuán)隊(duì)設(shè)計(jì)了一套精密的合成流水線。他們首先將多類圖片拼接,合成出必須同時(shí)進(jìn)行定位與檢索才能解答的視覺查詢;接著基于圖譜隨機(jī)游走,構(gòu)造出多約束的交集問題并嚴(yán)格剔除捷徑解;最后,通過漸進(jìn)式拒絕采樣(PRS)技術(shù),在嚴(yán)格的遞增輪次預(yù)算下,提純出 3 萬條「零冗余」的并行行為種子數(shù)據(jù),完美解決了模型 SFT 冷啟動(dòng)的難題。

在最核心的強(qiáng)化學(xué)習(xí)(RL)對(duì)齊階段,HyperEyes 徹底顛覆了傳統(tǒng) RL 的「唯結(jié)果論」范式。傳統(tǒng)的稀疏獎(jiǎng)勵(lì)往往會(huì)引發(fā)雙重隱患:缺乏效率約束的獎(jiǎng)勵(lì)機(jī)制會(huì)縱容模型養(yǎng)成「冗余試錯(cuò)」的惰性,以犧牲推理速度為代價(jià)換取準(zhǔn)確率;更糟糕的是,在處理長(zhǎng)周期任務(wù)時(shí),粗暴的結(jié)果導(dǎo)向會(huì)帶來極其不公平的「連坐懲罰」—— 即便是一次堪稱完美的中間推理過程,也會(huì)因?yàn)樽罱K環(huán)節(jié)的失誤被徹底抹殺,導(dǎo)致模型在復(fù)雜探索中迷失方向。



針對(duì)這一問題,團(tuán)隊(duì)創(chuàng)新性地提出了「宏觀 + 微觀」的雙粒度效率感知強(qiáng)化學(xué)習(xí)框架。在宏觀軌跡層面,系統(tǒng)引入了 TRACE(動(dòng)態(tài)參考的成本效率獎(jiǎng)勵(lì))機(jī)制。這并不是一個(gè)一刀切的步數(shù)死命令,而是一把「自我超越」的動(dòng)態(tài)標(biāo)尺。系統(tǒng)會(huì)將模型當(dāng)前的工具調(diào)用表現(xiàn)與標(biāo)尺對(duì)比,只有比標(biāo)尺更高效才能獲得獎(jiǎng)勵(lì)。在每個(gè) Epoch 結(jié)束后,系統(tǒng)會(huì)自動(dòng)用本輪表現(xiàn)最好、步數(shù)最少的軌跡去刷新并收緊標(biāo)尺。這就像跳高比賽,橫桿隨著模型能力的提升越調(diào)越高,逼迫模型不斷擠出水分。

而在微觀 Token 層面,為了精準(zhǔn)搶救失敗軌跡中的「正確中間過程」,HyperEyes 引入了 OPD(策略內(nèi)蒸餾)機(jī)制。這一機(jī)制只在軌跡最終答錯(cuò)時(shí)才會(huì)啟動(dòng),屆時(shí)會(huì)引入一個(gè) 235B 的滿血版教師模型,為失敗軌跡中的每一步提供稠密的 Token 級(jí)監(jiān)督信號(hào),精準(zhǔn)打撈那些原本正確的中間規(guī)劃。

這種「僅在失敗時(shí)蒸餾」的非對(duì)稱設(shè)計(jì),完美避免了對(duì)學(xué)生模型「高效并發(fā)」本能的覆蓋。成功時(shí)由宏觀獎(jiǎng)勵(lì)主導(dǎo)效率,失敗時(shí)由微觀蒸餾托底糾偏,宏微觀的嚴(yán)絲合縫,徹底釋放了多模態(tài)大模型的并發(fā)檢索天性。

IMEB Benchmark:把「搜索效率」作為重要評(píng)估維度

現(xiàn)有多模態(tài)榜單普遍存在「只看準(zhǔn)不看快」的弊端。為了糾正這一導(dǎo)向,團(tuán)隊(duì)發(fā)布了首個(gè)包含 300 條極具挑戰(zhàn)性多實(shí)體視覺評(píng)測(cè)基準(zhǔn)的 IMEB (Image Multi-Entity Benchmark)。

與之配套,團(tuán)隊(duì)還提出了「成本感知評(píng)分」 (CAS)。該評(píng)分標(biāo)準(zhǔn)在統(tǒng)一標(biāo)尺下,將準(zhǔn)確率、Token 消耗和工具調(diào)用輪次進(jìn)行聯(lián)合評(píng)估,把傳統(tǒng)的答案質(zhì)量換算為「單位延遲下的有效信息密度」,從根本上遏制了大模型靠堆砌算力暴力刷榜的行為。



實(shí)驗(yàn)結(jié)果與核心發(fā)現(xiàn)

在隨后的 6 大主流基準(zhǔn)測(cè)試中,HyperEyes 展現(xiàn)出了極具統(tǒng)治力的表現(xiàn),實(shí)現(xiàn)了準(zhǔn)確率與效率的 Pareto 占優(yōu)。全面建立開源 SOTA 并非虛言 ——HyperEyes-30B 以64.0%的準(zhǔn)確率超越同量級(jí)最強(qiáng)開源模型 VDR 達(dá)9.9%,而其平均工具調(diào)用輪次僅為 VDR 的不到五分之一(2.2 對(duì)比 11.6)。而其 235B 版本更是以僅1.1%的微弱差距逼近閉源旗艦 Gemini-3.1-Pro。



在極為嚴(yán)苛的 CAS 成本效率評(píng)分中,30B 版本的表現(xiàn)達(dá)到了次優(yōu)開源模型的7.6倍,證明其每一單位算力輸出的信息密度都極高。消融實(shí)驗(yàn)也證實(shí)了,這種底層的動(dòng)作空間重構(gòu)設(shè)計(jì),對(duì)傳統(tǒng)的「LLM 外掛裁剪」或「代碼沙箱裁剪」構(gòu)成了降維打擊。



更有意思的是其面對(duì)噪聲的強(qiáng)魯棒性。在真假證據(jù)混合的干擾測(cè)試中,HyperEyes 這種「敢于少搜、一次看全」的并行策略,反而大幅規(guī)避了過度檢索帶來的幻覺陷阱。



在一個(gè)面對(duì) 6 人同框復(fù)雜問答的真實(shí)測(cè)試案例中,傳統(tǒng) Agent 因?yàn)椤钢鹨徊眉?+ 搜索」的笨拙邏輯將流程拖拽至 12 輪,最終因噪聲累積而答錯(cuò);而 HyperEyes 首輪即并發(fā)定位并檢索了全部 6 人,僅用 3 輪便給出精準(zhǔn)答案,直觀地展現(xiàn)了什么叫「一次出手,看清全局」。



結(jié)語:多模態(tài)搜索智能體的下一站,是「效率即智能」

長(zhǎng)期以來,大家普遍認(rèn)為多模態(tài)搜索必須通過串行加深來保證準(zhǔn)確度,而 HyperEyes 打破了這一固有慣性。它用翔實(shí)的實(shí)驗(yàn)證明了,在 Agent 訓(xùn)練中,「準(zhǔn)確率」與「效率」完全可以協(xié)同進(jìn)化。

隨著多模態(tài) Agent 逐漸步入電商比價(jià)、視覺檢索、實(shí)時(shí)交互等真實(shí)的高并發(fā)業(yè)務(wù)場(chǎng)景,從「搜得更深」轉(zhuǎn)向「搜得更寬」,必將成為下一代智能體角逐的核心競(jìng)爭(zhēng)力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
7-11起訴耐克,指控其新鞋配色抄襲7-11標(biāo)志性顏色,還選在7月11日發(fā)售

7-11起訴耐克,指控其新鞋配色抄襲7-11標(biāo)志性顏色,還選在7月11日發(fā)售

第一財(cái)經(jīng)資訊
2026-07-04 11:51:13
統(tǒng)一臺(tái)灣的最大障礙,不是美國(guó)和臺(tái)獨(dú),而是"中華民國(guó)"這個(gè)稱號(hào)

統(tǒng)一臺(tái)灣的最大障礙,不是美國(guó)和臺(tái)獨(dú),而是"中華民國(guó)"這個(gè)稱號(hào)

共工之錨
2026-07-03 00:10:55
請(qǐng)人上門修電腦CPU遭偷換!維修人員將正品i7換成百元假貨,最終涉事方賠付3500元和解

請(qǐng)人上門修電腦CPU遭偷換!維修人員將正品i7換成百元假貨,最終涉事方賠付3500元和解

深圳晚報(bào)
2026-07-04 09:26:39
香港網(wǎng)紅向郭富城、方媛道歉,承認(rèn)發(fā)活動(dòng)照片時(shí)只P了自己,沒有“修飾”郭富城夫婦;否認(rèn)惡意丑化他人,稱他倆狀態(tài)非常出色

香港網(wǎng)紅向郭富城、方媛道歉,承認(rèn)發(fā)活動(dòng)照片時(shí)只P了自己,沒有“修飾”郭富城夫婦;否認(rèn)惡意丑化他人,稱他倆狀態(tài)非常出色

魯中晨報(bào)
2026-07-04 09:30:04
繼廣湛高鐵之后,成渝高鐵可能是又一個(gè)被大巴逼得降價(jià)的線路

繼廣湛高鐵之后,成渝高鐵可能是又一個(gè)被大巴逼得降價(jià)的線路

柏銘銳談
2026-07-04 00:03:24
揭穿行業(yè)謊言!電車輻射并不大?實(shí)測(cè):腳底輻射遠(yuǎn)超手機(jī)吹風(fēng)機(jī)等

揭穿行業(yè)謊言!電車輻射并不大?實(shí)測(cè):腳底輻射遠(yuǎn)超手機(jī)吹風(fēng)機(jī)等

車見
2026-07-03 11:28:13
哈梅內(nèi)伊遺體告別儀式上 伊朗總統(tǒng)當(dāng)場(chǎng)抹淚

哈梅內(nèi)伊遺體告別儀式上 伊朗總統(tǒng)當(dāng)場(chǎng)抹淚

看看新聞Knews
2026-07-04 00:32:12
新加坡曝3.9億AI芯片特大走私案:查封$5600萬豪宅、一中國(guó)人涉案

新加坡曝3.9億AI芯片特大走私案:查封$5600萬豪宅、一中國(guó)人涉案

新加坡萬事通
2026-07-03 19:37:27
孫穎莎也沒想到,國(guó)乒男單全軍覆沒沒多久,樊振東傳來特大喜訊

孫穎莎也沒想到,國(guó)乒男單全軍覆沒沒多久,樊振東傳來特大喜訊

大魚簡(jiǎn)科
2026-07-04 10:01:19
又來,馮德萊恩給中方“下最后通牒”

又來,馮德萊恩給中方“下最后通牒”

觀察者網(wǎng)
2026-07-04 13:24:18
多名演員發(fā)文抵制!業(yè)內(nèi)人士:很悲哀,收入猛降八成,幾乎成“免費(fèi)勞動(dòng)力”

多名演員發(fā)文抵制!業(yè)內(nèi)人士:很悲哀,收入猛降八成,幾乎成“免費(fèi)勞動(dòng)力”

浙江之聲
2026-07-04 08:13:16
俄總統(tǒng)新聞秘書:普京宣布俄軍“完全解放”盧甘斯克

俄總統(tǒng)新聞秘書:普京宣布俄軍“完全解放”盧甘斯克

財(cái)聯(lián)社
2026-07-04 04:41:06
人倫大亂正在毀掉無數(shù)中國(guó)家庭:3種亂象就在日常,拖垮一家人

人倫大亂正在毀掉無數(shù)中國(guó)家庭:3種亂象就在日常,拖垮一家人

阿凱銷售場(chǎng)
2026-07-04 15:35:28
沒有這種食物,你的肌肉將消失!醫(yī)生:55歲后恢復(fù)肌力的8種食物

沒有這種食物,你的肌肉將消失!醫(yī)生:55歲后恢復(fù)肌力的8種食物

健康之光
2026-07-01 17:48:26
哈梅內(nèi)伊遺體告別儀式上,伊朗議長(zhǎng)哭到身體不停顫抖,穆杰塔巴未出席,其岳父現(xiàn)身儀式

哈梅內(nèi)伊遺體告別儀式上,伊朗議長(zhǎng)哭到身體不停顫抖,穆杰塔巴未出席,其岳父現(xiàn)身儀式

極目新聞
2026-07-04 13:39:08
太慘了!夫妻省吃儉用三年為孩子教育砸下30萬元,高考考了420分

太慘了!夫妻省吃儉用三年為孩子教育砸下30萬元,高考考了420分

火山詩話
2026-07-04 16:03:24
銷量暴跌37%,燃油車瘋狂降價(jià),現(xiàn)在抄底是撿漏還是入坑

銷量暴跌37%,燃油車瘋狂降價(jià),現(xiàn)在抄底是撿漏還是入坑

青眼財(cái)經(jīng)
2026-07-03 18:27:07
官媒發(fā)文!董明珠在歐洲發(fā)了筆"橫財(cái)",她讓雷軍和整個(gè)商界沉默了

官媒發(fā)文!董明珠在歐洲發(fā)了筆"橫財(cái)",她讓雷軍和整個(gè)商界沉默了

阿傖說事
2026-07-04 11:55:26
“最后悔學(xué)電氣工程及其自動(dòng)化!”大三女生自述火了,理由太真實(shí)

“最后悔學(xué)電氣工程及其自動(dòng)化!”大三女生自述火了,理由太真實(shí)

林林先生
2026-07-04 09:25:07
凈利潤(rùn)暴漲74394%!A股最離譜業(yè)績(jī),誕生了

凈利潤(rùn)暴漲74394%!A股最離譜業(yè)績(jī),誕生了

說財(cái)貓
2026-07-04 06:03:52
2026-07-04 17:31:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
13429文章數(shù) 142687關(guān)注度
往期回顧 全部

科技要聞

韜定律論文V2版,充工程細(xì)節(jié)和實(shí)測(cè)數(shù)據(jù)

頭條要聞

媒體:日本著急"看上"印度物資 高市早苗迅速跟進(jìn)叫哥

頭條要聞

媒體:日本著急"看上"印度物資 高市早苗迅速跟進(jìn)叫哥

體育要聞

揭法國(guó)鋒線最大優(yōu)勢(shì) 有人比姆巴佩還快?

娛樂要聞

最富女歌手霉霉完婚 在紐約設(shè)宴慶賀

財(cái)經(jīng)要聞

韓國(guó)股市杠桿失控:450億美元資金狂飆

汽車要聞

方程豹鈦9內(nèi)飾曝光 用上了長(zhǎng)聯(lián)屏設(shè)計(jì)/下半年上市

態(tài)度原創(chuàng)

親子
房產(chǎn)
本地
公開課
軍事航空

親子要聞

快和閨蜜一起來看

房產(chǎn)要聞

總裁空缺17個(gè)月、現(xiàn)金缺口超1000億:金融局“局外人”入局萬科

本地新聞

國(guó)內(nèi)足球之旅?這座小城給你高分答案

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

普京宣布俄軍“完全解放”盧甘斯克

無障礙瀏覽 進(jìn)入關(guān)懷版