无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

代碼定位太慢?螞蟻ACL2026新作:讓模型自己學會「該搜多少」

0
分享至


新智元報道


【新智元導讀】FuseSearch:學習型自適應并行執行 —— 一個40億參數的模型,憑什么在代碼定位上干過了商用閉源大模型?答案只有四個字:搜得更聰明。

在AI編程狂飆突進的今天,一個尷尬的事實正在浮出水面:

你花在「讓 AI 改代碼」上的錢,超過一半其實燒在了「找代碼」上。

研究表明,當前最先進的AI編程Agent,超過50%的計算資源消耗在代碼搜索與定位環節——Agent翻來覆去地搜文件、讀代碼、定位函數,輪次消耗驚人,Token賬單飛漲。

當所有人都在卷「模型多大、能寫多長的代碼」時,螞蟻集團的一篇ACL 2026 Findings論文把目光轉向了一個更底層的問題:能不能讓搜索本身變得更聰明?

答案是可以。而且效果堪稱驚艷——

FuseSearch-4B一個僅40億參數的開源模型,在SWE-bench Verified上達到84.7%文件級F1匹配Claude Haiku 4.5的定位能力,同時速度快93.6%Token消耗降低68.9%

怎么做到的?一句話:讓模型自己學會該并行多少。

代碼定位

AI編程最燒錢的「卡脖子」環節

設想這樣一個場景:你讓AI幫你修一個Bug,它需要在一個幾十萬行代碼的大型項目中,精準找到該改哪個文件、哪個函數。

這就是代碼定位(Code Localization)——自動軟件修復中最關鍵、也最昂貴的瓶頸。

現有方案分為兩大流派,各有各的痛點:


但這兩派有一個共同的致命缺陷:一次只能做一件事。

每一輪交互只能調用一個工具,逐步縮小范圍。就像你在圖書館找一本書,規定每次只能翻開一個書架看一眼——輪次用完了,信息還沒收集夠。

論文把這種現象稱為信息匱乏(Information Starvation)

并行 ≠ 萬能解藥

那解決方案似乎很簡單——一次多調幾個工具不就行了?

沒那么容易。論文實驗揭示了一個反直覺的發現:無腦并行反而更糟。

如果固定每輪調用8個工具(樸素的并行策略),會產生超過34.9%的冗余調用——重復搜索已經看過的代碼區域,不僅浪費Token,還會引入噪聲信號干擾判斷。

核心矛盾就此浮出水面:

并行少了→信息不夠用,定位精度下降。并行多了→大量冗余,浪費計算資源。

FuseSearch的核心洞察是:搜索效率和搜索質量并非對立關系。關鍵不在于并行多少,而在于——什么時候該多并行,什么時候該少并行。

FuseSearch

極簡工具箱 + 自適應智能

FuseSearch的設計哲學出奇地優雅:不給模型定死規則,讓它自己學會動態調整并行度。


3.1 三把「瑞士軍刀」

零成本部署

FuseSearch只用三個只讀工具,極其克制:


就這三個。不需要代碼知識圖譜,不需要語法解析器,不需要任何重型基礎設施。零依賴,拿來就能用,可即時部署到任意代碼倉庫。語言無關,Python 倉庫能用,Java倉庫也能用。

工具雖少,能力完備——glob找文件、grep 搜內容、read_file讀細節,三者組合可以遍歷整個代碼庫。

關鍵創新

用「信息增益」量化搜索質量

論文首次提出工具效率(Tool Efficiency)指標,衡量每次工具調用的信息新穎性:

信息增益=新發現的代碼實體數÷總返回的代碼實體數

打個比方:你派了5個偵察兵去探路。如果5個人報告的都是同一條路,那4 個人就白跑了。工具效率衡量的,就是「每個偵察兵帶回了多少獨家情報

效率越高 → 每次搜索都在探索新區域。效率越低 → 在做重復勞動。

兩階段訓練

先學會并行,再學會聰明地并行

FuseSearch的訓練策略分兩步走:

階段一:監督微調(SFT)——建立并行能力

233個高質量GitHub倉庫中提取約21,000個issue-patch對,用強大的教師模型(Kimi-K2-Instruct)生成搜索軌跡。然后用雙重標準嚴格篩選:

  • 定位準確率 ≥ 0.8

  • 工具效率 ≥ 0.5

從約24,000條候選軌跡中,精選出約 6,000 條「又準又不浪費」的高質量數教會小模型「每輪可以同時調 2-8 個工具

階段二:強化學習(RL)——學會自適應

SFT之后,模型會并行了,但還不知道什么時候該多并行、什么時候該少并行。

RL階段的獎勵函數設計得極為精妙:

\text{獎勵} = 0.8 \times \text{定位準確率} + 0.2 \times (\text{定位準確率} \times \text{工具效率})

注意那個乘積項

  • 只有「找得準」且「搜得不浪費」同時滿足,才能拿到額外獎勵

  • 如果定位完全錯誤(準確率=0),無論效率多高,獎勵都是零——模型不能「高效地犯錯」

這個設計迫使模型在搜索的每個階段都做權衡:當前是廣撒網收益大,還是精準驗證收益大?

訓練結果:一種「先撒網、再收網」的搜索策略

經過RL訓練,模型自動學會了一種「老司機式的自適應搜索模式:


這種「先廣度、后深度的模式,完全是模型自己從獎勵信號中學出來的,沒有任何人工規則。

實驗結果:小模型大翻身

5.1 核心數據(SWE-bench Verified,386 個實例)

在Qwen3-4B上對比之前的方法RepoSearcher,FuseSearch的提升堪稱碾壓:


一句話總結:準確率翻倍,速度快16倍,Token省了近70%。

5.2 40億參數 vs.商用閉源大模型


一個可以本地部署的4B開源小模型,定位能力與商用閉源大模型持平,同時更快、更省。

5.3 接入下游Agent:不掉精度,省一半成本

把FuseSearch-4B作為Kimi-K2-Instruct的「前置搜索引擎


不影響修復效果,直接把成本砍掉近一半。

為什么這項工作值得關注?

FuseSearch帶來了三個層面的貢獻:

學術層面

首次將「搜索效率變成一個可訓練的目標。不是簡單地讓模型多搜或少搜,而是通過精巧的獎勵函數設計,讓模型自己學會「什么時候該搜多少。這為 Agent 工具調用策略的優化提供了一個新范式。

工程層面

極簡設計,零部署成本。三個只讀工具,語言無關,不依賴任何重型基礎設施。論文作者已將代碼開源,可即時部署到任意代碼倉庫。

產業層面

小模型逆襲大模型。40億參數匹配Claude級別的定位表現,證明了「聰明的策略比「堆參數更重要。對于對延遲和成本敏感的工業級AI編程場景,這條路線極具落地價值。

論文信息

  • 論文標題:FuseSearch: Learning Adaptive Parallel Execution for Efficient Code Localization

  • 收錄會議:ACL 2026 Findings

  • 作者單位:螞蟻集團(Ant Group)

  • 論文鏈接:https://github.com/sxthunder/FuseSearch

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
董路罕見認慫:我解說干不過詹俊黃健翔 想留下一筆所以就做了青訓

董路罕見認慫:我解說干不過詹俊黃健翔 想留下一筆所以就做了青訓

風過鄉
2026-06-14 07:26:04
馬特烏斯公開批評克洛普穆勒

馬特烏斯公開批評克洛普穆勒

體壇周報
2026-06-13 23:25:25
“招風耳,懸膽鼻,真是八面玲瓏”,附中女孩采訪火了,滴水不漏

“招風耳,懸膽鼻,真是八面玲瓏”,附中女孩采訪火了,滴水不漏

熙熙說教
2026-06-12 19:33:30
紐約市長談馬斯克成全球首位萬億富翁:第一萬億個征富人稅的理由

紐約市長談馬斯克成全球首位萬億富翁:第一萬億個征富人稅的理由

IT之家
2026-06-13 20:33:06
中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

阿豐聊娛
2026-06-14 08:42:45
現身了!上海外援懷特塞德更新社媒:沒有任何針對我的阻礙能得逞

現身了!上海外援懷特塞德更新社媒:沒有任何針對我的阻礙能得逞

狼叔評論
2026-06-13 12:58:36
一油傳三代,人走油還在,日本一炸雞店一鍋油用了66年拿全國金獎

一油傳三代,人走油還在,日本一炸雞店一鍋油用了66年拿全國金獎

大廠編外實習生
2026-06-12 13:36:01
黑豹樂隊前主唱張克芃去世,年僅54歲,曾在《三國演義》飾演張飛之子,知情人:他身體一直不好,常年靠坐輪椅出行

黑豹樂隊前主唱張克芃去世,年僅54歲,曾在《三國演義》飾演張飛之子,知情人:他身體一直不好,常年靠坐輪椅出行

極目新聞
2026-06-13 19:19:30
中方接到日媒消息,日本已找上巴基斯坦,要跟中國主張打擂臺

中方接到日媒消息,日本已找上巴基斯坦,要跟中國主張打擂臺

健身狂人
2026-06-13 03:32:16
兩大軟件巨頭30年后再交鋒,市值較高點均已蒸發超80%

兩大軟件巨頭30年后再交鋒,市值較高點均已蒸發超80%

21世紀經濟報道
2026-06-13 22:39:17
泰國長公主隕落,王室平衡被打破,泰國危險了,真正的斗爭開始

泰國長公主隕落,王室平衡被打破,泰國危險了,真正的斗爭開始

魔都姐姐雜談
2026-06-14 08:26:48
國王交易得拉文 大概率留隊

國王交易得拉文 大概率留隊

體壇周報
2026-06-14 09:08:17
“這頓飯比你臉皮還厚”,家長給小學女兒送餐,旁觀者都難以下咽

“這頓飯比你臉皮還厚”,家長給小學女兒送餐,旁觀者都難以下咽

熙熙說教
2026-06-13 21:38:42
俞敏洪拋出驚人言論:我有兩個大學男同學已經死了,都是家庭條件很好,但倆人沒有抵抗挫折和不幸的能力

俞敏洪拋出驚人言論:我有兩個大學男同學已經死了,都是家庭條件很好,但倆人沒有抵抗挫折和不幸的能力

心理觀察局
2026-06-03 07:17:10
澳大利亞球迷:加入亞足聯可能是我們做的最正確的決定

澳大利亞球迷:加入亞足聯可能是我們做的最正確的決定

懂球帝
2026-06-14 07:52:21
21輛貨車集體“偏航”,局長被查!河南這件事,已經不是“可怕”

21輛貨車集體“偏航”,局長被查!河南這件事,已經不是“可怕”

走讀新生
2026-06-14 00:09:03
外媒終于發現不對勁:平壤街頭大變樣,朝鮮靠著中國偷偷干件大事

外媒終于發現不對勁:平壤街頭大變樣,朝鮮靠著中國偷偷干件大事

舊窗老街
2026-06-13 03:11:21
梁洛施和男友一起走紅毯,46歲馬浴柯扎小辮子戴耳釘,兩人好般配

梁洛施和男友一起走紅毯,46歲馬浴柯扎小辮子戴耳釘,兩人好般配

小嵩
2026-06-14 02:37:09
“把兒子當外人整呢”,一根破爛眼鏡腿,讓人心疼高考男生處境

“把兒子當外人整呢”,一根破爛眼鏡腿,讓人心疼高考男生處境

澤澤先生
2026-06-13 21:43:34
82歲的開國少將史可全住院,得知彭德懷也住院,下令:我不喝茶了

82歲的開國少將史可全住院,得知彭德懷也住院,下令:我不喝茶了

簡史檔案館
2026-06-13 11:05:03
2026-06-14 12:08:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15462文章數 66924關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

陜西橋梁垮塌致25輛車墜河62人死亡失蹤 官方公布細節

頭條要聞

陜西橋梁垮塌致25輛車墜河62人死亡失蹤 官方公布細節

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

具俊曄曝大S離世前虛弱照,難怪小s退讓

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

健康
旅游
教育
藝術
公開課

老人、小孩、孕婦,吃粽子有啥風險

旅游要聞

西南最大人工湖,203個島嶼拼出一個“壽”字也太神奇了!

教育要聞

走出標準答案,高考后一定讀一讀這10本書

藝術要聞

廣州再建一座“小蠻腰”?190米,頂著個球,2027年見!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版