无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<form id="mwwav"><sup id="mwwav"></sup></form>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

代碼定位太慢？螞蟻ACL2026新作：讓模型自己學會「該搜多少」

2026-06-14 09:32:37　來源: 新智元

北京舉報

0

分享至

新智元報道

【新智元導讀】FuseSearch：學習型自適應并行執行 —— 一個40億參數的模型，憑什么在代碼定位上干過了商用閉源大模型？答案只有四個字：搜得更聰明。

在AI編程狂飆突進的今天，一個尷尬的事實正在浮出水面：

你花在「讓 AI 改代碼」上的錢，超過一半其實燒在了「找代碼」上。

研究表明，當前最先進的AI編程Agent，超過50%的計算資源消耗在代碼搜索與定位環節——Agent翻來覆去地搜文件、讀代碼、定位函數，輪次消耗驚人，Token賬單飛漲。

當所有人都在卷「模型多大、能寫多長的代碼」時，螞蟻集團的一篇ACL 2026 Findings論文把目光轉向了一個更底層的問題：能不能讓搜索本身變得更聰明？

答案是可以。而且效果堪稱驚艷——

FuseSearch-4B，一個僅40億參數的開源模型，在SWE-bench Verified上達到84.7%文件級F1，匹配Claude Haiku 4.5的定位能力，同時速度快93.6%，Token消耗降低68.9%。

怎么做到的？一句話：讓模型自己學會該并行多少。

代碼定位

AI編程最燒錢的「卡脖子」環節

設想這樣一個場景：你讓AI幫你修一個Bug，它需要在一個幾十萬行代碼的大型項目中，精準找到該改哪個文件、哪個函數。

這就是代碼定位（Code Localization）——自動軟件修復中最關鍵、也最昂貴的瓶頸。

現有方案分為兩大流派，各有各的痛點：

但這兩派有一個共同的致命缺陷：一次只能做一件事。

每一輪交互只能調用一個工具，逐步縮小范圍。就像你在圖書館找一本書，規定每次只能翻開一個書架看一眼——輪次用完了，信息還沒收集夠。

論文把這種現象稱為信息匱乏（Information Starvation）。

并行 ≠ 萬能解藥

那解決方案似乎很簡單——一次多調幾個工具不就行了？

沒那么容易。論文實驗揭示了一個反直覺的發現：無腦并行反而更糟。

如果固定每輪調用8個工具（樸素的并行策略），會產生超過34.9%的冗余調用——重復搜索已經看過的代碼區域，不僅浪費Token，還會引入噪聲信號干擾判斷。

核心矛盾就此浮出水面：

并行少了→信息不夠用，定位精度下降。并行多了→大量冗余，浪費計算資源。

FuseSearch的核心洞察是：搜索效率和搜索質量并非對立關系。關鍵不在于并行多少，而在于——什么時候該多并行，什么時候該少并行。

FuseSearch

極簡工具箱 + 自適應智能

FuseSearch的設計哲學出奇地優雅：不給模型定死規則，讓它自己學會動態調整并行度。

3.1 三把「瑞士軍刀」

零成本部署

FuseSearch只用三個只讀工具，極其克制：

就這三個。不需要代碼知識圖譜，不需要語法解析器，不需要任何重型基礎設施。零依賴，拿來就能用，可即時部署到任意代碼倉庫。語言無關，Python 倉庫能用，Java倉庫也能用。

工具雖少，能力完備——glob找文件、grep 搜內容、read_file讀細節，三者組合可以遍歷整個代碼庫。

關鍵創新

用「信息增益」量化搜索質量

論文首次提出工具效率（Tool Efficiency）指標，衡量每次工具調用的信息新穎性：

信息增益=新發現的代碼實體數÷總返回的代碼實體數

打個比方：你派了5個偵察兵去探路。如果5個人報告的都是同一條路，那4 個人就白跑了。工具效率衡量的，就是「每個偵察兵帶回了多少獨家情報」。

效率越高 → 每次搜索都在探索新區域。效率越低 → 在做重復勞動。

兩階段訓練

先學會并行，再學會聰明地并行

FuseSearch的訓練策略分兩步走：

階段一：監督微調（SFT）——建立并行能力

從233個高質量GitHub倉庫中提取約21,000個issue-patch對，用強大的教師模型（Kimi-K2-Instruct）生成搜索軌跡。然后用雙重標準嚴格篩選：

定位準確率 ≥ 0.8
工具效率 ≥ 0.5

從約24,000條候選軌跡中，精選出約 6,000 條「又準又不浪費」的高質量數據，教會小模型「每輪可以同時調 2-8 個工具」。

階段二：強化學習（RL）——學會自適應

SFT之后，模型會并行了，但還不知道什么時候該多并行、什么時候該少并行。

RL階段的獎勵函數設計得極為精妙：

\text{獎勵} = 0.8 \times \text{定位準確率} + 0.2 \times (\text{定位準確率} \times \text{工具效率})

注意那個乘積項：

只有「找得準」且「搜得不浪費」同時滿足，才能拿到額外獎勵
如果定位完全錯誤（準確率=0），無論效率多高，獎勵都是零——模型不能「高效地犯錯」

這個設計迫使模型在搜索的每個階段都做權衡：當前是廣撒網收益大，還是精準驗證收益大？

訓練結果：一種「先撒網、再收網」的搜索策略

經過RL訓練，模型自動學會了一種「老司機」式的自適應搜索模式：

這種「先廣度、后深度」的模式，完全是模型自己從獎勵信號中學出來的，沒有任何人工規則。

實驗結果：小模型大翻身

5.1 核心數據（SWE-bench Verified，386 個實例）

在Qwen3-4B上對比之前的方法RepoSearcher，FuseSearch的提升堪稱碾壓：

一句話總結：準確率翻倍，速度快16倍，Token省了近70%。

5.2 40億參數 vs.商用閉源大模型

一個可以本地部署的4B開源小模型，定位能力與商用閉源大模型持平，同時更快、更省。

5.3 接入下游Agent：不掉精度，省一半成本

把FuseSearch-4B作為Kimi-K2-Instruct的「前置搜索引擎」：

不影響修復效果，直接把成本砍掉近一半。

為什么這項工作值得關注？

FuseSearch帶來了三個層面的貢獻：

學術層面

首次將「搜索效率」變成一個可訓練的目標。不是簡單地讓模型多搜或少搜，而是通過精巧的獎勵函數設計，讓模型自己學會「什么時候該搜多少」。這為 Agent 工具調用策略的優化提供了一個新范式。

工程層面

極簡設計，零部署成本。三個只讀工具，語言無關，不依賴任何重型基礎設施。論文作者已將代碼開源，可即時部署到任意代碼倉庫。

產業層面

小模型逆襲大模型。40億參數匹配Claude級別的定位表現，證明了「聰明的策略」比「堆參數」更重要。對于對延遲和成本敏感的工業級AI編程場景，這條路線極具落地價值。

論文信息

論文標題：FuseSearch: Learning Adaptive Parallel Execution for Efficient Code Localization
收錄會議：ACL 2026 Findings
作者單位：螞蟻集團（Ant Group）
論文鏈接：https://github.com/sxthunder/FuseSearch

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Fable 5突遭下架，GLM-5.2全量開放！

新智元 2026-06-13 22:29:08
14 跟貼 14
NEWTON:等物理涌現到請牛頓進工具箱，Agent 驅動視頻生成新范式

機器之心Pro 2026-06-11 20:50:32
0 跟貼 0

不用向量數據庫，Agent也能會搜索：給它一個grep就夠了？

機器之心Pro 2026-06-11 17:06:46
0 跟貼 0

AI時代，別再提“人人都是程序員”了

虎嗅APP 2026-06-14 02:46:07
14 跟貼 14
谷歌創始人承認：入場代碼編程晚了，但押注AI的自我改進飛輪

DeepTech深科技 2026-06-13 13:25:10
16 跟貼 16

代碼面試正在被行為面取代？2026技術招聘的信號斷裂

我是一個養蝦人 2026-06-13 02:01:27
0 跟貼 0

300個Agent組網，萬億參數減負：Kimi把AI從"學霸"變成"項目經理"

鈦媒體APP 2026-06-14 11:35:06
0 跟貼 0
爬樓機器人多方便，只需要兩個按鈕，最后輕松實現上下樓！

爆笑小次郎 2026-06-13 12:03:45
2 跟貼 2

日媒：韓國決定申請加入CPTPP

參考消息 2026-06-13 12:18:28
17997 跟貼 17997
摜蛋策略：把握時機，巧出奇兵

念而不見e 2026-06-14 01:03:00
4 跟貼 4
DataMaster：當AI開始成為自己的數據工程師

機器之心Pro 2026-06-02 14:51:10
0 跟貼 0
湖人休賽期策略分析：里夫斯為何成交易關鍵？

前行之路 2026-06-13 00:37:49
0 跟貼 0
大廠Token不再“管夠”：騰訊開始限額，字節可部分報銷

經濟觀察報 2026-06-13 12:39:27
70 跟貼 70
200+AI專家集結北京，共議世界模型、智能體、具身智能等話題，這屆智源大會釋放什么信號？

智東西 2026-06-13 21:18:29
1 跟貼 1
“白菜價”的人形機器人，沒法進廠“打螺絲”

財聯社 2026-06-14 10:54:09
0 跟貼 0
鎖在互聯網里的中國大模型

鈦媒體APP 2026-06-12 16:58:21
0 跟貼 0
Agent終于長出了身體：Jiuwen Symbiosis背后的思考與實踐

量子位 2026-06-13 16:08:07
3 跟貼 3
豆包任務模式深夜上線！國產 AI Agent 要卷到普通用戶了？

雷科技 2026-06-13 10:47:31
38 跟貼 38
大反轉！Anthropic CEO拒修漏洞才被封，舉報Claude新模型是自家大股東

智東西 2026-06-14 10:01:06
8 跟貼 8
燃油車為沖刺年中銷量加大優惠力度新能源車開始漲價

大象新聞 2026-06-13 15:33:15
3543 跟貼 3543
ACL 2026｜AI for聾啞群體，港理工開源思考型手語翻譯模型

機器之心Pro 2026-05-05 15:22:29
0 跟貼 0
加拿大開幕式充氣的大世界杯模型沒100%撐起來，然后就萎了！

臺海大林 2026-06-13 07:48:16
139 跟貼 139
多國嘉賓：在中國，人權不是抽象概念，而是扎根現實的民生福祉

中國日報網 2026-06-13 17:07:04
5800 跟貼 5800
陳赫鹿晗暗戰規則外，角落肉夾饃大快朵頤，游戲掌控在手

漫談小星球 2026-06-13 18:13:37
1 跟貼 1
比特與信念的交鋒：數智時代領導者的“算法敘事”與“人機共情”藝術

經濟觀察報 2026-06-14 09:07:53
0 跟貼 0
上海頭部高校重磅！復旦、交大、同濟、華東師大齊宣布：本科擴招！

環球網資訊 2026-06-13 22:01:12
93 跟貼 93
“張雪機車”再次奪冠

新華社客戶端 2026-06-13 20:36:34
8181 跟貼 8181
新餐館裝修500把椅子放門口被市民誤認為是不要的直接搬空老板娘喊話：主動歸還者請吃砂鍋

閃電新聞 2026-06-13 12:22:15
1715 跟貼 1715
算法背后的牧羊人：數智時代從“算力調度”到“人心喚醒”的領導力躍遷

經濟觀察報 2026-06-12 09:06:30
0 跟貼 0
女子花680元辦山姆會員卡，收到臨期菜：距離過期僅剩不到24小時；客服：不想要臨期可以備注

都市快報橙柿互動 2026-06-13 18:48:30
481 跟貼 481
高瓴出手了一家消費級柔性機器人公司，要把“大白”從電影搬進現實家庭｜硬氪首發

36氪 2026-06-14 09:35:19
0 跟貼 0
大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0
媒體：中國制裁菲防長措辭之嚴厲在外交用語中屬罕見

俠客島 2026-06-13 14:51:42
1037 跟貼 1037
世界杯還能這么玩？用扣子順手做了個AI工具，比熬夜看球還上頭

秋葉PPT 2026-06-13 08:20:20
1 跟貼 1
2026世界杯：AI黑科技閃耀綠茵場

天仙無味小仙女 2026-06-13 15:03:28
0 跟貼 0
AI自己寫代碼，訓出1B端側「小鋼炮」-1

機器之心Pro 2026-05-26 14:32:09
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
外籍旅客帶少數民族服裝出境被攔，6件上衣2件繡片均屬于一般文物

揚子晚報 2026-06-13 16:44:48
156 跟貼 156
497數學聯賽：2015第二試B-2 一元二次方程的整數根中參數K的問題

我服子佩 2026-06-12 17:59:15
1 跟貼 1
2026設計校招現狀！這些大廠正在瘋狂招人（附投遞表）

數藝社 2026-06-14 10:39:38
0 跟貼 0

董路罕見認慫:我解說干不過詹俊黃健翔想留下一筆所以就做了青訓

董路罕見認慫:我解說干不過詹俊黃健翔想留下一筆所以就做了青訓

風過鄉

2026-06-14 07:26:04

馬特烏斯公開批評克洛普穆勒

體壇周報

2026-06-13 23:25:25

“招風耳，懸膽鼻，真是八面玲瓏”，附中女孩采訪火了，滴水不漏

“招風耳，懸膽鼻，真是八面玲瓏”，附中女孩采訪火了，滴水不漏

熙熙說教

2026-06-12 19:33:30

紐約市長談馬斯克成全球首位萬億富翁：第一萬億個征富人稅的理由

紐約市長談馬斯克成全球首位萬億富翁：第一萬億個征富人稅的理由

IT之家

2026-06-13 20:33:06

中東那個惡霸終于死了，不是被打死的，是被特朗普的談判拖死的！

中東那個惡霸終于死了，不是被打死的，是被特朗普的談判拖死的！

阿豐聊娛

2026-06-14 08:42:45

現身了！上海外援懷特塞德更新社媒：沒有任何針對我的阻礙能得逞

現身了！上海外援懷特塞德更新社媒：沒有任何針對我的阻礙能得逞

狼叔評論

2026-06-13 12:58:36

一油傳三代，人走油還在，日本一炸雞店一鍋油用了66年拿全國金獎

一油傳三代，人走油還在，日本一炸雞店一鍋油用了66年拿全國金獎

大廠編外實習生

2026-06-12 13:36:01

黑豹樂隊前主唱張克芃去世，年僅54歲，曾在《三國演義》飾演張飛之子，知情人：他身體一直不好，常年靠坐輪椅出行

黑豹樂隊前主唱張克芃去世，年僅54歲，曾在《三國演義》飾演張飛之子，知情人：他身體一直不好，常年靠坐輪椅出行

極目新聞

2026-06-13 19:19:30

中方接到日媒消息，日本已找上巴基斯坦，要跟中國主張打擂臺

中方接到日媒消息，日本已找上巴基斯坦，要跟中國主張打擂臺

健身狂人

2026-06-13 03:32:16

兩大軟件巨頭30年后再交鋒，市值較高點均已蒸發超80%

兩大軟件巨頭30年后再交鋒，市值較高點均已蒸發超80%

21世紀經濟報道

2026-06-13 22:39:17

泰國長公主隕落，王室平衡被打破，泰國危險了，真正的斗爭開始

泰國長公主隕落，王室平衡被打破，泰國危險了，真正的斗爭開始

魔都姐姐雜談

2026-06-14 08:26:48

國王交易得拉文大概率留隊

體壇周報

2026-06-14 09:08:17

“這頓飯比你臉皮還厚”，家長給小學女兒送餐，旁觀者都難以下咽

“這頓飯比你臉皮還厚”，家長給小學女兒送餐，旁觀者都難以下咽

熙熙說教

2026-06-13 21:38:42

俞敏洪拋出驚人言論：我有兩個大學男同學已經死了，都是家庭條件很好，但倆人沒有抵抗挫折和不幸的能力

俞敏洪拋出驚人言論：我有兩個大學男同學已經死了，都是家庭條件很好，但倆人沒有抵抗挫折和不幸的能力

心理觀察局

2026-06-03 07:17:10

澳大利亞球迷：加入亞足聯可能是我們做的最正確的決定

澳大利亞球迷：加入亞足聯可能是我們做的最正確的決定

懂球帝

2026-06-14 07:52:21

21輛貨車集體“偏航”，局長被查！河南這件事，已經不是“可怕”

21輛貨車集體“偏航”，局長被查！河南這件事，已經不是“可怕”

走讀新生

2026-06-14 00:09:03

外媒終于發現不對勁：平壤街頭大變樣，朝鮮靠著中國偷偷干件大事

外媒終于發現不對勁：平壤街頭大變樣，朝鮮靠著中國偷偷干件大事

舊窗老街

2026-06-13 03:11:21

梁洛施和男友一起走紅毯，46歲馬浴柯扎小辮子戴耳釘，兩人好般配

梁洛施和男友一起走紅毯，46歲馬浴柯扎小辮子戴耳釘，兩人好般配

小嵩

2026-06-14 02:37:09

“把兒子當外人整呢”，一根破爛眼鏡腿，讓人心疼高考男生處境

“把兒子當外人整呢”，一根破爛眼鏡腿，讓人心疼高考男生處境

澤澤先生

2026-06-13 21:43:34

82歲的開國少將史可全住院，得知彭德懷也住院，下令：我不喝茶了

82歲的開國少將史可全住院，得知彭德懷也住院，下令：我不喝茶了

簡史檔案館

2026-06-13 11:05:03

AI產業主平臺領航智能+時代

15462文章數 66924關注度

往期回顧全部

科技要聞

Anthropic最強模型被禁，傳亞馬遜通風報信

頭條要聞

陜西橋梁垮塌致25輛車墜河62人死亡失蹤官方公布細節

頭條要聞

陜西橋梁垮塌致25輛車墜河62人死亡失蹤官方公布細節

體育要聞

美國4比1巴拉圭：這統治力真是美國隊？！

娛樂要聞

具俊曄曝大S離世前虛弱照，難怪小s退讓

財經要聞

金價跌至900元關口，大媽又來抄底了！

汽車要聞

深藍S07華為乾崑激光版增程車型上市限時15.49萬元起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

旅游

教育

藝術

公開課

老人、小孩、孕婦，吃粽子有啥風險

旅游要聞

西南最大人工湖，203個島嶼拼出一個“壽”字也太神奇了！

教育要聞

走出標準答案，高考后一定讀一讀這10本書

藝術要聞

廣州再建一座“小蠻腰”？190米，頂著個球，2027年見！

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<object id="gdw7u"><div id="gdw7u"></div></object>