无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

95% vs 34%成功率、能耗降低近100倍:神經(jīng)符號(hào)方法擊敗VLA模型

0
分享至



編輯丨%

過去兩年,具身智能(embodied AI)走向一個(gè)明確方向:把視覺、語言和行動(dòng)統(tǒng)一進(jìn)一個(gè)大模型。這類模型被稱為Vision-Language-Action(VLA)模型——它們可以看、能聽懂指令,還能直接輸出動(dòng)作。

但機(jī)器人學(xué)界正狂熱地追逐越大越好的 VLA 大模型的同時(shí),一個(gè)根本性的問題卻被悄悄擱置:這些動(dòng)輒數(shù)十億參數(shù)、需要數(shù)天微調(diào)、運(yùn)行時(shí)還要燒 GPU 的龐然大物,真的適合那些有明確規(guī)則和約束的結(jié)構(gòu)化任務(wù)嗎?

塔夫茨大學(xué)(Tufts University)的一支團(tuán)隊(duì)給出了一個(gè)響亮的否定答案。研究團(tuán)隊(duì)設(shè)計(jì)了一場「漢諾塔」操縱任務(wù)的公平對決:一方是當(dāng)前最先進(jìn)的開源 VLA 模型 π0,另一方則是一個(gè)結(jié)合了 PDDL 符號(hào)規(guī)劃與擴(kuò)散策略的神經(jīng)符號(hào)架構(gòu)(NSM)。

結(jié)果令人震驚——在 3 塊漢諾塔任務(wù)上,NSM 成功率高達(dá) 95%,而 VLA 僅 34%;在面對未訓(xùn)練過的 4 塊版本時(shí),VLA 全軍覆沒,NSM 仍能達(dá)到 78% 的成功率。更諷刺的是,VLA 微調(diào)消耗的能量是 NSM 訓(xùn)練的近 100 倍。

相關(guān)的研究以「The Price Is Not Right: Neuro-Symbolic Methods Outperform VLAs on Structured Long-Horizon Manipulation Tasks with Significantly Lower Energy Consumption」為題,將于 5 月在維也納國際機(jī)器人與自動(dòng)化會(huì)議上發(fā)表,并發(fā)表于會(huì)議論文集。



論文鏈接:https://arxiv.org/abs/2602.19260

端到端 vs 神經(jīng)符號(hào)

前文中所述的塔漢諾問題(Towers of Hanoi)是一款經(jīng)典問題,這個(gè)任務(wù)具備三個(gè)關(guān)鍵特征:明確的規(guī)則約束 、長時(shí)間規(guī)劃(long-horizon) 與強(qiáng)結(jié)構(gòu)依賴,正是檢驗(yàn)「推理能力」的理想場景。

在這任務(wù)中,π0 等模型在抓取、擺放等短程操作上雖然表現(xiàn)出色,但當(dāng)任務(wù)需要多步推理、遵守特定規(guī)則(如漢諾塔的「大不能壓小」)時(shí),問題就暴露了——VLA 需要從演示中隱式地學(xué)習(xí)這些約束,而訓(xùn)練數(shù)據(jù)中任何細(xì)微的偏差或多樣性都可能讓模型無所適從。

而 NSM 則采用「分層」設(shè)計(jì)。高層用PDDL符號(hào)規(guī)劃器,基于從少量演示中提取的抽象規(guī)則生成符號(hào)化計(jì)劃;低層用擴(kuò)散策略將計(jì)劃轉(zhuǎn)化為連續(xù)控制動(dòng)作。這種設(shè)計(jì)將「推理」與「執(zhí)行」解耦,規(guī)則清晰、可解釋性強(qiáng)。



圖 1:VLA 模型與 NSM 實(shí)驗(yàn)比較概述。

研究團(tuán)隊(duì)在 Robosuite 仿真環(huán)境中設(shè)計(jì)了三個(gè)難度遞增的任務(wù):單次抓取放置、3 塊漢諾塔、4 塊漢諾塔(后兩者未見訓(xùn)練)。對比對象包括:

  • E2E-VLA:端到端微調(diào),僅接收「玩漢諾塔」這一條高層指令。
  • PG-VLA:在外部規(guī)劃器提供的最優(yōu)子任務(wù)序列指導(dǎo)下微調(diào),以隔離執(zhí)行能力。
  • NSM:僅從50個(gè)簡單的「堆疊」演示中學(xué)習(xí),從未見過完整的漢諾塔求解過程。



圖 2:數(shù)據(jù)集中的示例觀測數(shù)據(jù)。

訓(xùn)練數(shù)據(jù)上,VLA 消耗了 300 個(gè)完整漢諾塔軌跡,而 NSM 只用了 50 個(gè)堆疊演示。硬件上所有實(shí)驗(yàn)在同一臺(tái) RTX 4090 上完成,并精確記錄了 GPU/CPU 的功耗和能量消耗。

碾壓性的結(jié)果差距

在最基礎(chǔ)的三塊塔漢諾任務(wù)中:

  • 神經(jīng)符號(hào)模型成功率:95%
  • 最優(yōu)VLA模型成功率:34%

差距接近3 倍。

當(dāng)任務(wù)稍微增加復(fù)雜度(4塊)時(shí):

  • 神經(jīng)符號(hào)模型仍能完成任務(wù):78% 成功率
  • 所有VLA模型:完全失敗

表 1: 訓(xùn)練硬件指標(biāo),比較 VLA LoRA 微調(diào)與 NSM 訓(xùn)練。



這意味著 VLA 不僅性能較低,而且幾乎沒有結(jié)構(gòu)泛化能力。但這并非是結(jié)束,更關(guān)鍵的差距還在二者的能耗對比上。在訓(xùn)練階段,VLA 微調(diào)能耗要高出神經(jīng)符號(hào)方法近兩個(gè)數(shù)量級(jí)(≈100倍)。即使是推理階段,能耗也有接近 10 倍的差距。

VLA 的失敗主因并非規(guī)劃錯(cuò)誤,而是低級(jí)執(zhí)行上的偏差——反復(fù)抓取失敗、放置位置不準(zhǔn)。訓(xùn)練數(shù)據(jù)中的隨機(jī)擾動(dòng)(塊位置偏移1cm)本意是增強(qiáng)穩(wěn)健性,反而讓模型難以鎖定精確目標(biāo)。在某些極端情況下,同一子任務(wù)指令的演示若區(qū)別較大,則很有可能出現(xiàn)對模型的強(qiáng)烈干擾,并進(jìn)一步帶來極高的失敗率。

表 2:實(shí)驗(yàn)的功耗、能耗及任務(wù)表現(xiàn)。



能源風(fēng)險(xiǎn)與未來方向

研究團(tuán)隊(duì)將神經(jīng)符號(hào)系統(tǒng)與熟悉的大型語言模型如 ChatGPT 或 Gemini 進(jìn)行了類比。后者只是試圖預(yù)測序列中的下一個(gè)詞或動(dòng)作,但這并不完美,可能導(dǎo)致結(jié)果失真或者出現(xiàn)錯(cuò)誤的信息。而且,它們的能源消耗往往與任務(wù)本身不成比例。

VLA 或許更適合開放環(huán)境下的短程、靈活操作,而工業(yè)裝配、實(shí)驗(yàn)室自動(dòng)化、規(guī)則明確的物流任務(wù),神經(jīng)符號(hào)架構(gòu)可能是更務(wù)實(shí)的選擇。大規(guī)模部署時(shí),能耗固然是一個(gè)不容小覷的問題。正如論文所言,「通用」不一定意味著更合算。

相關(guān)鏈接:https://techxplore.com/news/2026-03-neuro-ai-slash-energy.html

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“你找媒體,我們就不幫你了”:30多萬買的問界,12天增程器壞了

“你找媒體,我們就不幫你了”:30多萬買的問界,12天增程器壞了

漢史趣聞
2026-05-21 11:05:32
女子在高鐵靜音車廂連打20分鐘電話 乘客:乘務(wù)員一直舉牌勸阻卻被忽視

女子在高鐵靜音車廂連打20分鐘電話 乘客:乘務(wù)員一直舉牌勸阻卻被忽視

封面新聞
2026-05-21 12:12:47
繼蘿卜崗后,又出來“祖墳”崗?網(wǎng)友:誰能考上,一輩子有的吹了

繼蘿卜崗后,又出來“祖墳”崗?網(wǎng)友:誰能考上,一輩子有的吹了

社會(huì)日日鮮
2026-05-21 09:22:29
胡歌被正式確診為早F晚E,粉絲們都痛心不已

胡歌被正式確診為早F晚E,粉絲們都痛心不已

LULU生活家
2026-05-21 08:43:17
19歲男生凌晨2點(diǎn)多騎摩托被殺害,家屬稱兇手已被判處死刑!兇手:長期被噪音影響,想報(bào)復(fù);死者父親:他遇害前一個(gè)月未騎摩托

19歲男生凌晨2點(diǎn)多騎摩托被殺害,家屬稱兇手已被判處死刑!兇手:長期被噪音影響,想報(bào)復(fù);死者父親:他遇害前一個(gè)月未騎摩托

都市快報(bào)橙柿互動(dòng)
2026-05-20 17:07:55
普京回去了,給人一種莫名的傷感!

普京回去了,給人一種莫名的傷感!

達(dá)文西看世界
2026-05-21 09:48:14
網(wǎng)戀10天奔現(xiàn)4天領(lǐng)證!安徽離異女子攜子與新婚丈夫露營走紅網(wǎng)絡(luò)

網(wǎng)戀10天奔現(xiàn)4天領(lǐng)證!安徽離異女子攜子與新婚丈夫露營走紅網(wǎng)絡(luò)

火山詩話
2026-05-21 06:43:02
被判賠三家車企共226萬元,知名汽車博主回應(yīng):正籌錢賠償,沒收任何黑心錢!律師:批評性言論須有可信證據(jù)支撐

被判賠三家車企共226萬元,知名汽車博主回應(yīng):正籌錢賠償,沒收任何黑心錢!律師:批評性言論須有可信證據(jù)支撐

每日經(jīng)濟(jì)新聞
2026-05-21 00:51:17
楊梅才剛撲街,荔枝又被曝用藥!添加劑包裝曝光,評論區(qū)人心惶惶

楊梅才剛撲街,荔枝又被曝用藥!添加劑包裝曝光,評論區(qū)人心惶惶

譚談社會(huì)
2026-05-21 11:24:12
我定居日本20年,娶過3個(gè)妻子,發(fā)現(xiàn)日本的女人都有一個(gè)共同特點(diǎn)

我定居日本20年,娶過3個(gè)妻子,發(fā)現(xiàn)日本的女人都有一個(gè)共同特點(diǎn)

千秋文化
2026-05-20 20:33:05
職業(yè)運(yùn)動(dòng)員究竟有多厲害?網(wǎng)友:在天賦面前,努力一文不值!

職業(yè)運(yùn)動(dòng)員究竟有多厲害?網(wǎng)友:在天賦面前,努力一文不值!

另子維愛讀史
2026-05-21 08:03:05
A股:今天沖到4198后突然跳水,種種跡象表明,A股反彈浪已接近尾聲?

A股:今天沖到4198后突然跳水,種種跡象表明,A股反彈浪已接近尾聲?

趨勢清風(fēng)俠
2026-05-21 11:13:14
越扒瓜越大!交大女學(xué)生吞獎(jiǎng)金再添猛料,不止想進(jìn)體制內(nèi)這么簡單

越扒瓜越大!交大女學(xué)生吞獎(jiǎng)金再添猛料,不止想進(jìn)體制內(nèi)這么簡單

觀史搜尋著
2026-05-21 05:41:15
恐怖!深圳深中通道雨水倒灌、大面積積水,有網(wǎng)友發(fā)帖一針見血

恐怖!深圳深中通道雨水倒灌、大面積積水,有網(wǎng)友發(fā)帖一針見血

火山詩話
2026-05-21 16:07:16
爭議!國際足聯(lián)重大錯(cuò)誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊(duì)

爭議!國際足聯(lián)重大錯(cuò)誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊(duì)

念洲
2026-05-21 08:02:07
光速失業(yè)!禁足名單內(nèi)10人目前仍為現(xiàn)役球員或在足球行業(yè)從事

光速失業(yè)!禁足名單內(nèi)10人目前仍為現(xiàn)役球員或在足球行業(yè)從事

懂球帝
2026-05-21 15:41:08
三大元兇引發(fā)跳水 后期策略

三大元兇引發(fā)跳水 后期策略

趨勢巡航
2026-05-21 14:55:48
上海工大男生課堂喊殺后續(xù):大四重修生,老師道歉,學(xué)?;貞?yīng)來了

上海工大男生課堂喊殺后續(xù):大四重修生,老師道歉,學(xué)?;貞?yīng)來了

奇思妙想草葉君
2026-05-21 02:23:55
今天直接跌成股災(zāi)了

今天直接跌成股災(zāi)了

曹多魚的財(cái)經(jīng)世界
2026-05-21 15:35:37
為了給中國人留下好印象,一生出訪無數(shù)的普京,這次終于破了例

為了給中國人留下好印象,一生出訪無數(shù)的普京,這次終于破了例

福建睿平
2026-05-20 14:09:24
2026-05-21 18:11:00
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1307文章數(shù) 227關(guān)注度
往期回顧 全部

科技要聞

好到離譜也不夠!英偉達(dá)交出816億美元營收

頭條要聞

中紀(jì)委連打三"虎":一人被指違規(guī)核發(fā)機(jī)動(dòng)車號(hào)牌

頭條要聞

中紀(jì)委連打三"虎":一人被指違規(guī)核發(fā)機(jī)動(dòng)車號(hào)牌

體育要聞

常住人口7000的小鎮(zhèn),擁有了一支德甲球隊(duì)

娛樂要聞

反轉(zhuǎn)!金秀賢與金賽綸未成年時(shí)交往不實(shí)

財(cái)經(jīng)要聞

英偉達(dá)業(yè)績超預(yù)!指引再新高仍不夠亮眼

汽車要聞

小鵬正在研發(fā)"高達(dá)" 融合機(jī)器人技術(shù)的主動(dòng)懸架

態(tài)度原創(chuàng)

旅游
教育
時(shí)尚
房產(chǎn)
公開課

旅游要聞

當(dāng)國航紫宸遇見崇州竹編 這場小滿時(shí)節(jié)的航文旅融合快閃超浪漫!

教育要聞

嶺大AI學(xué)科躋身軟科2025全球前200!三大碩士課程招生中!

全網(wǎng)首檔挑戰(zhàn)Al設(shè)備拍攝短劇現(xiàn)場直播!

房產(chǎn)要聞

順德澐璟樓王『澐冠』啟幕|一場高階共鳴的靜奢美學(xué)之約

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版