網易首頁 > 網易號 > 正文 申請入駐

VLA不夠了?觸覺,將改寫具身智能新格局

0
分享至



機器之心發布

2026 年,「數據」正成為具身智能競賽的新焦點,京東、百度等科技巨頭紛紛入局。然而,喧囂之中,一個根本問題懸而未決:什么樣的數據,才是具身智能真正需要的?

近日,全球最大的工程與應用科學專業組織 IEEE(電氣電子工程師學會)旗下的旗艦出版物 IEEE Spectrum,對機器人學家王煜進行了一次深度專訪。

這位深耕機器人領域近 40 年的學者給出了自己的判斷:當前主流的 VLA(視覺 - 語言 - 動作)架構不足以支撐機器人真正走向落地,包含物理交互信息的數據,才是機器人理解現實世界、實現穩定操作的關鍵所在。



  • 訪談鏈接:https://spectrum.ieee.org/daimon-robotics-physical-ai
  • 原文作者:Sujeet Dutta,Wiley 科學與工程部高級編輯

上世紀80年代,作為中國首批公派留學生,王煜進入卡內基梅隆大學機器人研究所,成為時任所長的 Matt Mason 教授招收的第一位博士生,專攻機器人抓取力學與操作規劃——這正是當下具身智能操作能力的學術源頭。他曾在多所院校任教,與李澤湘共同創辦香港科技大學機器人研究院,培養了大批活躍于今日產業一線的人才。

王煜被斯坦福大學評為全球前 2% 頂尖科學家,并作為 IEEE 機器人與自動化協會管理委員會唯一代表中國機構的學者,持續在國際具身智能領域傳遞中國聲音。

從液壓到電動、從工業到生活場景,再到如今的人工智能時代,王煜經歷了現代機器人學的每一次范式轉換。因此,他對當下狂熱中的思考格外值得傾聽。

在王煜看來,機器人下一個亟待解鎖的能力是「操作」(manipulation),且時機日臻成熟。

如今機器人能完成驚艷的 demo,卻仍難以在真實環境中自主感知、決策并穩定執行操作,根本原因在于對視覺的過度依賴—— 當機器人嘗試拿起一只玻璃杯、采摘一顆草莓、插拔一根電線時,視覺只能告訴它「物體在哪兒」,卻無法告知它力度是否恰當、角度是否到位、操作是否完成。

材質、摩擦、接觸力、形變,這些決定操作成敗的物理反饋信息,恰恰是視覺的盲區,也是機器人操作中長期缺失的一環。

王煜認為,觸覺是打開這扇大門的鑰匙。觸覺包含了接觸力、接觸狀態、形變、紋理與材質等信息,能夠填補視覺的盲區與錯覺,讓機器人從「識別物體」走向「理解物體、操控物體」。

基于這一判斷,他與團隊提出了 VTLA(視覺 - 觸覺 - 語言 - 動作)框架,在主流 VLA 架構中引入觸覺,將其視作與視覺同等重要的感知模態。



王煜教授

這些主張并未停留在論文里。幾年前,王煜與博士后段江嘩共同創立「戴盟機器人」,將多年積累的觸覺感知研究推向工程化落地。這家公司過去以含觸覺感知的硬件研發為聞名,2026 年第一季度的營收已超過去年全年。

上個月,戴盟正式發布含觸覺模態的物理世界具身數據集 Daimon Infinity,并開源其中 10000 小時數據,正式入場眼下最熱的具身數據賽道。

一位以「操作」為研究命題的學者,為何在此刻選擇加入數據之爭?這背后的判斷,或許能讓我們窺見未來幾年的具身智能走向。

在這次專訪中,王煜系統闡釋了他對機器人操作、觸覺感知、具身數據與物理 AI 的思考:為什么 VLA 架構會遭遇瓶頸?觸覺數據為何被長期忽視,又為何不可或缺?所謂「物理智能」究竟意味著什么?作為一位見證了機器人學半個世紀發展的研究者,他如何看待人形機器人未來的可能性與邊界?

以下為 IEEE Spectrum 專訪王煜的譯文,出于篇幅考慮略有刪減:

提問:今年 4 月,戴盟機器人聯合多家頭部學術機構和企業,共同發布規模最大、最全面的具身操作數據集。為何選擇現在發布數據集,而不是繼續專注硬件開發?

王煜:隨著具身智能的發展,越來越多人意識到數據的重要性:數據不足是目前具身智能發展的瓶頸,尤其是包含物理交互信息的數據,這將是提升機器人在現實世界操作能力的關鍵。

數據的質量、可靠性和成本,已成為研發和商業落地需要重點關注的問題。

這恰好也是戴盟擅長的事。依托領先的視觸覺技術,我們能夠提供含多模態觸覺的高質量數據 ——不僅包含接觸力,還有接觸形變、接觸狀態、滑移摩擦、物體材質與紋理等信息,完整還原物理交互的過程。基于過往的技術積累,我們也研發了數據處理管線,將觸覺與視覺、動作軌跡、語音文本等模態精準融合,轉化為模型訓練可用的數據。

面對行業的數據空缺,我想采集數據是我們戴盟能做好、也應該做的事情。



今年 4 月,戴盟發布含觸覺全模態物理世界數據集 Daimon-Infinity

提問:戴盟聲稱數據集年底能達到超百萬小時規模,你們是如何做到這一點的?

王煜:我們打造了全球最大規模的外發式具身數據采集網絡—— 依托于輕便化設備,數據采集不再局限于數采場,而是可以進入各類真實場景,不受空間限制,實現了低成本、跨場景、高度真實性的采集,從而具備了每年數百萬小時數據的生產能力。

提問:Daimon-Infinity 由多家機構聯合發布,他們如何參與其中?

王煜:此次數據集,我們聯合了全球數十家機構合作共建,包括北京大學、清華大學、香港科技大學等中國高校,以及 DeepMind、美國西北大學、新加坡國立大學等全球頂尖研究團隊,另外還有中國移動、匯川技術、上聲電子等產業方。他們選擇與戴盟合作,是對我們將觸覺加入具身數據這一路線的認可。

通過在科研、制造等實際場景下進行采集,這些合作方幫助我們收集到了高度真實、以實際場景為驅動的數據;反過來,他們將這些數據用于自己的模型訓練。此外,我們開源了 10000 小時數據,希望含觸覺的數據能推動更多具身模型的進化。

提問:目前機器人領域的主流范式是 VLA 模型,但戴盟團隊提出了 VTLA 框架。為什么加入了觸覺?

王煜:觸覺信息對于機器人的操作能力至關重要,它能提供與物體接觸時的物理反饋, 引導機器人手進行可靠的操作。如果沒有觸覺,機器人可能無法在黑暗環境中判斷物體的位置,可能因無法感知滑移狀態而導致玻璃杯掉落,更有可能因為無法控制力度而導致操作任務失敗,甚至造成損害。

VLA 已經不足以滿足機器人操作的需求,因此我們擴展了框架,納入觸覺數據,創建了 VTLA。

重要的是,我們采用的視觸覺感知技術,與 VLA 所基于的視覺框架非常契合。它捕捉指尖表面的形變,將觸覺信息轉化為視覺圖像,并從中推斷出力和其他接觸狀態 —— 而圖像數據天然適合集成到 VLA 中,這降低了框架擴展的門檻。



搭載視觸覺傳感器的夾爪,通過精準感知觸覺,賦能精細操作

提問:您和團隊開發了世界上首個單色光視觸覺技術,為什么選擇了這條技術路線?

王煜:從開始研究觸覺感知時,我們就明確了自身需求:我們想要的是能夠高度模擬人類指尖皮膚觸覺的傳感器。

生理學研究已充分證實人類指尖所具備的能力 —— 知道我們觸摸了什么、是什么材質、力如何分布,以及當大腦控制手時,它是否移動到正確的位置。我們知道,在機器人手上復制這些能力將大有裨益。

在調研現有技術時,我們發現了多種類型的觸覺感知技術,包括三色光視觸覺傳感及其他更簡單的設計。我們將這些技術的優勢整合到一個解決方案中,使其在保持良好性能的同時又不會過于復雜,并將成本、可靠性和靈敏度控制在令人滿意的范圍內,最終研發了單色光視觸覺技術。隨著人們對觸覺認知的日益加深,這些技術將攜手并進。



全模態觸覺信息,包含力 / 力矩、形狀、材質、接觸信息四大維度

提問:你們的視觸覺傳感器正是基于這一技術,相比傳統觸覺傳感器有什么核心優勢?

王煜:我們在去年推出了全球首個多維高分辨率高頻率視觸覺傳感器,在指尖大小的模塊上裝載了 11 萬個感知單元,是業內目前最高的密度。

另一個優勢是頻率和帶寬,即我們檢測觸覺變化、傳輸并實時處理信號的速度。其他方面則主要與工程技術相關,如可靠性、漂移、硅膠表面耐用性及對電磁、光學及其他環境因素的抗干擾能力。

觸覺的重要性正被越來越多人意識到,我們的視觸覺傳感器也得到了更多人的使用,我相信這會讓整個行業都邁上一個新臺階。

我們的一位潛在客戶正在便利店中部署人形機器人,在密密麻麻的貨架上,機器人需要伸入非常狹小的空間才能取出物品 —— 人類至少需要三根纖細的手指才能完成抓取任務。諸如此類的場景,我們看到了對于觸覺的非常具體的需求。



戴盟視觸覺傳感器具有高感知單元密度

提問:戴盟目前的商業模式和戰略重點是什么?數據集在其中是什么角色?

王煜:我們最初專注于制造高性能的觸覺感知設備,尤其是搭載于機器人手的傳感器。但隨著具身智能的發展,大家逐漸意識到,行業需要不僅僅是一個組件,而是整個技術鏈:設備、大規模高質量的數據,以及最終能夠在實際應用環境中構建、訓練和部署機器人模型的框架。

現在,我們將自己的商業戰略定位為「3D」:設備(Devices)、數據(Data)和部署(Deployment)。我們研發用于數據采集和構建觸覺生態的設備,并通過在合作伙伴的應用場景里部署,完成含觸覺數據的落地與閉環驗證。在這個模式里,任何一環都不可或缺。

提問:您之前提出了「具身技能」的概念,認為這是人形機器人超越「僅擁有先進人工智能大腦」的關鍵。您為什么會提出這一觀點?過去兩年行業快速發展,您對具身技能的定義是否有所改變?

王煜:機器人的發展一路走來,如今已到了電氣、電子和機電一體化硬件技術融合的階段,這是過去 20 年里取得的巨大進步。由于硬件的快速發展,機器人現在完全是電動的,不再需要液壓系統?,F代電子技術提供了高帶寬和高扭矩,如果我們能將智能融入這些機械系統,就能創造出真正意義上的人形機器人 —— 能夠在非結構化環境中運行、決策并自主穩定地執行操作的機器人。

人工智能的出現恰逢其時,大量資源投入其中,特別是大語言模型。它們如今被推廣到世界模型中,賦能物理智能(physical AI)—— 我們希望這些能力最終能在現實世界中落地。如今研究重點更加明確,例如在家庭環境中,人們更傾向于使用人形機器人。這是一個令人興奮的領域,如果我們最終能夠制造出安全、可靠且經濟高效的機器人,它將為社會帶來巨大的益處。



搭載了戴盟觸覺感知技術的機器人在工廠線上部署

提問:機器人如今能進行令人印象深刻的 demo,但距離真正進入實際應用仍存在差距。什么因素可能觸發實際部署?哪些場景最有可能率先實現大規模部署?

王煜:我認為通用機器人的大規模部署之路仍然漫長,但我們已經看到特定領域的可行性。

這與自動駕駛汽車非常相似,無人駕駛出租車尚未全面部署,但移動機器人在酒店業已經得到廣泛應用。在中國,幾乎所有大型酒店都配備了送餐機器人 —— 沒有機械臂,只是一臺從酒店大堂取外賣的小型機器人。外賣員只需放置食物并選擇房間號,機器人便會自行導航、自行使用電梯,最終將食物送達客房。

酒店及餐廳的機器人,為其他場景的應用提供了范本,例如夜間藥店和便利店。我預計在短期內,這些場所將全面部署人形機器人,并在之后擴展到其他領域。我們可以期待,在未來,包括人形機器人在內的自主機器人將逐步滲透到特定行業,為行業創造價值。

我們的愿景始終是讓機器人實現強大的操控能力,并發展成為人類可靠的合作伙伴。未來,機器人或許會無縫融入我們的日常生活,真正造福并服務于人類。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為老不尊、被“兒子”打耳光?身居上海豪宅的她反倒活成人生范本

為老不尊、被“兒子”打耳光?身居上海豪宅的她反倒活成人生范本

楓塵余往逝
2026-05-07 13:27:01
網友曝三亞4只皮皮蝦收費1035元,涉事飯店半年前變更經營者

網友曝三亞4只皮皮蝦收費1035元,涉事飯店半年前變更經營者

齊魯壹點
2026-05-07 10:54:16
“機車女神”痞幼拿下張雪!評論區淪陷了!

“機車女神”痞幼拿下張雪!評論區淪陷了!

4A廣告文案
2026-05-07 09:13:48
國際足聯要瘋了,沒有軟肋的中國足球已經天下無敵

國際足聯要瘋了,沒有軟肋的中國足球已經天下無敵

楓冷慕詩
2026-05-07 11:32:38
魏鳳和案、李尚福案一審宣判

魏鳳和案、李尚福案一審宣判

新京報
2026-05-07 18:08:25
不可承受的“冒險”:華鎣女游客體驗瀑布秋千致死事件疑云

不可承受的“冒險”:華鎣女游客體驗瀑布秋千致死事件疑云

南方都市報
2026-05-07 12:02:13
炸裂!曹縣小叔子把嫂子睡了十幾年,還生了個兒子,村里人曝更多

炸裂!曹縣小叔子把嫂子睡了十幾年,還生了個兒子,村里人曝更多

烏娛子醬
2026-05-07 10:35:39
俄外交部呼吁各國及時從基輔撤離人員

俄外交部呼吁各國及時從基輔撤離人員

環球網資訊
2026-05-07 08:47:57
不能失憶!人民日報平安校園:海參崴的街頭,中國孩子在為誰歡呼

不能失憶!人民日報平安校園:海參崴的街頭,中國孩子在為誰歡呼

瑜說還休
2026-05-07 17:45:15
世乒賽爆大冷!世界冠軍遭淘汰,張本美和大勝,早田希娜11-0鞠躬致歉引熱議

世乒賽爆大冷!世界冠軍遭淘汰,張本美和大勝,早田希娜11-0鞠躬致歉引熱議

好乒乓
2026-05-07 18:30:05
世界杯國際足聯開出天價版權:對中國開價近3億美元,是印度的17倍,現“降”至1.2至1.5億美元;電視轉播談判陷僵局

世界杯國際足聯開出天價版權:對中國開價近3億美元,是印度的17倍,現“降”至1.2至1.5億美元;電視轉播談判陷僵局

浙江之聲
2026-05-07 08:24:22
前體操冠軍吳柳芳再回應擦邊風波:“把債還完了,我才能把體面重新撿起來”;談及與管晨辰的爭執,吳柳芳表示:“我不會去恨一個人”

前體操冠軍吳柳芳再回應擦邊風波:“把債還完了,我才能把體面重新撿起來”;談及與管晨辰的爭執,吳柳芳表示:“我不會去恨一個人”

揚子晚報
2026-05-07 07:43:31
對話“洪迪厄斯”號郵輪乘客:“我頭天下船,漢坦病毒陽性乘客第二天登船”

對話“洪迪厄斯”號郵輪乘客:“我頭天下船,漢坦病毒陽性乘客第二天登船”

紅星新聞
2026-05-07 19:26:32
恒大集團創始人許家印被曝出猛料

恒大集團創始人許家印被曝出猛料

地產微資訊
2026-05-07 09:28:09
騰勢 Z9GT 在歐洲為何敢定價近百萬?

騰勢 Z9GT 在歐洲為何敢定價近百萬?

晚點LatePost
2026-04-16 00:49:08
被困霍爾木茲海峽69天,19名中國船員海上堅守:導彈在頭頂飛,淡水告急,船艙熱如巨型蒸籠,蔬果價格高昂,“擔心炮彈難以入眠”

被困霍爾木茲海峽69天,19名中國船員海上堅守:導彈在頭頂飛,淡水告急,船艙熱如巨型蒸籠,蔬果價格高昂,“擔心炮彈難以入眠”

極目新聞
2026-05-07 18:51:02
“銀行員工轉走儲戶1800萬元炒股”,最新進展:銀行全額支付儲戶1000萬元存款本金和利息,另一儲戶800萬元仍無明確進展

“銀行員工轉走儲戶1800萬元炒股”,最新進展:銀行全額支付儲戶1000萬元存款本金和利息,另一儲戶800萬元仍無明確進展

大風新聞
2026-05-07 15:17:13
寧波銀行的“鐵三角”:區域精耕、風險定價與內生增長

寧波銀行的“鐵三角”:區域精耕、風險定價與內生增長

智谷趨勢
2026-05-07 17:36:48
越來越多的人工資退回15年前了!

越來越多的人工資退回15年前了!

燈錦年
2026-05-07 15:50:50
“很久沒有這種興奮感了”!段永平出手!清倉中國神華 買入泡泡瑪特 稱泡泡瑪特的商業壁壘遠比想象中強大 是王寧的粉絲

“很久沒有這種興奮感了”!段永平出手!清倉中國神華 買入泡泡瑪特 稱泡泡瑪特的商業壁壘遠比想象中強大 是王寧的粉絲

每日經濟新聞
2026-05-07 17:25:55
2026-05-07 19:48:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12939文章數 142644關注度
往期回顧 全部

科技要聞

月之暗面完成20億美元融資,估值突破200億

頭條要聞

19名中國船員被困霍爾木茲超2個月:船艙如同巨型蒸籠

頭條要聞

19名中國船員被困霍爾木茲超2個月:船艙如同巨型蒸籠

體育要聞

巴黎再進歐冠決賽,最尷尬的情況還是發生了

娛樂要聞

Lisa主持!寧藝卓觀看脫衣秀風波升級

財經要聞

金融“風暴”,AI制造

汽車要聞

雷克薩斯全新純電三排SUV 全新TZ全球首發

態度原創

手機
游戲
親子
公開課
軍事航空

手機要聞

消息稱某子系迭代旗艦工程機配備6.6英寸中屏+8500mAh電池

任天堂全新獨占不是鑰匙卡!預約開始 玩家放心了

親子要聞

Little Girl Slides into Feed with Flawless Express...

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:美伊"很可能"達成協議

無障礙瀏覽 進入關懷版