2026年,具身智能賽道迎來數(shù)據(jù)井噴之年。仿真數(shù)據(jù)、視頻數(shù)據(jù)、多模態(tài)數(shù)據(jù)層出不窮,行業(yè)似乎進(jìn)入“喂數(shù)據(jù)就能進(jìn)化”的快車道。然而,熱鬧的浪潮之下,真正能解鎖精細(xì)操作的關(guān)鍵數(shù)據(jù)——觸覺,依然稀缺。
在這輪數(shù)據(jù)競賽中,一家專注于觸覺領(lǐng)域的企業(yè),戴盟機(jī)器人以黑馬之姿脫穎而出。
4月15日,戴盟機(jī)器人聯(lián)合Google DeepMind、中國移動、新加坡國立大學(xué)、香港科技大學(xué)、上海交通大學(xué)、日本東北大學(xué)等海內(nèi)外數(shù)十家頂尖學(xué)術(shù)機(jī)構(gòu)與知名企業(yè),發(fā)布全球最大規(guī)模含觸覺全模態(tài)物理世界數(shù)據(jù)集Daimon-Infinity,計劃年內(nèi)擴(kuò)展至數(shù)百萬小時,其中10000小時數(shù)據(jù)面向全行業(yè)開放共享,首批1000小時已在阿里魔搭社區(qū)上線。
![]()
當(dāng)行業(yè)仍在用視頻數(shù)據(jù)訓(xùn)練機(jī)器人時,戴盟試圖用觸覺回答一個根本問題:機(jī)器人如何真正“感知”物理世界?
01.
觸覺數(shù)據(jù)為何是“精細(xì)操作的最后一塊拼圖”?
在戴盟的Daimon-Infinity發(fā)布之前,具身智能的訓(xùn)練數(shù)據(jù)困境已是行業(yè)公開的焦慮。一方面,行業(yè)對數(shù)據(jù)的需求極為迫切;另一方面,現(xiàn)有數(shù)據(jù)采集方式效率低、成本高,數(shù)據(jù)產(chǎn)出極為有限。
更深層的問題是,具身智能所需的數(shù)據(jù)并不只是看和說,而是在真實(shí)物理世界中完成接觸、施力、協(xié)同與失敗的全過程記錄。這就引出了一個關(guān)鍵疑問:僅有視覺數(shù)據(jù),機(jī)器人真的能學(xué)會精細(xì)操作嗎?
“我們不僅使用眼睛,也擁有觸覺,而機(jī)器人目前只有‘眼睛’,因此它們需要具備觸覺能力。”英偉達(dá)CEO黃仁勛在2026年CES展會上表示。在他看來,精細(xì)操作技能的實(shí)現(xiàn)極為困難,而觸覺正是補(bǔ)齊這一短板的關(guān)鍵。
擰瓶蓋需要感知擰緊過程的阻力變化,抓衣服需要感知形變程度來調(diào)整握力,軸孔裝配需要感知微米級的力反饋,這些操作的決定性信息來自觸覺,而非視覺。純視覺模型無論看多少數(shù)據(jù),都無法從像素中推斷出“擰緊了”還是“沒擰緊”。
視覺可以告訴你物體在哪里,但只有觸覺能告訴你接觸時的物理交互信息——而這正是精細(xì)操作的底層邏輯。
這一認(rèn)識正在成為行業(yè)共識。中國工程院外籍院士張建偉指出,具身智能的核心優(yōu)勢在于通過視覺、語言、觸覺、運(yùn)動、感知等多模態(tài)技術(shù)和材料、形體以及環(huán)境的交互深度融合,讓機(jī)器從被動的感知走向主動的理解和自主的決策。VLA模型也正在向含觸覺的VTLA演進(jìn),以突破信息融合的技術(shù)瓶頸。
02.
全球最大規(guī)模含觸覺全模態(tài)物理世界數(shù)據(jù)集Daimon-Infinity
精細(xì)操作的本質(zhì)是“在接觸中控制力”,而視覺只能看到位置和姿態(tài),無法感知力、形變和滑移。戴盟的VTLA架構(gòu)正是將觸覺作為與視覺并列的第四模態(tài),以填補(bǔ)這一根本缺口。
戴盟機(jī)器人這次發(fā)布的Daimon-Infinity數(shù)據(jù)集有兩大突破。
一是,Daimon-Infinity 以 “百萬小時” 為起點(diǎn),打造了全球規(guī)模最大的全模態(tài)物理世界具身數(shù)據(jù)集。
按照規(guī)劃,數(shù)據(jù)集年內(nèi)將擴(kuò)展至數(shù)百萬小時、近十億條具身數(shù)據(jù),遠(yuǎn)超行業(yè)現(xiàn)有數(shù)據(jù)集規(guī)模,為具身智能模型訓(xùn)練提供了前所未有的數(shù)據(jù)體量支撐。值得注意的是,這一海量數(shù)據(jù)的采集能力來自全球最大規(guī)模的外發(fā)式具身數(shù)據(jù)采集網(wǎng)絡(luò)。這種采集模式突破了傳統(tǒng)數(shù)據(jù)采集廠的限制,可以進(jìn)入各類不同的真實(shí)復(fù)雜場景中采集數(shù)據(jù)——真實(shí)世界為具身智能提供了源源不斷的素材;同時,這種方式采集到的數(shù)據(jù)也更加真實(shí),能夠滿足具身智能提升泛化能力的需求。
二是行業(yè)最高標(biāo)準(zhǔn)的全模態(tài)觸覺數(shù)據(jù)。
具體而言,Daimon-Infinity數(shù)據(jù)集依托戴盟自研的二指夾爪及五指手套數(shù)據(jù)采集設(shè)備,搭載了含11萬感知單元、120Hz高分辨率視觸覺傳感器,配合高清魚眼相機(jī)、IMU、雙目相機(jī)等,能夠同步采集觸覺、視覺、動作軌跡、執(zhí)行動作、文本指令等全維度信息。
更重要的是,Daimon-Infinity 數(shù)據(jù)集包含了接觸力、接觸形變、接觸狀態(tài),及物體材質(zhì)與形貌、接觸滑移、表面紋理等高密度全模態(tài)觸覺信息,相較于行業(yè),將觸覺數(shù)據(jù)推進(jìn)到了更高維度為精細(xì)操作補(bǔ)全稀缺的物理交互特征。這也是目前行業(yè)內(nèi)分辨率最高、信息最完整的觸覺具身數(shù)據(jù)。DeepMind、中國移動、海內(nèi)外高校等頂尖機(jī)構(gòu)選擇與戴盟合作、共建Daimon-Infinity數(shù)據(jù)集,也體現(xiàn)了行業(yè)內(nèi)對于觸覺數(shù)據(jù)價值的共識一一觸覺感知己經(jīng)不是高端選配,而將成為具身智能的必選項(xiàng)。
![]()
值得一提的是,戴盟還搭建了全鏈路數(shù)據(jù)處理引擎,為Daimon-Infinity提供從物理交互到數(shù)字世界的全流程質(zhì)量保障。通過軟硬件協(xié)同,前端采集源頭實(shí)現(xiàn)毫秒級對齊;通過高效編碼壓縮及序列化壓縮,保持?jǐn)?shù)據(jù)精度的同時,最小化數(shù)據(jù)存儲成本。數(shù)據(jù)處理管線可從采集的原始數(shù)據(jù)中提取出接觸形貌、三維形變場、三維分布力以及六維集中力等十多種觸覺模態(tài),將真實(shí)世界的交互表征嵌入到每一幀的數(shù)據(jù)中。這種全鏈路能力意味著,數(shù)據(jù)不再是零散的“原材料”,而是經(jīng)過精細(xì)加工的“生產(chǎn)資料”。
![]()
從驗(yàn)證結(jié)果來看,模型在Daimon-Infinity具身數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練后,只需約十分之一的數(shù)據(jù)量,即可在軸孔裝配、污痕擦拭等多項(xiàng)精細(xì)操作任務(wù)中達(dá)到更優(yōu)的成功率,訓(xùn)練效率實(shí)現(xiàn)10倍的跨越式提升。據(jù)戴盟透露,在一些接觸密集或接觸關(guān)鍵的任務(wù)上,觸覺數(shù)據(jù)的引入甚至實(shí)現(xiàn)了從50%到100%的跳躍式提升。
03.
開源共建:戴盟的生態(tài)野望
更具行業(yè)意義的是,Daimon-Infinity選擇開源10000小時數(shù)據(jù)。這個決策背后,是戴盟對行業(yè)格局的清晰判斷。
戴盟的生態(tài)路徑鮮明。它沒有“閉門造車”,而是以數(shù)據(jù)為杠桿撬動整個生態(tài),開源數(shù)據(jù)集吸引合作者,合作者貢獻(xiàn)數(shù)據(jù)和場景,戴盟從中迭代產(chǎn)品和標(biāo)準(zhǔn)。目前,戴盟已構(gòu)建全球最大規(guī)模的外發(fā)式具身數(shù)據(jù)采集網(wǎng)絡(luò),年產(chǎn)數(shù)據(jù)規(guī)模可達(dá)數(shù)百萬小時,覆蓋工業(yè)裝配、智慧物流、養(yǎng)老護(hù)理、家居服務(wù)、科研實(shí)驗(yàn)、餐飲零售及戶外空間等核心場景。
而這一生態(tài)路徑之所以能夠跑通,根源在于戴盟在觸覺領(lǐng)域的技術(shù)積累。戴盟以視觸覺技術(shù)為壁壘,通過含觸覺的多模態(tài)融合,推動具身智能的靈巧操作發(fā)展:一直以來,戴盟以視觸覺硬件為入口,為具身智能引入高質(zhì)量的觸覺感知;現(xiàn)在發(fā)布數(shù)據(jù)集,則是因?yàn)槠淇吹搅撕|覺數(shù)據(jù)對于模型迭代的重要性。正是基于這些長期積累,戴盟的開源策略才有了獨(dú)特的底氣與方向。
而開源數(shù)據(jù)的意圖并不復(fù)雜:讓更多模型廠商用起來,共同驗(yàn)證觸覺的有效性,推動行業(yè)形成共識;也讓更多開發(fā)者接觸含觸覺的數(shù)據(jù),加速突破落地瓶頸。
04.
結(jié)語
Daimon-Infinity的發(fā)布,伴隨著具身智能行業(yè)正經(jīng)歷的一場根本性的范式轉(zhuǎn)移。
過去,行業(yè)的焦點(diǎn)是“讓機(jī)器人看到世界”;現(xiàn)在,我們開始追問“讓機(jī)器人感知世界”。視覺告訴機(jī)器人是什么,觸覺告訴機(jī)器人“怎么樣”——力有多大、形變多深。 在精細(xì)操作這一具身智能的終極考卷上,觸覺是解題的關(guān)鍵變量。
戴盟的這場大規(guī)模開源,價值不僅在于數(shù)據(jù)的規(guī)模和質(zhì)量,更在于它開啟了一條共建共享的生態(tài)路徑。在行業(yè)數(shù)據(jù)稀缺、孤島林立的當(dāng)下,戴盟主動打破圍墻、開放核心資產(chǎn)。
具身智能真正的“涌現(xiàn)智能”臨界點(diǎn)尚未到來,但觸覺數(shù)據(jù)的加入,正在讓這個臨界點(diǎn)變得更近、更可觸及。在通往通用具身智能的道路上,觸覺不再是錦上添花的“備選感知”,而正在成為通往真實(shí)物理世界理解力的必經(jīng)之路。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.