網易首頁 > 網易號 > 正文 申請入駐

三問“具身數據元年”

0
分享至



作者:彭堃方、呂鑫燚

編輯:呂鑫燚

出品:具身研習社

2026 年數據元年已經成為具身智能為數不多的共識。這份共識并非空喊,而是在具身智能物理世界真實應用里 “算法跑不通、場景不通用” 的現實倒逼而成的必然。

有趣的是,如果說 2025 年“量產元年”更像是本體廠商的口號,以及給市場階段性回饋的成績;那 2026 年“數據元年”則是本體、模型廠商必須解決的產業結構性矛盾。更深層次的差異在于,2025 年本體企業即便暫未量產,仍有技術迭代、產能爬坡的容錯空間。但 2026 年如果廠商沒有打磨出差異化的數據解決方案,始終徘徊在 Scaling Law 的門口,那或許會逐步消耗外界對廠商的耐心。

于是我們可以看到,一場關于數據采集設備的競賽已悄然拉開帷幕。從規模化的應用 VR+手柄遙操作采集本體真機數據,到現在無本體數據采集設備 UMI、Ego,再到基于外骨骼遙操作的真機數據采集解決方案,在真機和仿真的二元對立間劈開了一條新路。其實已經側面說明了一件事,對于數據究竟誰能得到業界認可,業界又真正需要什么樣的數據,一直沒有回答清楚。

從產業發展來看,數據采集的設備競賽,導致本體廠商忙著自建數據采集團隊,模型公司扎堆布局混合數據生成引擎,所有人都試圖用差異化打法改寫 “數據饑渴” 的困境,夯實自身的數據壁壘。

但這場狂歡真的能解渴嗎?ALL IN 數據的廠商們,究竟是被行業焦慮裹挾的跟風者,還是真正抽絲剝繭找到了底層痛點的破局者?

我們暫且不提那些老生常談的數據問題,單從最近的大動態來看,2025 年末 Generalist 27 萬小時數據炸場具身智能,看起來好像是 Scaling law 時刻已至,但不乏有業內聲音認為其底色是一場“暴力美學”。

畢竟,規模和豐富只是數據饑渴的原因之一,精細化和高質量也是解決問題的充分必要條件。數據饑渴的本質,從來不是 “缺數據”,而是 “缺有用的數據”。這才是具身數據元年的關鍵,不是 “堆規模”,而是 “找對路徑”。

那么,當我們拋開焦慮情緒,具身智能數據真正的核心拷問才剛剛浮現。



坦白說,不少人尚未意識到“數據是為場景服務的”。

很多人看待數據金字塔存在謬誤,始終覺得數據最難得但最好用的是真機數據,但事實上,數據金字塔其實是動態的,并非一成不變,取決在什么場景解決什么問題。

就像即將完成IPO“大考”的王興興在西門子首屆科技峰會上所說,“我們公司和業內,能用仿真環境、仿真訓練解決的,盡可能用仿真解決,因為速度快、成本低,可以調整一些參數”,這在人形機器人走、跑、打拳常見。而他坦言,“機器人做‘操作’相關的動作,靠仿真做得還不夠好,全球范圍內還是靠真人采集數據去訓練”,當然真人采集也面臨搭建環境有限、成本高等痛點。

從王興興的話中,其實可以看出他對數據的取舍,即始終要從數據本身的“可供性”出發,并從場景的驗證中得到實踐反饋。企業想要知道缺什么類型的數據,不是廠商在實驗室里猜出來的,而是在真實場景中找到的。

所以,通過場景來看,無論是互聯網數據還是少量真機+仿真形成的海量數據,都能讓具身智能機器人完成“大開大合式”動作。這些數據支撐了機器人從實驗室走進物理世界,但距離我們想要的生產力仍有一段距離。

互聯網視頻數據缺失力覺、觸覺反饋,仿真數據難以還原不同材質的物理特性(如布料的柔軟度、金屬的光滑度),即便是少量真機數據,也多聚焦于本體運動,而非末端操作的細節。但在家庭服務、物流分揀、工業制造的大部分生產力場景中,都需要“本體運動+大量的末端操作”。換句話說,今天數據的核心訴求,可以聚焦到末端執行器上,尤其是有著復雜的“指間功夫”的靈巧手。



現在從國外呼聲最高的特斯拉、Figure 都已經證實,二者的機器人在真正落地時,靈巧手干活參與度并不高,很多還是徒有“手”,卻干著“夾爪”的活。

但遺憾的是,這類數據無法通過 “暴力采集” 獲得。與通用場景數據不同,靈巧手數據具有極強的場景特異性:同樣是 “抓取” 動作,抓取玻璃制品與抓取橡膠零件的力控曲線完全不同;同樣是 “擰動” 動作,手動螺絲刀與電動螺絲刀的操作邏輯存在本質差異。這意味著,廠商必須深入具體場景,通過一系列數采設備采集 “針對性數據”。這也正是其稀缺性的核心原因。

這場數據補位戰,本質是從 “泛化數據堆砌” 向 “場景化精細數據深耕” 的轉型,而靈巧手數據的儲備厚度,將直接決定機器人的生產力邊界。



當下業內已經意識到靈巧手數據采集的重要性,下一步就落在了如何采集更準確的數據。

目前看到的數據采集設備競賽已至。除了仍在擴張的真機數采廠之外,現在 UMI、Ego、外骨骼也異軍突起,都在用低成本、高效率的方式破局。

當前 UMI 主要聚焦于機械臂末端的操作數據采集,也因此 goub 器 goub 以覆蓋機器人全身協調動作,以及大多是兩指夾爪作為末端專注于夾爪類任務,這使其在需要全身交互的場景中應用受限。

但對于聚焦單一操作任務的中小企業而言,UMI 仍是當前階段 “成本與精度平衡” 的最優解之一;由此衍生出解決機器人全身協調動作的解決方案 Ego,但是 Ego 也出現依賴強大的算法后端做完成多維重建和數據對齊的難題,并且兩者在數據采集中更偏向提供海量數據用于預訓練,數據質量問題堆砌到后期,而這個階段會付出很高的成本。



而且,目前看 UMI 和 Ego 這兩類數采設備逐漸開始強綁定,比如鹿明機器人、簡智機器人都相繼在UMI之后推出Ego數采設備,并相互支持、配合使用。業內將這二者采集的數據視為互補的信息來源。

但如果只到這一步,仍不見得能夠解決靈巧操作的難題。一方面 UMI 局限于夾爪形態,另一方面 Ego 這類以自我為中心的人類數據雖然有很強的擴展性,但亞毫米的手指位姿和觸覺數據仍存在缺失。這使得 UMI、Ego 甚至其組合都難以讓機器掌握精細操作技能。

所以,我們會看到更多關乎“靈巧末端”的數據采集新硬件,例如近期智在無界(BeingBeyond)正式推出的 U1,全球首款 Real DexUMI,深受 UMI 范式影響,將靈巧手硬件、本體交互接口、動態追蹤與觸覺感知整合在同一系統中,用自己的手自然地操控另一只手;還包括靈巧智能 DexCap 外骨骼數據采集系統,它實現了人體上肢及腰部的全維度動態捕捉,在常規視覺遙操的基礎上,增加了手部端有震動力覺反饋,為靈巧手產品開發提供了好用、可靠的數據來源。

當然,靈巧智能不是概念先行,早在 25 年上半年,業內還未意識到末端操作數據重要性時,其已在用外骨骼路徑做規模化采集。如今接近一年技術迭代后,在 UMI、Ego 引起廣泛熱議之際,再談起這一設備并非“技術考古”,而是見證其穿越技術周期,仍以必要性存在于前沿數據采集中,落在產業發展的實處。

此外,當前末端操作的數據采集技術路線五花八門,除了UMI、Ego、外骨骼,還包括光學動捕、慣性動捕、IMU/量子傳感/光纖/彈性傳感的數據手套等都可以采集末端數據,但是經過市場驗證,這些手套更適用于中低精度和弱磁場環境,且數據在后期處理成本極高,目前的技術發展條件下,規模化潛力有限。

總之,這場設備競賽的終局,從來不是 “誰取代誰”,而是 “誰能更好地融入協同生態”。外骨骼設備憑借力覺觸覺復刻、長期穩定輸出、數據標準化的三重核心優勢,成為靈巧手精細化數據采集的 “剛需配置”;UMI 與 Ego 則以高效、低成本的特點,承擔規模化數據積累的角色;各類數據手套也在技術蟄伏。

必須強調,設備和數據更多時間不是“排他性”的,相反更應該嘗試有效結合。



一個比較有意思的現象是,一方面具身智能產業鏈在逐步完善,以前大體分為本體、大腦兩個陣營,現在已經跑出深耕數據的獨角獸。一時間,市面上人人都有數據,人人都想占山為王。

但數據話語權應該給誰?

答案是擁有硬件的人,無論是本體還是模型還是數據廠商,誰更懂數據采集的硬件,誰才有話語權。

數據采集從不是簡單的 “記錄動作”,而是要讓物理世界的操作精準轉化為數字世界的可用資產,這背后離不開硬件的三大核心支撐:數據維度,數據質量,數據處理成本。

數據維度要求數據采集到的信息是足夠豐富的,如果數據維度不夠豐富,會讓模型在訓練中大量去“猜”,最終是無法收斂。數據質量,則某種程度上決定了模型吃的是粗糧還是細糠,“吃的粗”模型就長得“糙”,干不來精細活。

最后是數據處理成本,也指“全鏈路處理成本”,即數據采前、采后的管線建設、人員培訓、數據清洗、算法映射等一整套“工業產線”式的成本。這幾者,共同決定了數據采集的成功與否。

目前看,不少數采企業在這些環節上普遍未掌握全要素。但也涌現出一些廠商和設備的理念考慮到了數據的“維度、質量與處理成本”。



圖片來源:靈巧智能 DexCap 演示視頻 (2X Speed)

以靈巧智能的 DexCap 系統為例,其具備了這是三大核心支撐。“全維度動態捕捉”,涵蓋手和雙臂及腰部多維度數據,這相比只聚焦末端數據來說信息豐富度暴增。再者像“千赫茲響應和觸覺感知增強”確保虛擬操控與真實動作 1:1 映射,絲滑且真實。當然外骨骼設備硬件還具備高耐用性,長期采集過程中精度無衰減,數據質量持續穩定。此外,設備輸出數據格式統一、維度完整,為后續標注、清洗與復用提供便利,助力構建可持續迭代的高質量數據集。

并且必須要強調的是,靈巧智能是知名靈巧手本體廠商,尤其是在高自由度靈巧手方面,成果顯著。它離“手”最近,其最懂靈巧操作的數據該長什么樣。

所以回過頭看,數據話語權的爭奪,核心是對 “物理世界數字化入口” 的掌控。本體廠商通過硬件的輕量、高效、協同創新,構建了數據采集的底層基礎設施,讓高質量數據的規模化生產成為可能;而靈巧智能則依托這一基礎設施,將數據價值轉化為真實可用的操作能力,形成 “硬件賦能數據,數據驅動智能” 的正向循環。

這也正是具身智能產業的核心邏輯:誰掌握了硬件這一數據采集的 “第一觸點”,誰就掌握了整個產業的發展主動權。


結語:數據元年真正的含義

其實回到數據元年這個背景中來看,“數據元年”并不單指數據突然陡增,而是意味著行業開始意識到:數據生產本身就是核心能力。

在互聯網時代,數據往往被動產生;而在具身智能時代,數據必須主動制造。這使得數據不再那樣唾手可得,進而我們必須面對的現實是,它更像一種與硬件深度綁定的工業產出。誰擁有設備,誰控制部署,誰理解場景,誰才能穩定地生產高價值數據。

在具身智能的世界里,真正稀缺的從來不是數據本身,而是穩定產出高價值數據的能力。通過靈巧智能的案例來看,誰離真實數據更近,并建立穩定、高質量、可擴展的數據生產體系,誰就更有可能在未來競爭中占據優勢。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
特朗普訪華倒計時,美方已經提出首個條件,希望中方不要見死不救

特朗普訪華倒計時,美方已經提出首個條件,希望中方不要見死不救

蘭妮搞笑分享
2026-04-24 16:59:12
秦皇島大姐買海鮮逃單順走萬元幼犬!主人不和解,已被認出恐入刑

秦皇島大姐買海鮮逃單順走萬元幼犬!主人不和解,已被認出恐入刑

天天熱點見聞
2026-04-24 07:02:36
67歲大媽哭訴:退休后貪圖享樂,不顧丈夫的感受,如今后悔也太晚

67歲大媽哭訴:退休后貪圖享樂,不顧丈夫的感受,如今后悔也太晚

烙任情感
2026-04-23 17:43:19
北京驚現"假Costco":注冊資本1億未實繳,年卡比正版還貴

北京驚現"假Costco":注冊資本1億未實繳,年卡比正版還貴

小星球探索
2026-04-24 14:45:47
形勢有多嚴峻?才4月份,廣東就有公司放長假,多少人又要失業

形勢有多嚴峻?才4月份,廣東就有公司放長假,多少人又要失業

慧翔百科
2026-04-24 11:46:34
川崎前鋒官方:原中國籍19歲后衛關德晴已正式取得日本國籍

川崎前鋒官方:原中國籍19歲后衛關德晴已正式取得日本國籍

懂球帝
2026-04-24 18:27:06
突發公告:董事長劉忠義不幸去世

突發公告:董事長劉忠義不幸去世

南方都市報
2026-04-24 15:12:00
?尚界Z7發布會趴窩:除了惡心小米,它還剩下什么?

?尚界Z7發布會趴窩:除了惡心小米,它還剩下什么?

虔青
2026-04-24 10:12:36
女大學生“受邀”去泰國潑水節被轉賣到緬甸,父親稱報道發出后,園區老板感到了壓力,讓刪除新聞報道,揚言“警方也拿他們沒辦法”

女大學生“受邀”去泰國潑水節被轉賣到緬甸,父親稱報道發出后,園區老板感到了壓力,讓刪除新聞報道,揚言“警方也拿他們沒辦法”

揚子晚報
2026-04-24 12:06:30
“霍爾木茲決戰”,收兵了?

“霍爾木茲決戰”,收兵了?

中國新聞周刊
2026-04-24 16:35:57
華納兄弟股東批準以1100億美元將公司出售給派拉蒙天舞

華納兄弟股東批準以1100億美元將公司出售給派拉蒙天舞

界面新聞
2026-04-23 22:19:21
華晨宇撫仙湖項目叫停!中國頂級淡水命脈,絕不給流量資本讓路

華晨宇撫仙湖項目叫停!中國頂級淡水命脈,絕不給流量資本讓路

離離言幾許
2026-04-24 07:25:41
內蒙古一老板開1.6萬月薪招人放3000只羊,包吃住,有Wi-Fi,有專人送物資,全年無休,回應:更適合夫妻檔,一望無際的大草原常年見不到人

內蒙古一老板開1.6萬月薪招人放3000只羊,包吃住,有Wi-Fi,有專人送物資,全年無休,回應:更適合夫妻檔,一望無際的大草原常年見不到人

瀟湘晨報
2026-04-23 22:14:14
華誼兄弟,被正式申請破產!曾是“中國影視第一股”,坐擁馮小剛、黃曉明等百位明星,8年虧光80多億,如今還不起1000萬

華誼兄弟,被正式申請破產!曾是“中國影視第一股”,坐擁馮小剛、黃曉明等百位明星,8年虧光80多億,如今還不起1000萬

揚子晚報
2026-04-24 12:25:11
一場硬核風力實驗,一見這屆頂級游戲本散熱有多強?

一場硬核風力實驗,一見這屆頂級游戲本散熱有多強?

極果酷玩
2026-04-23 23:13:17
兩男子應聘浦發銀行銷售代表,通過3輪面試,做了497元體檢,工資卡都辦好了,銀行卻以學歷不符為由拒絕入職

兩男子應聘浦發銀行銷售代表,通過3輪面試,做了497元體檢,工資卡都辦好了,銀行卻以學歷不符為由拒絕入職

大象新聞
2026-04-24 16:49:09
布達諾夫撂出狠話:我們將很快讓俄國人大吃一驚!

布達諾夫撂出狠話:我們將很快讓俄國人大吃一驚!

史政先鋒
2026-04-24 11:28:28
眼紅啊!從年薪20萬到125萬,一上海交大碩士特斯拉6年收入345萬

眼紅啊!從年薪20萬到125萬,一上海交大碩士特斯拉6年收入345萬

火山詩話
2026-04-23 07:11:53
啊!利拉德有望季后賽復出!NBA又將誕生醫學奇跡

啊!利拉德有望季后賽復出!NBA又將誕生醫學奇跡

籃球實戰寶典
2026-04-24 19:37:25
中央紀委國家監委公開通報八起違反中央八項規定精神典型問題

中央紀委國家監委公開通報八起違反中央八項規定精神典型問題

新華社
2026-04-24 17:05:33
2026-04-24 20:15:00
具身研習社
具身研習社
記錄具身智能浪潮迭代。
145文章數 1關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

參與英國研究的50萬名患者信息在中國售賣 外交部回應

頭條要聞

參與英國研究的50萬名患者信息在中國售賣 外交部回應

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經要聞

LG財閥內斗:百億美元商業帝國爭奪戰

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態度原創

教育
房產
健康
本地
公開課

教育要聞

最新!北京市第八屆講述育人故事活動正式啟動

房產要聞

重磅新政!海口限價商品房:滿5年可上市 繳15%土地溢價!

干細胞如何讓燒燙傷皮膚"再生"?

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版