亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

具身數(shù)據(jù)戰(zhàn)開打!普通人都能上手,邊采邊篩,只喂機(jī)器人愛吃的

0
分享至

衡宇 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

現(xiàn)在,一部手機(jī),加一個(gè)“夾爪”,就能隨時(shí)隨地完成具身智能數(shù)據(jù)采集了!



采出來的數(shù)據(jù)不臟也不廢,已經(jīng)在實(shí)際模型訓(xùn)練中跑出了效果

模型在多步連續(xù)任務(wù)中動(dòng)作銜接更穩(wěn)定;

在真實(shí)場景中面對光照變化、環(huán)境雜亂、物體遮擋時(shí)也更不容易失手,執(zhí)行魯棒性顯著提升;

而當(dāng)任務(wù)發(fā)生小幅變化,比如同類但不同順序的操作目標(biāo)出現(xiàn)時(shí),模型也更容易舉一反三,做出合理應(yīng)對。

這套采集系統(tǒng),模型效果是純純地全肯定。



這套可搭載手機(jī)的數(shù)采終端及其配套應(yīng)用程序,名叫RoboPocket,來自具身智能創(chuàng)企穹徹智能

它是新興采集設(shè)備UMI(Universal Manipulation Interface)的進(jìn)階狀態(tài)。

和傳統(tǒng)UMI方案相比,RoboPocket保持便攜易用的基礎(chǔ)上,更加輕盈:手機(jī)+夾爪即是一個(gè)節(jié)點(diǎn)。

如此一來,每個(gè)人——哪怕是普通人,都可以從口袋里掏出RoboPocket,隨時(shí)隨地采集具身數(shù)據(jù)。

但這還算不上它最出彩的地方。

最妙的是,RoboPocket把模型需求前置到采集一線,讓你隨時(shí)接入模型的訓(xùn)練閉環(huán)。

采集行為發(fā)生時(shí),系統(tǒng)會(huì)同步判斷每一段數(shù)據(jù)的訓(xùn)練價(jià)值,并即時(shí)給出反饋與引導(dǎo),盡量讓采集行為本身就朝著模型真正需要的方向收斂。

每一次采集都直接服務(wù)于模型進(jìn)化,浪費(fèi)不了一點(diǎn)。



在數(shù)據(jù)還在生成的過程中,就對其完成了價(jià)值篩選。

最終采來交付給模型的數(shù)據(jù)從采集源頭就來得更加清晰,更加準(zhǔn)確,對模型也更有用。

具身模型想scale up,卡在數(shù)據(jù)哪一步?

在具身智能領(lǐng)域,數(shù)據(jù)的重要性幾乎是共識(shí)性的

具身模型們嗷嗷待哺,等待大量高質(zhì)量、多樣性的具身數(shù)據(jù)的投喂。

從2023年起,許多團(tuán)隊(duì)投入大量資源建設(shè)數(shù)采廠,希望通過規(guī)模化生產(chǎn)來支撐模型訓(xùn)練。

實(shí)踐很快暴露出一個(gè)現(xiàn)實(shí)問題,數(shù)采流水線建起來了,數(shù)據(jù)量上來了,模型能力卻并沒有穩(wěn)定持續(xù)地提升。

原因并不神秘。

數(shù)采廠依賴的是預(yù)設(shè)場景和標(biāo)準(zhǔn)化流程,這種方式在工業(yè)數(shù)據(jù)中行之有效,但在具身智能里,很難覆蓋真實(shí)世界中大量非標(biāo)準(zhǔn)、非重復(fù)的操作情境。

動(dòng)作容易趨于模式化,任務(wù)分布集中,環(huán)境變化有限,數(shù)據(jù)之間高度相似,訓(xùn)練收益很快出現(xiàn)邊際遞減。

有相關(guān)從業(yè)人員告訴我們,現(xiàn)在的具身數(shù)據(jù)一天比一天多了,結(jié)果訓(xùn)練效率出現(xiàn)不升反降情況



而具身模型真正需要的,恰恰是那些發(fā)生在真實(shí)環(huán)境中的、不那么規(guī)整的操作過程。

這也是UMI出現(xiàn)的背景。

UMI輕量便攜,更易使用,一方面減少了數(shù)采成本,更重要的是開始讓具身數(shù)據(jù)采集擺脫了固定場地的限制。

任何人,可以在室內(nèi)和戶外的任何真實(shí)世界場景里自然完成操作。

如此一來,采集的數(shù)據(jù)也是貼近現(xiàn)實(shí)分布的。這就彌補(bǔ)了數(shù)采廠和真實(shí)世界存在gap的問題。

但當(dāng)UMI開始被業(yè)界認(rèn)可和逐漸大規(guī)模使用后,新的問題也隨之顯現(xiàn)。

在真實(shí)場景中,采集更自由了,但質(zhì)量控制隨之變難了。

動(dòng)作是否有效?軌跡是否合理?采集節(jié)奏是否適合訓(xùn)練?這些問題往往只有數(shù)據(jù)回傳清洗,開始拿來訓(xùn)模型的后處理階段才能發(fā)現(xiàn)。

大量低價(jià)值數(shù)據(jù)被一路送進(jìn)管線,清洗與返工成本迅速抬升,訓(xùn)練周期被不斷拉長。

所以關(guān)于UMI的“不可能三角”被抬到了臺(tái)前——

采集質(zhì)量、使用便捷性與后處理壓力三者難以同時(shí)優(yōu)化

如果追求采集質(zhì)量,就往往要犧牲便攜性;如果降低門檻提高便攜性,比如像傳統(tǒng)UMI僅靠腕部模組或“人-夾爪”采集,就又很難保證數(shù)據(jù)的可用性;如果希望用后處理階段兜底,就意味著要承受高昂的清洗、篩選與修復(fù)成本,訓(xùn)練閉環(huán)被迫拉長。

現(xiàn)有的UMI方案并沒有解決“采得的數(shù)據(jù)能不能用”這個(gè)問題——這一點(diǎn)恰恰對模型訓(xùn)練至關(guān)重要。

于是,穹徹團(tuán)隊(duì)決定回到問題的原點(diǎn),重新出發(fā)。

他們從第一性原理出發(fā),提出一個(gè)關(guān)鍵設(shè)想。

  • 如果模型訓(xùn)練最終還是要根據(jù)數(shù)據(jù)結(jié)構(gòu)做判斷與篩選,那么為什么這件事不能在數(shù)據(jù)采集階段就發(fā)生?

這個(gè)問題其實(shí)是行業(yè)遲遲沒直面解決的。因?yàn)橐坏┲纸鉀Q,就意味著采集邏輯、平臺(tái)架構(gòu)、成本結(jié)構(gòu)、人才組織……都得變。

而RoboPocket第一次把它變成了現(xiàn)實(shí)。



內(nèi)置一套實(shí)時(shí)運(yùn)行的“數(shù)據(jù)價(jià)值中樞系統(tǒng)”

相比于過往的UMI設(shè)備,RoboPocket的關(guān)鍵改變集中體現(xiàn)在采集目標(biāo)本身的定義上。

傳統(tǒng)UMI的普遍默認(rèn)采集目標(biāo)是“記錄人類操作行為”。

也就是通過腕部模組、夾爪、軌跡重建等方式,盡可能完整地還原人類執(zhí)行任務(wù)的過程。

在訓(xùn)練初期,這確實(shí)能為模型提供基本行為模板。

隨著模型走向更高維度、更長時(shí)序、更復(fù)雜場景,記錄動(dòng)作本身已不足以滿足訓(xùn)練所需

RoboPocket開始嘗試把采集的目標(biāo)轉(zhuǎn)向模型的能力缺口。

模型還不會(huì)的,才是最值得采的數(shù)據(jù)。

基于這個(gè)理念,RoboPocket系統(tǒng)內(nèi)置了一套實(shí)時(shí)運(yùn)行的“數(shù)據(jù)價(jià)值中樞系統(tǒng)”

這套系統(tǒng)不再等數(shù)據(jù)采完后才去篩選、分類、評(píng)估,而是在采集發(fā)生的當(dāng)下,就開始實(shí)時(shí)進(jìn)行判斷。

不難想象,一旦沒有模型視角,采集很容易在堆量的過程中滑向重復(fù)、失真和低價(jià)值。

只有知道模型此刻真正需要什么樣的數(shù)據(jù),才有能力搭建好這個(gè)中樞系統(tǒng)。

穹徹和上交大盧策吾團(tuán)隊(duì)敢攬這個(gè)瓷器活,人家是真有公認(rèn)的金剛鉆。

團(tuán)隊(duì)長期從事具身模型訓(xùn)練與數(shù)據(jù)閉環(huán)研究,既懂單點(diǎn)采集工具(此前推出過多款具身數(shù)據(jù)采集硬件),也懂圍繞具身模型訓(xùn)練、評(píng)估與數(shù)據(jù)回流的完整閉環(huán)研究。

他們最清楚哪些軌跡會(huì)變成有效訓(xùn)練信號(hào),哪些看起來熱鬧但只會(huì)拖慢訓(xùn)練,也更清楚模型在不同任務(wù)維度上的短板通常出在哪里,應(yīng)該用什么樣的樣本去補(bǔ)。

這種能力依賴的不只是工程實(shí)現(xiàn),而是對模型的長期理解與持續(xù)驗(yàn)證,所以很難被復(fù)制。



采集數(shù)據(jù)的過程中,RoboPocket同時(shí)在推進(jìn)并完成三件事——

第一是實(shí)時(shí)評(píng)估

在每一幀數(shù)據(jù)生成時(shí),系統(tǒng)都會(huì)判斷采集到的數(shù)據(jù)是否具備有效的訓(xùn)練信號(hào),比如操作是否完整、動(dòng)作是否在預(yù)期軌跡內(nèi)、場景是否具備信息量。

第二是即時(shí)引導(dǎo)

如果系統(tǒng)檢測到采集者的操作可能低效或錯(cuò)誤,比如動(dòng)作過快、夾爪超出操作區(qū)域、多樣性不足等,就會(huì)實(shí)時(shí)發(fā)出提醒,引導(dǎo)采集者進(jìn)行調(diào)整,避免采到低價(jià)值甚至廢棄的數(shù)據(jù)。



第三是動(dòng)態(tài)調(diào)度

這一環(huán)節(jié)則直接接入當(dāng)前模型的能力評(píng)估結(jié)果。

系統(tǒng)會(huì)根據(jù)模型在不同任務(wù)維度上的表現(xiàn),識(shí)別出當(dāng)前訓(xùn)練最需要補(bǔ)齊的樣本類型,并實(shí)時(shí)分發(fā)相應(yīng)的高優(yōu)先級(jí)采集任務(wù)給采集者。

說句更好理解的話,RoboPocket就是個(gè)24小時(shí)stand by的數(shù)據(jù)采集主理人

它即時(shí)診斷每一幀數(shù)據(jù)的質(zhì)量,智能指導(dǎo)甚至糾正采集員動(dòng)作,實(shí)時(shí)互動(dòng)動(dòng)態(tài)評(píng)估數(shù)據(jù)價(jià)值,為后處理提供篩選依據(jù)。

這樣一來,在采集階段,數(shù)據(jù)就和訓(xùn)練目標(biāo)保持貼合,顯著減少冗余,訓(xùn)練信號(hào)更加集中。

穹徹團(tuán)隊(duì)介紹,RoboPocket采集的數(shù)據(jù)在訓(xùn)練中展現(xiàn)出顯著優(yōu)勢

尤其是在開放復(fù)雜環(huán)境中的多步驟任務(wù)中,模型執(zhí)行的穩(wěn)定性更強(qiáng),不容易因光照變化、背景變化或任務(wù)干擾而出錯(cuò),準(zhǔn)確識(shí)別每一步的上下文意圖,在不確定情境下仍保持清晰的目標(biāo)推進(jìn)邏輯。

無論是精準(zhǔn)完成零食分揀裝袋,還是毛巾折疊整理,模型可以保持穩(wěn)定、高效的協(xié)同作業(yè),展現(xiàn)了卓越的雙臂協(xié)同與長序列操作能力。



此外,在環(huán)境復(fù)雜度提升、干擾增多的場景下,也能維持較高的成功率和一致性。

這顯現(xiàn)出一個(gè)重要趨勢

得益于采集過程更貼近真實(shí)任務(wù),采集體系增強(qiáng)了訓(xùn)練匹配能力,模型開始從“能夠粗糙地完成任務(wù)”向“能在非理想條件下可靠完成任務(wù)”演進(jìn)。

而數(shù)據(jù)采集開始成為面向模型能力補(bǔ)齊的持續(xù)行為,這讓數(shù)據(jù)采集開始具備閉環(huán)屬性。

一旦采集與模型訓(xùn)練形成聯(lián)動(dòng),整個(gè)數(shù)據(jù)系統(tǒng)的運(yùn)行效率將得到顯著提升。



從堆量走向邊采邊篩,數(shù)據(jù)采集的分水嶺來了

如果放進(jìn)更長的時(shí)間尺度來看,RoboPocket就不能視為一次孤立的產(chǎn)品更新。

機(jī)器人學(xué)習(xí)的發(fā)展,本質(zhì)上是一部數(shù)據(jù)采集方式不斷演進(jìn)的歷史。

最初,機(jī)器人只能在實(shí)驗(yàn)室中完成標(biāo)準(zhǔn)任務(wù),數(shù)據(jù)由少數(shù)研究人員在封閉環(huán)境中錄制。

隨著具身智能的發(fā)展,數(shù)據(jù)開始走向規(guī)模化采集場,遙操作與人機(jī)協(xié)作帶來大規(guī)模機(jī)器人數(shù)據(jù)。

2023年,穹徹智能聯(lián)合上海交通大學(xué)盧策吾團(tuán)隊(duì)共同發(fā)布RH20T,機(jī)器人操作數(shù)據(jù)在中國首次實(shí)現(xiàn)系統(tǒng)性的規(guī)模化采集。但截至這一時(shí)期,機(jī)器人數(shù)據(jù)采集依然主要依賴預(yù)設(shè)場景。

2024年,斯坦福大學(xué)推出的UMI讓采集設(shè)備更加輕量和簡單,數(shù)據(jù)采集開始轉(zhuǎn)向“自然發(fā)生”。

2025年,穹徹智能推出CoMiner伴隨式數(shù)據(jù)采集系統(tǒng),機(jī)器人開始走出采集場,進(jìn)入真實(shí)世界,在開放環(huán)境中獲取更加多樣、復(fù)雜的操作數(shù)據(jù)

梳理這個(gè)過程可以看到,具身數(shù)據(jù)一步步走出搭建的實(shí)驗(yàn)場景,愈來愈貼近現(xiàn)實(shí)。

2026年,RoboPocket的出現(xiàn),將機(jī)器人數(shù)據(jù)采集,從特定場所與專業(yè)系統(tǒng)徹底釋放到整個(gè)社會(huì)中



手機(jī)成為節(jié)點(diǎn),每個(gè)普通人可以參與采集。

無可否認(rèn),這是一次采集范式從“專業(yè)體系”走向“社會(huì)化網(wǎng)絡(luò)”的轉(zhuǎn)變。

當(dāng)然啦,采什么、怎么采、優(yōu)先級(jí)如何,這些都不是由人隨意決定的。

這時(shí)候,前端連接真實(shí)世界的分散場景,后端連接任務(wù)庫、模型訓(xùn)練與評(píng)估系統(tǒng)的RoboPocket,就起到了數(shù)據(jù)入口與調(diào)度中樞的雙角色作用



正因?yàn)橛羞@套持續(xù)在線的判斷與調(diào)度機(jī)制,數(shù)據(jù)采集才第一次具備了真正社會(huì)化的前提條件。

數(shù)采員可以是每一個(gè)普通人,但采集行為始終根據(jù)模型需求由數(shù)據(jù)中樞系統(tǒng)統(tǒng)一牽引調(diào)度。

長期來看,會(huì)推動(dòng)具身數(shù)據(jù)從工具競爭邁向體系競爭。

誰的數(shù)據(jù)采集流程更早地接入模型反饋、誰的任務(wù)設(shè)計(jì)天然適配訓(xùn)練目標(biāo),誰就能更快積累泛化能力與落地魯棒性。

行業(yè)普遍認(rèn)為具身智能還在上半場,期待著這個(gè)領(lǐng)域和大模型一樣,能夠用暴力美學(xué)帶來能力涌現(xiàn)。



所有人都在往具身模型里扔更多數(shù)據(jù),但真正贏的人,一定率先解決了其它更深層次的問題

既然如此,對想要持續(xù)scale up的具身智能行業(yè)來說,數(shù)據(jù)采集從源頭就對齊目標(biāo)就是一場遲早會(huì)發(fā)生的機(jī)制變動(dòng)。

因?yàn)槲磥砟P椭g的差距,很可能就源于數(shù)據(jù)閉環(huán)的建設(shè)深度。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
長沙正在流行“新型出軌”:不開房、不暖昧,卻比肉體背叛更誅心

長沙正在流行“新型出軌”:不開房、不暖昧,卻比肉體背叛更誅心

風(fēng)起見你
2026-04-16 02:29:16
美國商務(wù)部:在美國制裁下,中國休想大批量制造的AI芯片

美國商務(wù)部:在美國制裁下,中國休想大批量制造的AI芯片

顧史
2026-03-24 19:56:17
5月1日起,收3萬好處費(fèi)真就坐牢!老板、醫(yī)生、老師全被盯緊了

5月1日起,收3萬好處費(fèi)真就坐牢!老板、醫(yī)生、老師全被盯緊了

朗威談星座
2026-04-18 00:02:46
斯坦福報(bào)告:美國這個(gè)優(yōu)勢,中國要抹平了

斯坦福報(bào)告:美國這個(gè)優(yōu)勢,中國要抹平了

觀察者網(wǎng)
2026-04-17 08:51:06
澳門有多大

澳門有多大

新科文
2026-04-16 18:31:53
1:0到1:1,中超冠軍被打回原形,近4輪4分,離了裁判真不行?

1:0到1:1,中超冠軍被打回原形,近4輪4分,離了裁判真不行?

桃葉渡春
2026-04-18 00:56:02
吳瑞林被押赴刑場,行刑前主席密信強(qiáng)行叫停,死里逃生的他去海參崴干了啥大事?

吳瑞林被押赴刑場,行刑前主席密信強(qiáng)行叫停,死里逃生的他去海參崴干了啥大事?

歷史回憶室
2026-04-15 23:54:11
《乘風(fēng)2026》李小冉一公第1名!唱歌跑調(diào)卻火出圈,大家就是愛她

《乘風(fēng)2026》李小冉一公第1名!唱歌跑調(diào)卻火出圈,大家就是愛她

露珠聊影視
2026-04-17 18:39:19
中國代表:中方否決涉霍爾木茲海峽決議草案避免了局勢升級(jí)

中國代表:中方否決涉霍爾木茲海峽決議草案避免了局勢升級(jí)

環(huán)球網(wǎng)資訊
2026-04-17 08:15:23
丘成桐深圳演講:我每次跟中央大領(lǐng)導(dǎo)談話的時(shí)候,他們從來沒有問過我這個(gè)問題

丘成桐深圳演講:我每次跟中央大領(lǐng)導(dǎo)談話的時(shí)候,他們從來沒有問過我這個(gè)問題

深圳夢
2026-04-17 22:16:54
不管在哪里上班一定要記得:同事排擠、孤立你,你就直接這樣做

不管在哪里上班一定要記得:同事排擠、孤立你,你就直接這樣做

細(xì)說職場
2026-04-16 21:18:40
日本藥妝品牌“宮島制藥”實(shí)為國產(chǎn),百元痔瘡凝膠成本不到4元

日本藥妝品牌“宮島制藥”實(shí)為國產(chǎn),百元痔瘡凝膠成本不到4元

新京報(bào)
2026-04-16 13:47:14
梅西重磅官宣!收購西班牙俱樂部,正式開啟老板生涯

梅西重磅官宣!收購西班牙俱樂部,正式開啟老板生涯

夜白侃球
2026-04-17 10:46:23
廢掉一個(gè)人最快的方法:讓他學(xué)滿一肚子“無用的文化”

廢掉一個(gè)人最快的方法:讓他學(xué)滿一肚子“無用的文化”

青蘋果sht
2026-04-16 05:33:08
島內(nèi)民調(diào)炸鍋!鄭麗文返臺(tái)后支持率倒數(shù)第三,沈伯洋都比她高?

島內(nèi)民調(diào)炸鍋!鄭麗文返臺(tái)后支持率倒數(shù)第三,沈伯洋都比她高?

娛樂圈的筆娛君
2026-04-18 00:12:47
臺(tái)當(dāng)局:金門淡水是老天爺給的!這就是統(tǒng)一不能指望臺(tái)島主動(dòng)之故

臺(tái)當(dāng)局:金門淡水是老天爺給的!這就是統(tǒng)一不能指望臺(tái)島主動(dòng)之故

阿龍聊軍事
2026-04-17 19:30:12
特朗普“反向封鎖”霍爾木茲海峽,伊朗8000萬人恐難撐過一個(gè)月

特朗普“反向封鎖”霍爾木茲海峽,伊朗8000萬人恐難撐過一個(gè)月

民間胡扯老哥
2026-04-14 06:00:51
沙特退回我國激光武器?真相來了

沙特退回我國激光武器?真相來了

Ck的蜜糖
2026-04-17 11:49:55
Taylor Swift 霉霉在健身房,鍛煉健康體格

Taylor Swift 霉霉在健身房,鍛煉健康體格

下水道男孩
2026-04-11 23:22:29
林志穎兒子Kimi正臉照流出!身高1米8嘴凸不像爸爸 下半張臉成敗

林志穎兒子Kimi正臉照流出!身高1米8嘴凸不像爸爸 下半張臉成敗

阿尢說歷史
2026-04-15 04:39:58
2026-04-18 01:24:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12488文章數(shù) 176453關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺(tái)被罰沒35.97億元

頭條要聞

特朗普:感謝伊朗開放霍爾木茲海峽

頭條要聞

特朗普:感謝伊朗開放霍爾木茲海峽

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

又快又穩(wěn)的開掛動(dòng)力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
本地
數(shù)碼
公開課

藝術(shù)要聞

你絕對想不到!文森特的色粉作品竟如此驚艷!

今日熱點(diǎn):許光漢否認(rèn)和周子瑜戀情;郝熠然與誠實(shí)一口終止合作……

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

數(shù)碼要聞

蘋果今年將為兩款設(shè)備升級(jí) OLED 顯示屏

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版