近日,具身智能領域的頭部運動控制研發(fā)商橋介數(shù)物(BridgeDP Robotics)宣布,其自建的"跨本體全身運動數(shù)據(jù)工廠"(下文簡稱"運動數(shù)據(jù)工廠")正式投入使用。該中心短期內(nèi)將聚焦運動控制領域,以工業(yè)化、規(guī)模化的方式采集高質(zhì)量的跨本體全身運動數(shù)據(jù),并通過標準化數(shù)據(jù)管線與訓練回流機制,構(gòu)建"設計—采集—處理—訓練—反饋"的數(shù)據(jù)閉環(huán)體系,為其自研的通用運動控制平臺打造可持續(xù)演進的數(shù)據(jù)基礎設施。
![]()
01.
躬身入局,填補運動控制領域的數(shù)據(jù)真空
近年來,具身智能正經(jīng)歷從"算法驅(qū)動"向"數(shù)據(jù)驅(qū)動"的范式躍遷,行業(yè)對物理世界數(shù)據(jù)的需求快速增長。這一變化的背后,集中體現(xiàn)在以下三個層面:
首先,模型范式正在升級。早期機器人更多依賴"專家邏輯",需要工程師手動編寫控制規(guī)則,并通過少量實驗數(shù)據(jù)進行驗證。隨著行業(yè)轉(zhuǎn)向更先進的大模型體系,機器人同樣開始呈現(xiàn)出 Scaling Law(規(guī)模定律)的特征:模型參數(shù)規(guī)模越大,對動作數(shù)據(jù)的需求量也越大。要讓機器人像 ChatGPT 理解文字一樣理解物理世界,所需的是百萬甚至千萬小時級別的"環(huán)境—動作"配對數(shù)據(jù),數(shù)據(jù)缺口由此被迅速放大。
其次,工作場景正在從結(jié)構(gòu)化走向非結(jié)構(gòu)化。早期機器人主要在工廠、實驗室等結(jié)構(gòu)化場景中運行,地面平整、節(jié)拍固定、擾動可控;而通用機器人需要走出實驗室,進入家庭、戶外、工地、商超等真實環(huán)境,面對幾乎無窮無盡的長尾場景。以"行走"為例,看似單一的動作,落到瓷磚、地毯、濕滑路面、草地、樓梯、斜坡等不同地形上,所需的步態(tài)、重心調(diào)度與關節(jié)力矩完全不同;再疊加負重變化、被人推搡、踩空、絆倒等突發(fā)擾動,同時本體還需在極短時間內(nèi)完成姿態(tài)恢復。面對這些復雜變量,傳統(tǒng)實驗室數(shù)據(jù)采集方式與模態(tài)難以滿足需求。數(shù)據(jù)不再只是訓練素材,而是決定機器人能否從實驗室走向商業(yè)化應用的核心戰(zhàn)略資源。
最后,高維物理交互數(shù)據(jù)正在成為關鍵門檻。傳統(tǒng)工業(yè)機器人通常只需在固定坐標點之間重復執(zhí)行動作,并不需要真正理解環(huán)境與自身,因此對高維數(shù)據(jù)的需求較低。而當通用機器人進入家庭、戶外、工地等復雜環(huán)境后,關節(jié)力矩、足底壓力、本體感知(IMU、姿態(tài)、動量)、地面摩擦與動力學響應都成為必須解決的問題。互聯(lián)網(wǎng)上的海量視頻雖然內(nèi)容豐富,但本質(zhì)上主要是"RGB×時間"的像素組合,更多提供的是視覺語義信息——它可以告訴機器人"前面是一段樓梯",卻無法準確告訴機器人"上這級臺階需要多大的蹬伸力""踩到濕滑路面時該如何調(diào)整重心才能不摔倒"等關鍵物理信息。
近兩年,頭部具身智能本體廠商與上游企業(yè)已陸續(xù)把"數(shù)據(jù)"列入戰(zhàn)略議程,只是這股趨勢在不同方向上的落點并不均衡——運動控制相關的數(shù)據(jù)建設至今仍是一片明顯的洼地,甚至可以說是"真空地帶":行業(yè)內(nèi)現(xiàn)有的運動控制數(shù)據(jù)普遍存在供應不足、質(zhì)量參差不齊、構(gòu)型與場景局限性大等問題,遠遠跟不上模型訓練所需的規(guī)模。
造成這一局面的原因是多重的。一方面,運動控制領域技術(shù)門檻高、研發(fā)成本高、投入產(chǎn)出周期長,愿意長期深耕這一方向的企業(yè)本就鳳毛麟角,能夠持續(xù)為該領域生產(chǎn)高質(zhì)量數(shù)據(jù)的服務商自然更為稀少;另一方面,傳統(tǒng)的數(shù)據(jù)工廠更傾向于圍繞"操作(Manipulation)"任務采集數(shù)據(jù),原因也很現(xiàn)實——相比之下,這類數(shù)據(jù)在當下階段的商業(yè)路徑更為清晰。
面對這樣的行業(yè)現(xiàn)狀,橋介數(shù)物于半年前啟動了自建運動數(shù)據(jù)工廠的規(guī)劃工作。該決策既是橋介數(shù)物對行業(yè)數(shù)據(jù)荒的主動回應,也源于其自身業(yè)務發(fā)展的長期需求。具體而言,橋介數(shù)物將在短期內(nèi)聚焦運動控制領域,通過工業(yè)化手段大規(guī)模采集高質(zhì)量的跨本體全身運動數(shù)據(jù) ,逐步解決通用跨本體運動控制平臺訓練中的數(shù)據(jù)瓶頸,為自研平臺打造可靠的數(shù)據(jù)基礎設施。這一舉措不僅直面行業(yè)當下的數(shù)據(jù)困境,也標志著橋介數(shù)物正在從"依賴數(shù)據(jù)輸血"走向"自主生產(chǎn)數(shù)據(jù)"的能力躍遷。
02.
打造數(shù)據(jù)閉環(huán),構(gòu)建面向真實世界的能力演進體系
當以規(guī)模取勝的"暴力美學"技術(shù)路徑逐漸成為具身智能行業(yè)的主流,"數(shù)據(jù)稀缺"正從資源問題演變?yōu)槟芰栴}。企業(yè)能否持續(xù)獲取、處理并回流真實物理交互數(shù)據(jù),正在成為新的競爭分水嶺。
與此同時,數(shù)據(jù)規(guī)模固然決定具身智能模型演進的覆蓋廣度,但數(shù)據(jù)質(zhì)量(包括物理一致性、高保真度和可復用性)才是決定模型實機表現(xiàn)(In-field Performance)能否對齊訓練預期的核心因素。單純依賴數(shù)據(jù)規(guī)模擴張的方式正面臨邊際效益遞減,行業(yè)競爭的重心正在轉(zhuǎn)向高價值樣本的工程化定義、標準化生產(chǎn)與精細化清洗。
在橋介數(shù)物看來,運動數(shù)據(jù)工廠不僅是數(shù)據(jù)獲取端,更是數(shù)據(jù)閉環(huán)體系的起始節(jié)點。其核心邏輯,在于將數(shù)據(jù)置于"設計—采集—處理—訓練—反饋"的閉環(huán)鏈路中,從而提升單條數(shù)據(jù)的有效利用率,讓數(shù)據(jù)價值得到最大化釋放。
首先是前置定義與標準化采集。在采集啟動前,橋介數(shù)物會建立涵蓋動作分類、質(zhì)量權(quán)重、標簽維度、環(huán)境參數(shù)、位姿信息及質(zhì)檢標準在內(nèi)的準入體系,從物理層面確保原始數(shù)據(jù)的一致性與保真度。
其次是自動化數(shù)據(jù)管線處理。原始數(shù)據(jù)進入訓練環(huán)節(jié)前,將通過自研管線完成跨本體的數(shù)據(jù)清洗、動作重定向(retargeting)、異常修復及檢索調(diào)度,減少人工干預帶來的不確定性,并提高數(shù)據(jù)產(chǎn)出效率。得益于動作重定向等核心環(huán)節(jié),運動數(shù)據(jù)工廠的運動數(shù)據(jù)不再綁定特定的機器人構(gòu)型,而是可以便捷遷移至不同目標本體。區(qū)別于業(yè)內(nèi)常見的"一種本體對應一套數(shù)據(jù)"模式,這種機制讓數(shù)據(jù)的可復用性與跨本體遷移效率都有顯著提升。
最后是基于訓練表現(xiàn)的逆向反饋。訓練過程中的動作偏差、覆蓋率、適配成功率等定量信號,將實時回傳至采集中心;這些反饋會直接指導下一輪采集計劃的參數(shù)設定與動作篩選,實現(xiàn)從算法表現(xiàn)到數(shù)據(jù)生產(chǎn)的閉環(huán)調(diào)優(yōu)。
當前,行業(yè)正逐步從"模型驅(qū)動"走向"數(shù)據(jù)驅(qū)動"的新階段。對橋介數(shù)物而言,這也意味著要從"打造能力"進一步走向"用數(shù)據(jù)持續(xù)放大能力"。過去幾年,橋介數(shù)物已服務 30 余家具身智能企業(yè),完成 50 余款不同型號機器人本體的訓練與部署,并正在逐步將過往的項目經(jīng)驗沉淀為通用型平臺能力。這一過程不僅需要大量數(shù)據(jù),更需要數(shù)據(jù)在整個研發(fā)流程中形成閉環(huán),使平臺從依賴項目經(jīng)驗的離散優(yōu)化,逐步轉(zhuǎn)向由數(shù)據(jù)持續(xù)驅(qū)動的規(guī)模化迭代。由此,平臺整體能力的演進也將變得更加穩(wěn)定、可預測。
"數(shù)據(jù)不僅決定模型效果的上限和產(chǎn)品迭代速度,還會為公司的長期發(fā)展構(gòu)筑壁壘。"橋介數(shù)物創(chuàng)始人尚陽星表示,"算法會被追趕,工具鏈會被模仿,但高質(zhì)量、可持續(xù)、低成本、帶反饋閉環(huán)的數(shù)據(jù)體系,很難被快速復制。"
隨著通用運動控制平臺能力不斷提升,運動數(shù)據(jù)工廠持續(xù)產(chǎn)出的高物理保真動作數(shù)據(jù),也將被驗證為高質(zhì)量、可復用的資產(chǎn),有望沉淀出獨立的產(chǎn)業(yè)價值。運動數(shù)據(jù)工廠的角色也將由此延展:從內(nèi)部數(shù)據(jù)生產(chǎn)單元,逐步演進為面向行業(yè)的數(shù)據(jù)供給方與行業(yè)標準的共建者。
總體來看,運動數(shù)據(jù)工廠的投入使用,無論對現(xiàn)階段還是未來的橋介數(shù)物而言,都具有深遠意義。它不僅是橋介數(shù)物提升運動控制平臺訓練效率與泛化能力的重要支撐,也將成為其構(gòu)建通用運動控制底座的關鍵數(shù)據(jù)基礎設施。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.