允中 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
機(jī)器人學(xué)會(huì)撕茶包了。
不是先走過去、立定,再用手執(zhí)行動(dòng)作;而是在同一套策略中,把行走、姿態(tài)調(diào)整、軀干協(xié)同和手部精細(xì)操作統(tǒng)一起來——
一個(gè)模型,同時(shí)完成移動(dòng)與精細(xì)操作。
![]()
今天,Current Robotics發(fā)布全身靈巧操作模型Curr-0。
通過Single Policy,Curr-0能夠在同一個(gè)模型中耦合移動(dòng)、全身姿態(tài)協(xié)調(diào)與手部精細(xì)操作,實(shí)現(xiàn)全程自主執(zhí)行。這也是Current Robotics在機(jī)器人數(shù)據(jù)基礎(chǔ)設(shè)施與具身智能全棧訓(xùn)練系統(tǒng)上的最新成果。
在Curr-0的Demo中,機(jī)器人完成了撕茶包、點(diǎn)香、蓋章、撿起揉皺紙團(tuán),甚至抱著玩具穿過門口、蹲下放進(jìn)籃子等任務(wù)。這些看似簡(jiǎn)單的動(dòng)作,難點(diǎn)在于全身與手必須同時(shí)參與:站姿決定抓取,軀干決定可達(dá)性,身體重心影響施力方式。
手的問題,其實(shí)不在手
人類彎腰撿東西時(shí),雙腳、膝蓋、腰部、肩膀和手指都在同時(shí)調(diào)整。這是一個(gè)動(dòng)作,不是五個(gè)。
但機(jī)器人過去通常是這樣的:
走過去 → 停下 → 操作 → 再移動(dòng)
這套邏輯在工廠流水線上還能用,在真實(shí)世界里卻行不通。因?yàn)樽ト〉姆€(wěn)定性還取決于站姿,能不能夠得著還得看身體怎么配合。所以手足夠靈巧還不夠,還得看機(jī)器人的整個(gè)身體能不能和手一起協(xié)調(diào)起來。
對(duì)于機(jī)器人來說,移動(dòng)與操作從來不是兩個(gè)獨(dú)立問題,而是一個(gè)統(tǒng)一問題。Curr-0所解決的,正是這種全身靈巧操作(Loco-Dexterous Manipulation)能力。
一個(gè)模型掌控全身
Curr-0的實(shí)現(xiàn)關(guān)鍵,在于不是把移動(dòng)控制、全身姿態(tài)協(xié)調(diào)和手部精細(xì)操作視作三個(gè)獨(dú)立的模塊,而是將其作為一個(gè)統(tǒng)一問題端到端訓(xùn)練。
機(jī)器人不需要“先想好再動(dòng)”,而是在運(yùn)動(dòng)過程中讓全身與手實(shí)時(shí)耦合調(diào)整。單一模型,共享權(quán)重,全程自主。
同一個(gè)Policy同時(shí)負(fù)責(zé)身體移動(dòng)、姿態(tài)穩(wěn)定與精細(xì)操作,從而讓機(jī)器人真正具備全身協(xié)同完成任務(wù)的能力。
人形全身精細(xì)操作數(shù)據(jù)從哪里來
Curr-0基于21,000小時(shí)真實(shí)人類行為數(shù)據(jù)訓(xùn)練,其中包含2,800小時(shí)全身示教數(shù)據(jù)。
這些數(shù)據(jù)來自HumanEx——一套由Current Robotics自研的全身外骨骼數(shù)據(jù)采集系統(tǒng)。
![]()
不同于直接操控機(jī)器人的遙操作方案,HumanEx讓人類穿戴外骨骼設(shè)備,在真實(shí)場(chǎng)景中自然完成任務(wù)。
由于無需控制機(jī)器人本體,HumanEx可以直接部署在工廠、實(shí)驗(yàn)室、辦公室等真實(shí)場(chǎng)景中進(jìn)行數(shù)據(jù)采集,系統(tǒng)同步記錄全身姿態(tài)、關(guān)節(jié)運(yùn)動(dòng)、手部動(dòng)作、本體感知、肌電信號(hào)和環(huán)境交互數(shù)據(jù),并轉(zhuǎn)化為機(jī)器人可學(xué)習(xí)的訓(xùn)練素材。
這類數(shù)據(jù)不僅記錄了“手怎么動(dòng)”,更關(guān)鍵的是記住了“全身如何配合手完成任務(wù)”:腳如何站穩(wěn),軀干如何調(diào)整,身體如何施力,手指如何在接觸瞬間完成精細(xì)控制。
Current Robotics認(rèn)為,數(shù)據(jù)并不是訓(xùn)練模型的副產(chǎn)品,而是具身智能系統(tǒng)的核心基礎(chǔ)設(shè)施。
HumanEx將數(shù)據(jù)規(guī)模的增長(zhǎng)路徑從“機(jī)器人部署小時(shí)數(shù)”切換為“人類任務(wù)小時(shí)數(shù)”——數(shù)據(jù)飛輪不再受制于機(jī)器人的部署數(shù)量,而是隨真實(shí)人類任務(wù)持續(xù)增長(zhǎng)。
下一步:多物理模態(tài)交互世界模型
Current Robotics認(rèn)為,僅靠真實(shí)機(jī)器人訓(xùn)練并不足以支撐大規(guī)模迭代。物理世界不能規(guī)模化——一臺(tái)機(jī)器人每次測(cè)試都消耗硬件、能源和人力,失敗無法回滾,場(chǎng)景無法按需重置。
因此,該團(tuán)隊(duì)正在構(gòu)建覆蓋視覺、本體感知、力覺等物理信號(hào)的多物理模態(tài)交互世界模型,希望將評(píng)測(cè)、后訓(xùn)練和部署驗(yàn)證從真實(shí)硬件遷移到可擴(kuò)展的數(shù)字環(huán)境中。
在此基礎(chǔ)上,Current Robotics提出Human-in-the-World-Model框架:人類可以直接在世界模型中介入修正策略,修正結(jié)果隨即用于后續(xù)訓(xùn)練,從而降低后訓(xùn)練對(duì)真實(shí)機(jī)器人部署和人工干預(yù)的依賴。
從數(shù)據(jù)到部署,全棧閉合
從HumanEx采集真實(shí)人類數(shù)據(jù),到Curr-0端到端訓(xùn)練,再到世界模型評(píng)測(cè),最后到Human-in-the-World-Model后訓(xùn)練與部署——數(shù)據(jù)、模型、評(píng)測(cè)、部署四個(gè)環(huán)節(jié)在同一套體系內(nèi)持續(xù)迭代。
由此可見Current Robotics真正想要做的不是單點(diǎn)突破,而是全棧閉合。
隨著人類行為數(shù)據(jù)的持續(xù)積累,模型能力可以不斷提升,而不依賴機(jī)器人Fleet的規(guī)模擴(kuò)張。
當(dāng)行業(yè)開始從“讓機(jī)器人看懂世界”走向“讓機(jī)器人真正改變世界”,全身靈巧操作正在成為下一代人形機(jī)器人的核心能力之一。
從數(shù)據(jù)采集到模型訓(xùn)練,再到世界模型和部署驗(yàn)證,Current Robotics正在嘗試構(gòu)建一套完整的具身智能基礎(chǔ)設(shè)施。
而Curr-0,是Current Robotics全棧路線的一次階段性成果展示。
技術(shù)報(bào)告:
current-robotics.com/blog/curr-0
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.