![]()
“機器人大腦跟不上?建具身智能數據基座
具身智能領域存在一個有趣現象:在視頻與展會的“秀場”中,機器人表現“炸裂”,跳舞、格斗無所不能;但在實際應用中,可能連簡單的端茶倒水都做不了。
其實,這是當前具身智能產業普遍存在的“大小腦”發展失衡問題:機器人本體與小腦運動控制技術日趨成熟,但“大腦”的迭代進化相對滯后。換句話說,四肢發達,頭腦簡單。
某種程度上,傳統AI像“應試教育”,訓練完就定型,而真正的具身持續學習則倡導“素質教育”,與時俱進。4月28日,樂聚機器人正式發布數據采集訓練場2.0。在這里,既像是一個“學校”——學習各種技能,又像是一個培訓實習的“工廠”,即機器人在各行業正式“上崗”前,從這里學習、練習各類技能。
從“教機器人干活”到“讓機器人自己學會干活”,悄然間,樂聚也在從單純的“造機器”加速向更深層次的“養數據”轉身。
![]()
機器人大腦跟不上?
建具身智能數據基座
從春晚再到馬拉松賽跑,人們也在持續追問,從“能動”到“能用、可用、好用”,到底還缺點什么?
問題的關鍵是數據。數據是具身智能的“燃料”,是算法、算力之外決定智能系統能力上限的關鍵變量。如果具身智能機器人“答非所問”,跑步時會因自身不穩而摔倒,這些都與缺乏高質量數據有關。
機器人對數據到底有“饑渴”?數據顯示,截至2026年初,全球高質量真實物理交互數據總量僅約50萬小時,不足大語言模型訓練數據的兩萬分之一。
相比大語音模型是“數據越多、參數越大、能力越強”,具身智能的數據是物理世界的反饋——力矩、摩擦、形變——不能在仿真里完美生成,也不能在互聯網上隨便爬取。
比如說,摘草莓,人操作起來很容易的一件事,但對具身智能機器人來說,卻繁瑣無比:機器人需先識別果實位置,再調整機械臂角度完成抓取,最后將果實放入容器,僅摘取力度就要反復試驗:力度過小果實無法脫落,過大則會造成損傷。這背后,需要大量數據和多模態的AI訓練。
![]()
當“量”的邊際收益遞減時,行業自然轉向“質”的基礎設施建設。于是,具身智能的敘事規則正發生變化,從2025年“誰的模型更大、運動能力越強”,轉變為2026年“誰的數據基礎設施更強”;去年行業還在拼模型參數量和預訓練數據規模,今年頭部企業和地方政府則在加速建訓練場。
繼具身智能首次寫入2025年政府工作報告后,“十五五”規劃綱要也明確提出,統籌布局具身智能實訓場,推進虛實融合協同訓練。
地方層面也在同步落地:四川省“十五五”規劃專項提出加快建設大模型訓練場、具身智能機器人訓練場。北京石景山40余家“政產學研用”單位成立具身智能數據要素產業聯盟,這是從“各建各的”走向“協同作戰”的信號。
就在4月底,廣東省人民政府辦公廳印發《廣東省加快推進人工智能全域全時全行業高水平應用行動方案》。方案提出,重點布局人形機器人設計制造,推動人工智能與機器人“大腦”“小腦”及機身協同研發,突破多模態感知融合、自適應決策等關鍵技術。
其中還特別提及,支持廣州、深圳等地建設具身智能訓練場體系,為模型研發與驗證提供數據訓練和驗證支撐。
在此之前,樂聚已搭建了國內最大的人形機器人數據訓練中心,訓練場聚焦工業智造、智慧家庭、康養服務及5G融合四大前沿場景,建立高質量的技能模型庫。
在這里,人形機器人“夸父們”日復一日地“上學”,通過動作捕捉、VR遙操作、真機數據采集,掌握20余項原子技能,執行成功率超過95%。從“能走”到“會干”,從“聽話”到“懂你”。
![]()
精度不夠?
建高質量數據集
具身智能機器人的大腦要做的不是“能不能走”,而是“走到一個復雜環境里,能不能識別任務、理解場景、完成操作”。光照變了怎么辦?物體從沒見過的形狀怎么辦?力反饋超出預期怎么辦?這些問題不是算法不夠好,歸根結底,還是訓練數據不夠多、不夠廣、不夠高質量。
樂聚進一步豐富了產品矩陣,形成了多本體具身數據,首發LET三級具身數據矩陣,精準適配輪臂、靈巧手與全尺寸人形三大硬件平臺。問題來了,真的需要這么多平臺?
其實,沒有哪一條是完美的路線,目前呈現出多條技術路線齊頭并進,包括真機遙操作、便攜采集、仿真合成等維度破解數據難題。
比如,遙操作真機采集是行業公認質量最高的方案。但成本仍是這條路線繞不開的問題——單小時有效數據成本價格不菲,而且操作員上手門檻極高。
便攜采集是目前規模化速度最快的方向,但抓取物體該用多大力道?如何避開障礙?門把手旋轉多少度才能開門?這些都需要機器人通過海量視覺、觸覺與運動數據反復學習。
為了教機器人干活,訓練場2.0把數據采集分成了三個不同的維度:
輪臂操作,輪臂機器人通過VR+全身增量遙操覆蓋抓、拿、放等高頻標準動作,滿足規模化流水線作業;
靈巧手操作,搭載觸覺靈巧手與腕部六維力傳感器,聚焦捏、扣、握等五指精細交互,突破復雜手眼協同瓶頸;
全尺寸人形操作,整合搬、蹲、走等大范圍擬人作業,實現多關節協同與全向移動控制。
觸覺、數采和雙臂協同被組合成可部署的操作棧,推動具身智能從“部件參數”轉向“整機能否連續干活”。把每一次執行都變成下一輪訓練數據,意味著未來高質量操作數據的供給速度,可能會比硬件參數更早拉開差距。
![]()
數據采集之路絕非一帆風順。樂聚還打造端到端的一站式數據管理工具鏈,實現從采集到交付的工業化閉環,比如,在數據采集環節,保證全信號同步誤差小于10ms,杜絕視覺、力覺與關節數據時序錯位。
這什么意思?如果存在延遲過長,機器人關節會出現抖動,數控機床加工精度下降,靈巧手剛接觸到草莓還沒來得及停止就往前戳破了……
試想一下,當樂聚率先建成覆蓋全場景的大規模真機實采數據集訓練場,未來一臺機器人能穩穩接住你遞來的玻璃杯,那種精度背后,可能正是來自這片訓練場默默積累的成果。
需求斷層?
為大腦進化建“高速”
當機器人在虛擬世界中完成“通識教育”,再通過真機實訓完成“專業深造”,大幅提升訓練效率與泛化能力,就可以進一步走到真實場景中來。
訓練場1:1還原了包裹分揀、鈑金上料、日化翻瓶、商超貨架拿取等核心作業流,“學徒”們也在努力學習分揀快遞、料箱拆垛、端咖啡等等。
這意味著人形機器人從實驗室走向真實世界的門檻正在消融,有望批量進廠“打工”,形成新的“通用勞動力”。
樂聚并沒有獨享這套底層基礎設施,而是聯合產業上下游,共建開放、透明、可持續的具身智能數據生態。這樣的一條數據“高速公路”,其核心邏輯并非提供幾間實驗室那么簡單,而是通過建設一個集中式、標準化的基礎設施,將原本分散、昂貴的機器人數據采集與訓練過程,轉變為集約、經濟的公共服務,吸引產業鏈核心企業在此集聚。
![]()
當前,中國發展具身智能的優勢在于豐富的場景應用,可以通過訓練場的產業帶動,將上中下游企業緊密聯結在一起,補齊靈巧手、電機、軟件等產業鏈環節短板,讓具身智能機器人產業從“單點突破”邁向“集群成勢”。從制造車間到家庭空間,從物流作業到醫療康復,訓練場將成為具身智能技術迭代的“孵化器”,推動人形機器人加速賦能千行百業。
面對行業的“數據墻”,樂聚修路架橋,并開放“數據工廠”,要成為機器人產業的數據與平臺賦能者。或許,修筑道路、保障供給的“基建商”,工作不那么炫目,卻實實在在地決定著行業能走多快、走多遠。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.