網易首頁 > 網易號 > 正文申請入駐

在“數據荒漠”上修路，具身智能有了“基建商” | 預見AI+

2026-05-07 13:44:22　來源: 數據猿DataYuan

內蒙古舉報

分享至

“機器人大腦跟不上？建具身智能數據基座

具身智能領域存在一個有趣現象：在視頻與展會的“秀場”中，機器人表現“炸裂”，跳舞、格斗無所不能；但在實際應用中，可能連簡單的端茶倒水都做不了。

其實，這是當前具身智能產業普遍存在的“大小腦”發展失衡問題：機器人本體與小腦運動控制技術日趨成熟，但“大腦”的迭代進化相對滯后。換句話說，四肢發達，頭腦簡單。

某種程度上，傳統AI像“應試教育”，訓練完就定型，而真正的具身持續學習則倡導“素質教育”，與時俱進。4月28日，樂聚機器人正式發布數據采集訓練場2.0。在這里，既像是一個“學校”——學習各種技能，又像是一個培訓實習的“工廠”，即機器人在各行業正式“上崗”前，從這里學習、練習各類技能。

從“教機器人干活”到“讓機器人自己學會干活”，悄然間，樂聚也在從單純的“造機器”加速向更深層次的“養數據”轉身。

機器人大腦跟不上？

建具身智能數據基座

從春晚再到馬拉松賽跑，人們也在持續追問，從“能動”到“能用、可用、好用”，到底還缺點什么？

問題的關鍵是數據。數據是具身智能的“燃料”，是算法、算力之外決定智能系統能力上限的關鍵變量。如果具身智能機器人“答非所問”，跑步時會因自身不穩而摔倒，這些都與缺乏高質量數據有關。

機器人對數據到底有“饑渴”？數據顯示，截至2026年初，全球高質量真實物理交互數據總量僅約50萬小時，不足大語言模型訓練數據的兩萬分之一。

相比大語音模型是“數據越多、參數越大、能力越強”，具身智能的數據是物理世界的反饋——力矩、摩擦、形變——不能在仿真里完美生成，也不能在互聯網上隨便爬取。

比如說，摘草莓，人操作起來很容易的一件事，但對具身智能機器人來說，卻繁瑣無比：機器人需先識別果實位置，再調整機械臂角度完成抓取，最后將果實放入容器，僅摘取力度就要反復試驗：力度過小果實無法脫落，過大則會造成損傷。這背后，需要大量數據和多模態的AI訓練。

當“量”的邊際收益遞減時，行業自然轉向“質”的基礎設施建設。于是，具身智能的敘事規則正發生變化，從2025年“誰的模型更大、運動能力越強”，轉變為2026年“誰的數據基礎設施更強”；去年行業還在拼模型參數量和預訓練數據規模，今年頭部企業和地方政府則在加速建訓練場。

繼具身智能首次寫入2025年政府工作報告后，“十五五”規劃綱要也明確提出，統籌布局具身智能實訓場，推進虛實融合協同訓練。

地方層面也在同步落地：四川省“十五五”規劃專項提出加快建設大模型訓練場、具身智能機器人訓練場。北京石景山40余家“政產學研用”單位成立具身智能數據要素產業聯盟，這是從“各建各的”走向“協同作戰”的信號。

就在4月底，廣東省人民政府辦公廳印發《廣東省加快推進人工智能全域全時全行業高水平應用行動方案》。方案提出，重點布局人形機器人設計制造，推動人工智能與機器人“大腦”“小腦”及機身協同研發，突破多模態感知融合、自適應決策等關鍵技術。

其中還特別提及，支持廣州、深圳等地建設具身智能訓練場體系，為模型研發與驗證提供數據訓練和驗證支撐。

在此之前，樂聚已搭建了國內最大的人形機器人數據訓練中心，訓練場聚焦工業智造、智慧家庭、康養服務及5G融合四大前沿場景，建立高質量的技能模型庫。

在這里，人形機器人“夸父們”日復一日地“上學”，通過動作捕捉、VR遙操作、真機數據采集，掌握20余項原子技能，執行成功率超過95%。從“能走”到“會干”，從“聽話”到“懂你”。

精度不夠？

建高質量數據集

具身智能機器人的大腦要做的不是“能不能走”，而是“走到一個復雜環境里，能不能識別任務、理解場景、完成操作”。光照變了怎么辦？物體從沒見過的形狀怎么辦？力反饋超出預期怎么辦？這些問題不是算法不夠好，歸根結底，還是訓練數據不夠多、不夠廣、不夠高質量。

樂聚進一步豐富了產品矩陣，形成了多本體具身數據，首發LET三級具身數據矩陣，精準適配輪臂、靈巧手與全尺寸人形三大硬件平臺。問題來了，真的需要這么多平臺？

其實，沒有哪一條是完美的路線，目前呈現出多條技術路線齊頭并進，包括真機遙操作、便攜采集、仿真合成等維度破解數據難題。

比如，遙操作真機采集是行業公認質量最高的方案。但成本仍是這條路線繞不開的問題——單小時有效數據成本價格不菲，而且操作員上手門檻極高。

便攜采集是目前規模化速度最快的方向，但抓取物體該用多大力道？如何避開障礙？門把手旋轉多少度才能開門？這些都需要機器人通過海量視覺、觸覺與運動數據反復學習。

為了教機器人干活，訓練場2.0把數據采集分成了三個不同的維度：

輪臂操作，輪臂機器人通過VR+全身增量遙操覆蓋抓、拿、放等高頻標準動作，滿足規模化流水線作業；

靈巧手操作，搭載觸覺靈巧手與腕部六維力傳感器，聚焦捏、扣、握等五指精細交互，突破復雜手眼協同瓶頸；

全尺寸人形操作，整合搬、蹲、走等大范圍擬人作業，實現多關節協同與全向移動控制。

觸覺、數采和雙臂協同被組合成可部署的操作棧，推動具身智能從“部件參數”轉向“整機能否連續干活”。把每一次執行都變成下一輪訓練數據，意味著未來高質量操作數據的供給速度，可能會比硬件參數更早拉開差距。

數據采集之路絕非一帆風順。樂聚還打造端到端的一站式數據管理工具鏈，實現從采集到交付的工業化閉環，比如，在數據采集環節，保證全信號同步誤差小于10ms，杜絕視覺、力覺與關節數據時序錯位。

這什么意思？如果存在延遲過長，機器人關節會出現抖動，數控機床加工精度下降，靈巧手剛接觸到草莓還沒來得及停止就往前戳破了……

試想一下，當樂聚率先建成覆蓋全場景的大規模真機實采數據集訓練場，未來一臺機器人能穩穩接住你遞來的玻璃杯，那種精度背后，可能正是來自這片訓練場默默積累的成果。

需求斷層？

為大腦進化建“高速”

當機器人在虛擬世界中完成“通識教育”，再通過真機實訓完成“專業深造”，大幅提升訓練效率與泛化能力，就可以進一步走到真實場景中來。

訓練場1:1還原了包裹分揀、鈑金上料、日化翻瓶、商超貨架拿取等核心作業流，“學徒”們也在努力學習分揀快遞、料箱拆垛、端咖啡等等。

這意味著人形機器人從實驗室走向真實世界的門檻正在消融，有望批量進廠“打工”，形成新的“通用勞動力”。

樂聚并沒有獨享這套底層基礎設施，而是聯合產業上下游，共建開放、透明、可持續的具身智能數據生態。這樣的一條數據“高速公路”，其核心邏輯并非提供幾間實驗室那么簡單，而是通過建設一個集中式、標準化的基礎設施，將原本分散、昂貴的機器人數據采集與訓練過程，轉變為集約、經濟的公共服務，吸引產業鏈核心企業在此集聚。

當前，中國發展具身智能的優勢在于豐富的場景應用，可以通過訓練場的產業帶動，將上中下游企業緊密聯結在一起，補齊靈巧手、電機、軟件等產業鏈環節短板，讓具身智能機器人產業從“單點突破”邁向“集群成勢”。從制造車間到家庭空間，從物流作業到醫療康復，訓練場將成為具身智能技術迭代的“孵化器”，推動人形機器人加速賦能千行百業。

面對行業的“數據墻”，樂聚修路架橋，并開放“數據工廠”，要成為機器人產業的數據與平臺賦能者。或許，修筑道路、保障供給的“基建商”，工作不那么炫目，卻實實在在地決定著行業能走多快、走多遠。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.