網易首頁 > 網易號 > 正文申請入駐

終于，具身智能的“真機數據”難題有了新解法

2026-05-27 11:50:57　來源: 深響

北京舉報

分享至

??深響原創 · 作者｜林之柏

2026年，具身智能迎來新一輪空前熱潮。

春晚舞臺上宇樹“人機共武”、魔法原子“實景演出”相繼出圈，榮耀“閃電”則在北京亦莊人形機器人半程馬拉松刷新人類男子半馬世界紀錄，公眾熱情被一再點燃。資本側同樣反應積極，中國市場上估值超過100億人民幣的具身智能公司已超過20家。技術也在持續突破：從VLA到世界模型的迭代、到靈巧手的進展，具身智能逐步從Demo（演示）走向Deployment（實際部署）。

但不得不說的是，熱鬧背后，一個核心難題始終橫亙在行業面前：高質量真機數據極度匱乏。

中國信通院報告明確指出，具身智能是一個“由數據驅動的智能系統”。對于具身智能而言，數據是決定行業發展上限的關鍵變量。如果缺乏高質量數據，機器人就無法實現精準操作和場景泛化。

國家發改委相關新聞發言人也在最近的發布會上表示，下一步將加快具身智能訓練基礎設施建設，更好地支撐數據采集和“大小腦”模型訓練，以提升具身智能在不同場景的通用能力。

而且不同于大語言模型能規模化爬取文本數據，具身智能所需的描述人類運動、精細操作的真實數據少且難得。目前，全球文本數據早已達到萬億token級別，但高質量真機操作數據仍停留在百萬小時規模。

在這個戰略重地，成立于2025年2月、已累計完成數億元融資的靈御智能選擇了一條另類的路線：它不加入本體長相的內卷，而是定位為做面向具身智能的高精度物理世界數據基礎設施提供商，為行業提供高質量的本體和數據服務。

具身智能的數據困局與「不可能三角」

具身智能的數據困局由來已久，這是行業運行慣性、早期技術局限等一系列因素共同造成的。

目前，業內獲取數據的方式主要有四種。

第一種是仿真數據，即在模擬環境中生成機器人操作數據。這種方式最大問題是“虛實鴻溝”，仿真環境就算再精細，也很難準確還原現實世界的各種物理細節，比如物體之間的摩擦力、傳感器運行時的噪聲等。這些細節誤差，可能導致機器人無法適應真實工作環境。

第二種是人類行為數據，主要來源于視頻，讓機器人學習人類的操作動作。但人類的身體結構和機器人的機械結構存在差異，這就形成了“構型鴻溝”：人類的動作很難直接映射到機器人身上，比如手指靈活度、肢體協調性，數據實用性大打折扣。

第三種是人類示教數據，通過手持設備、動捕系統，或者拖動機械臂進行操作示教。這種方式更貼近機器人運動習性，但依然無法完全解決“構型鴻溝”，而且采集效率低，很難實現規模化。

第四種是真機遙操數據，由人類遠程控制機器人完成任務，同時記錄整個操作過程。這種方式優缺點都很明顯：優勢是更接近真實物理世界，獲得更高質量、多模態、可泛化的數據；短板在于采集成本高。

市面上品質較高的真機遙操機器人售價普遍偏高，按照行業通用的一年使用期計算、加上各類雜項成本，單任務每次的數據成本大概在3-5元，這還沒算大量設備、場地、操作人員開銷。

面對數據困局，巨頭與學術界的探索同樣未能提供公用解法：

比如特斯拉采用的封閉生態模式，數據質量夠硬，但僅供自身使用；斯坦福大學研發團隊推出的ALOHA方案，借助遠程操控系統，由用戶同時控制底座和兩個機器手臂來完成更多樣的任務，數據精細，只可惜更偏向實驗室場景，難以滿足工業級需求；國內的本體廠商則大多采用重資產模式，自搭場地、系統，投入大、效率偏低。

上述種種數采模式的優劣，業內爭議不斷，但無論哪種路線，似乎都無法突破具身智能數據的“不可能三角”：高質、高效、高性價比。

正因此，行業急需一種“工業化、標準化、低成本”的數據生產方式——而這，正是靈御智能試圖解決的核心問題。

打破「不可能三角」，靈御智能的另類解法

不同于很多強調“擬人化”表達、通用展示能力的機器人企業，靈御智能不執著于“做一個最像人的機器人”，反而關注一個更實際的問題：如何讓機器人穩定、高效地進入真實任務場景，持續產生高質量數據。

這種差異化定位，讓其跳出了主流賽道，在“高質、高效、低成本”這三個看似矛盾的需求之間，找到平衡點。

首先是提升效率，更注重動作采集執行速度和穩定性。

在第二屆中關村具身智能機器人應用大賽上，靈御的機器人在每個實際場景中的操作時間，都是同類競品的30%甚至更低，展現出極強的執行速度。

而得益于更強的動作完成能力、力控柔順性，靈御的機器人具備更高穩定性。力控柔順的機器人，能像“人”一樣自帶細膩“手感”，敏銳感知細微的受力分布、找準發力點。這讓機器人更自如地應對復雜任務，單日有效采集時間達10小時以上，任務完成條數超800條，大大提高采集效率。

第二屆中關村具身智能機器人應用大賽測試項目

其次是成本控制。靈御智能的核心產品TA機器人售價在10萬-20萬元區間，加上人工和各類雜項成本，單年成本控制在30萬元以下，每小時成本僅100-150元，單任務每次的數據成本約0.6元，和umi數據采集成本相當。

為什么靈御智能可以做到“低成本”？關鍵有兩點。

一是不盲目死磕昂貴硬件，而是從算法層面尋找突破口，這與SpaceX用不銹鋼替代鈦合金的思路很像，主打“花小錢辦大事”。

比如受力監測，業內通常會給每個關節配備諧波減速器和六維力傳感器，就像在機器人身上安裝一個高精度“電子秤”，靠物理手段監測不同運動狀態下的受力變化，數據極盡精細，但硬件成本很高。

靈御智能則采用低減速比的行星減速器，通過監測電機電流變化來估算受力。這套方案勝在“實在”：電流反饋的物理精度不如傳感器，但配合500赫茲的控制頻率，系統每兩毫秒就能獲取一次受力數據，實時調整剛度；再加上高精度標定和全局逆解算法，用更高性價比方案，實現了全柔性力控下的毫米級定位精度。

齒輪背隙優化也是同理。傳統機械方案要做到極小背隙，不僅要把齒輪的加工精度拉滿，中心距、預緊力甚至需要逐臺人工微調校準，成本高，還容易受溫度變形影響出現故障；靈御智能用廉價傳感器監測齒輪相對位置，通過算法實時補償背隙，最終實現的等效精度反而更高。

這些做法，其實是對機器人行業“硬件為王”思維的修正：過度依賴高端機械部件來提高數據精度，不僅推高了成本，還限制了生產力。算法+硬件的相互配合，節省成本之余，也并不會影響數據穩定性。

二是在產品設計邏輯上，始終以數據采集效率為核心進行優化。

比如砍掉脖子關節，用廣角攝像頭提供接近人眼的大視野，操作員無需控制機器人扭頭，就能覆蓋全部視野；采用模塊化設計，最容易磕碰損壞的小臂和手腕部分可以快速拆卸更換、無需整機返廠大修，大幅降低了維護成本和停機時間。

此外，還有更為關鍵的高數據質量。

靈御智能TA機器人集中發力時間、空間和信息密度三個維度。

時間維度上，TA機器人實現了S100、x86、激光雷達、相機全硬件亞微秒級同步，從系統底層保證多傳感器數據在統一時間軸上的高度一致性，杜絕“相機已經拍到動作，傳感器還沒記錄受力”等情況。

靈御智能聯合創始人、首席科學家莫一林透露，團隊把端到端的流程拆分成20個環節，每個環節的耗時都用示波器精確測量。

同時，相機提供嚴格的曝光開始時間、6 路相機觸發實現納秒級同步，從相機曝光到數據進入內存的整體延遲最低可控制在40毫秒。為此，靈御智能從CMOS選型階段就與供應商聯合開發、定制曝光時間等參數，從源頭保證時間精度、對齊多模態數據。相比之下，很多公司仍在使用通用USB攝像頭、內置預處理芯片，無法精準把控延時效果。

這和蘋果、特斯拉等廠商的思路是一致的。蘋果iOS生態的流暢性、穩定性為什么一直有口皆碑？正是因為它從芯片、系統到鏡頭等零部件一手抓，高度集成、高度統一。

信息密度上，TA機器人對力控數據、頭部4k雙目視覺數據、腕部2k雙目視覺數據和遙操作眼動數據全覆蓋，整體數據topic數量為行業最多。

空間精度上，TA機器人實現了0.1mm的重復定位精度和1mm的絕對精度，均處于行業領先水平。重復定位精度保證了單臺設備在重復執行任務時的穩定性，絕對精度則確保不同機器人之間的數據一致性，避免了因設備差異造成偏差。

不得不說，TA機器人的高質量數采，正正解決了行業的大難題。

此前業內很多公司都存在重復定位精度不足、不同設備采集數據不兼容、過于追求單一維度的精確度等問題。好不容易采集到數據，要么動作、受力存在偏差，要么精度達標但傳感器數據不同步、信息殘缺，以至于數據看起來豐富，但無法準確反映真實操作場景。

更重要的是，在傳統操作思路里，數據采集、上傳、清洗、標注、模型訓練等環節容易出現脫節，低質量數據不僅無法提高訓練質量，還會成為“負資產”。

而靈御智能對空間、時間和信息密度的兼顧，能最大限度避免數據脫節、信息單一，且數據集無需額外校準，可直接用于模型訓練，既節省了后續成本，也真正實現了數據的可泛化價值。

靈御智能數據采集平臺

立足于效率、成本和數據質量三重支撐，靈御智能顯然邁出打破「不可能三角」的關鍵一步。在這基礎上，靈御智能得以更進一層：構建“數據飛輪”，形成難以替代的核心競爭力。

過去，大部分機器人數據采集都屬于純投入模式：企業需要專門搭建采集場地、組織人員、運行設備，再把采集到的數據回流給模型團隊，流程繁瑣、效率低下。而靈御智能改變了這一邏輯——在它的方案中，機器人本身既是執行終端，也是數據入口。

在靈御智能的端云協同架構中，云端并不是簡單承擔遠程控制角色，而是與端側實時控制、本體執行、任務調度和專家模型形成協同。機器人在真實場景中完成任務的同時，視覺、力控、關節狀態等多模態數據持續回流，進入清洗、標注和訓練流程，反過來推動模型能力迭代。

其中，靈御TA機器人承擔著進入真實場景的物理執行角色，自研的低延遲通訊架構負責連接云端智能與機器人本體，而高質量真機數據飛輪則持續反哺模型訓練和能力迭代。

這就形成了“部署—數據—訓練—進化”的完整閉環：部署規模越大，真實場景越豐富，系統獲得的數據就越多；數據越多，模型能力就越強，進而提升機器人的執行能力，反過來又能采集更多高質量數據，實現自我強化。

“數據飛輪”的成型，離不開全鏈路的協同能力，這是靈御智能獨有的競爭壁壘。

行業內很多公司能做好機器人本體，但不一定能把云端AI穩定接入真實物理任務；有些公司能做好模型，但缺乏低延遲通訊技術和可落地的執行本體，而靈御智能實現了各環節的深度協同。

靈御智能和英特爾的合作是典型例子。此前，英特爾已開始使用靈御機器人開展模型訓練和數據采集，并提供云邊協同、數據處理與算力支持。雙方合作跑通了“數據—模型—執行”的閉環雛形：從真實任務中采集高質量數據，用于云端模型訓練，再將優化后的模型下發到機器人本體，進行執行驗證。

往后，類似的合作案例可能會越來越多，這也印證了其技術路線的可行性。

靈御智能 X 英特爾合作測試項目

從卷模型到卷數據，打破具身智能能力上限

隨著具身智能逐步告別概念炒作和樣機演示，進入規模化量產、商業化落地的關鍵階段，行業也從“卷模型”轉向“卷數據”。競爭重心正發生徹底改變，決定系統能力上限的，不再只是模型本身，而是它是否擁有足夠豐富的真實場景數據。

這種產業演進軌跡，與自動駕駛行業高度重合。正如特斯拉的核心壁壘從來不只是自動駕駛算法，還有其龐大的車輛部署規模，持續采集海量、真實路況數據。這些數據，才是調優算法應對極端天氣、突發路況等長尾問題的關鍵。

具身智能正走向類似的路徑：機器人只有走進各種復雜環境，持續與真實世界交互，才能獲得足夠的數據。

這便能看出靈御智能的獨特性：形成從設備、部署到數據交付的完整閉環，服務于科研機構、數據采集中心及復雜非結構化場景客戶，推動機器人數據從實驗驗證走向標準化、規模化生產。這讓其成功獲取了物理世界的數據入口，為機器人進入更復雜、更真實的任務環境提供數據基礎設施。

就像大模型時代的Scale AI，其價值不僅僅在于提供數據標注服務，更在于幫助行業建立了標準化的數據生產體系；在具身智能的領域，行業也需要靈御智能這樣的企業填補基礎設施層的空白。

靈御智能這種成為“基礎設施”的決心也貫穿在CEO金戈設定的2026年度目標中：全年出貨量突破800臺機器人；完成商業閉環驗證，在1-2個真實工作場景中，證明機器人能夠為客戶帶來正向ROI；構建數據資產，一年內為行業提供至少百萬小時、經過標準化處理、可直接用于模型訓練的高質量真機數據集。

靈御智能機器人應用于工業物流場景

這三個目標其實是環環相扣的：只有機器人部署規模上去，才能產生足夠豐富的場景數據；只有跑通商業閉環，才能證明基礎設施的商業價值；只有數據飛輪轉起來，才能發揮基礎設施的網絡效應——而這背后，或許也藏著整個具身智能行業未來幾年的真實發展方向。

未來，真正成熟的機器人，不會只存在于實驗室和演示視頻里，它們會走進餐廳、倉庫、醫院、工廠、商場，持續與真實世界發生交互；它們也會像今天的聯網汽車一樣，在工作過程中不斷學習、不斷進化；而每一次抓取、移動、任務失敗與修正，都會成為下一輪模型迭代的養分。

屆時，機器人產業真正重要的，可能不再是“制造機器人”，而是如何建立一張持續連接物理世界的數據網絡。誰能率先建立數據基礎設施，誰就更有機會找到這張數據網絡的入口。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.