![]()
??深響原創 · 作者|林之柏
2026年,具身智能迎來新一輪空前熱潮。
春晚舞臺上宇樹“人機共武”、魔法原子“實景演出”相繼出圈,榮耀“閃電”則在北京亦莊人形機器人半程馬拉松刷新人類男子半馬世界紀錄,公眾熱情被一再點燃。資本側同樣反應積極,中國市場上估值超過100億人民幣的具身智能公司已超過20家。技術也在持續突破:從VLA到世界模型的迭代、到靈巧手的進展,具身智能逐步從Demo(演示)走向Deployment(實際部署)。
但不得不說的是,熱鬧背后,一個核心難題始終橫亙在行業面前:高質量真機數據極度匱乏。
中國信通院報告明確指出,具身智能是一個“由數據驅動的智能系統”。對于具身智能而言,數據是決定行業發展上限的關鍵變量。如果缺乏高質量數據,機器人就無法實現精準操作和場景泛化。
國家發改委相關新聞發言人也在最近的發布會上表示,下一步將加快具身智能訓練基礎設施建設,更好地支撐數據采集和“大小腦”模型訓練,以提升具身智能在不同場景的通用能力。
而且不同于大語言模型能規模化爬取文本數據,具身智能所需的描述人類運動、精細操作的真實數據少且難得。目前,全球文本數據早已達到萬億token級別,但高質量真機操作數據仍停留在百萬小時規模。
在這個戰略重地,成立于2025年2月、已累計完成數億元融資的靈御智能選擇了一條另類的路線:它不加入本體長相的內卷,而是定位為做面向具身智能的高精度物理世界數據基礎設施提供商,為行業提供高質量的本體和數據服務。
![]()
具身智能的數據困局與「不可能三角」
具身智能的數據困局由來已久,這是行業運行慣性、早期技術局限等一系列因素共同造成的。
目前,業內獲取數據的方式主要有四種。
第一種是仿真數據,即在模擬環境中生成機器人操作數據。這種方式最大問題是“虛實鴻溝”,仿真環境就算再精細,也很難準確還原現實世界的各種物理細節,比如物體之間的摩擦力、傳感器運行時的噪聲等。這些細節誤差,可能導致機器人無法適應真實工作環境。
第二種是人類行為數據,主要來源于視頻,讓機器人學習人類的操作動作。但人類的身體結構和機器人的機械結構存在差異,這就形成了“構型鴻溝”:人類的動作很難直接映射到機器人身上,比如手指靈活度、肢體協調性,數據實用性大打折扣。
第三種是人類示教數據,通過手持設備、動捕系統,或者拖動機械臂進行操作示教。這種方式更貼近機器人運動習性,但依然無法完全解決“構型鴻溝”,而且采集效率低,很難實現規模化。
第四種是真機遙操數據,由人類遠程控制機器人完成任務,同時記錄整個操作過程。這種方式優缺點都很明顯:優勢是更接近真實物理世界,獲得更高質量、多模態、可泛化的數據;短板在于采集成本高。
市面上品質較高的真機遙操機器人售價普遍偏高,按照行業通用的一年使用期計算、加上各類雜項成本,單任務每次的數據成本大概在3-5元,這還沒算大量設備、場地、操作人員開銷。
![]()
面對數據困局,巨頭與學術界的探索同樣未能提供公用解法:
比如特斯拉采用的封閉生態模式,數據質量夠硬,但僅供自身使用;斯坦福大學研發團隊推出的ALOHA方案,借助遠程操控系統,由用戶同時控制底座和兩個機器手臂來完成更多樣的任務,數據精細,只可惜更偏向實驗室場景,難以滿足工業級需求;國內的本體廠商則大多采用重資產模式,自搭場地、系統,投入大、效率偏低。
上述種種數采模式的優劣,業內爭議不斷,但無論哪種路線,似乎都無法突破具身智能數據的“不可能三角”:高質、高效、高性價比。
正因此,行業急需一種“工業化、標準化、低成本”的數據生產方式——而這,正是靈御智能試圖解決的核心問題。
打破「不可能三角」,靈御智能的另類解法
不同于很多強調“擬人化”表達、通用展示能力的機器人企業,靈御智能不執著于“做一個最像人的機器人”,反而關注一個更實際的問題:如何讓機器人穩定、高效地進入真實任務場景,持續產生高質量數據。
這種差異化定位,讓其跳出了主流賽道,在“高質、高效、低成本”這三個看似矛盾的需求之間,找到平衡點。
首先是提升效率,更注重動作采集執行速度和穩定性。
在第二屆中關村具身智能機器人應用大賽上,靈御的機器人在每個實際場景中的操作時間,都是同類競品的30%甚至更低,展現出極強的執行速度。
而得益于更強的動作完成能力、力控柔順性,靈御的機器人具備更高穩定性。力控柔順的機器人,能像“人”一樣自帶細膩“手感”,敏銳感知細微的受力分布、找準發力點。這讓機器人更自如地應對復雜任務,單日有效采集時間達10小時以上,任務完成條數超800條,大大提高采集效率。
![]()
第二屆中關村具身智能機器人應用大賽測試項目
其次是成本控制。靈御智能的核心產品TA機器人售價在10萬-20萬元區間,加上人工和各類雜項成本,單年成本控制在30萬元以下,每小時成本僅100-150元,單任務每次的數據成本約0.6元,和umi數據采集成本相當。
為什么靈御智能可以做到“低成本”?關鍵有兩點。
一是不盲目死磕昂貴硬件,而是從算法層面尋找突破口,這與SpaceX用不銹鋼替代鈦合金的思路很像,主打“花小錢辦大事”。
比如受力監測,業內通常會給每個關節配備諧波減速器和六維力傳感器,就像在機器人身上安裝一個高精度“電子秤”,靠物理手段監測不同運動狀態下的受力變化,數據極盡精細,但硬件成本很高。
靈御智能則采用低減速比的行星減速器,通過監測電機電流變化來估算受力。這套方案勝在“實在”:電流反饋的物理精度不如傳感器,但配合500赫茲的控制頻率,系統每兩毫秒就能獲取一次受力數據,實時調整剛度;再加上高精度標定和全局逆解算法,用更高性價比方案,實現了全柔性力控下的毫米級定位精度。
齒輪背隙優化也是同理。傳統機械方案要做到極小背隙,不僅要把齒輪的加工精度拉滿,中心距、預緊力甚至需要逐臺人工微調校準,成本高,還容易受溫度變形影響出現故障;靈御智能用廉價傳感器監測齒輪相對位置,通過算法實時補償背隙,最終實現的等效精度反而更高。
這些做法,其實是對機器人行業“硬件為王”思維的修正:過度依賴高端機械部件來提高數據精度,不僅推高了成本,還限制了生產力。算法+硬件的相互配合,節省成本之余,也并不會影響數據穩定性。
二是在產品設計邏輯上,始終以數據采集效率為核心進行優化。
比如砍掉脖子關節,用廣角攝像頭提供接近人眼的大視野,操作員無需控制機器人扭頭,就能覆蓋全部視野;采用模塊化設計,最容易磕碰損壞的小臂和手腕部分可以快速拆卸更換、無需整機返廠大修,大幅降低了維護成本和停機時間。
![]()
此外,還有更為關鍵的高數據質量。
靈御智能TA機器人集中發力時間、空間和信息密度三個維度。
時間維度上,TA機器人實現了S100、x86、激光雷達、相機全硬件亞微秒級同步,從系統底層保證多傳感器數據在統一時間軸上的高度一致性,杜絕“相機已經拍到動作,傳感器還沒記錄受力”等情況。
靈御智能聯合創始人、首席科學家莫一林透露,團隊把端到端的流程拆分成20個環節,每個環節的耗時都用示波器精確測量。
同時,相機提供嚴格的曝光開始時間、6 路相機觸發實現納秒級同步,從相機曝光到數據進入內存的整體延遲最低可控制在40毫秒。為此,靈御智能從CMOS選型階段就與供應商聯合開發、定制曝光時間等參數,從源頭保證時間精度、對齊多模態數據。相比之下,很多公司仍在使用通用USB攝像頭、內置預處理芯片,無法精準把控延時效果。
這和蘋果、特斯拉等廠商的思路是一致的。蘋果iOS生態的流暢性、穩定性為什么一直有口皆碑?正是因為它從芯片、系統到鏡頭等零部件一手抓,高度集成、高度統一。
信息密度上,TA機器人對力控數據、頭部4k雙目視覺數據、腕部2k雙目視覺數據和遙操作眼動數據全覆蓋,整體數據topic數量為行業最多。
空間精度上,TA機器人實現了0.1mm的重復定位精度和1mm的絕對精度,均處于行業領先水平。重復定位精度保證了單臺設備在重復執行任務時的穩定性,絕對精度則確保不同機器人之間的數據一致性,避免了因設備差異造成偏差。
不得不說,TA機器人的高質量數采,正正解決了行業的大難題。
此前業內很多公司都存在重復定位精度不足、不同設備采集數據不兼容、過于追求單一維度的精確度等問題。好不容易采集到數據,要么動作、受力存在偏差,要么精度達標但傳感器數據不同步、信息殘缺,以至于數據看起來豐富,但無法準確反映真實操作場景。
更重要的是,在傳統操作思路里,數據采集、上傳、清洗、標注、模型訓練等環節容易出現脫節,低質量數據不僅無法提高訓練質量,還會成為“負資產”。
而靈御智能對空間、時間和信息密度的兼顧,能最大限度避免數據脫節、信息單一,且數據集無需額外校準,可直接用于模型訓練,既節省了后續成本,也真正實現了數據的可泛化價值。
![]()
靈御智能數據采集平臺
立足于效率、成本和數據質量三重支撐,靈御智能顯然邁出打破「不可能三角」的關鍵一步。在這基礎上,靈御智能得以更進一層:構建“數據飛輪”,形成難以替代的核心競爭力。
過去,大部分機器人數據采集都屬于純投入模式:企業需要專門搭建采集場地、組織人員、運行設備,再把采集到的數據回流給模型團隊,流程繁瑣、效率低下。而靈御智能改變了這一邏輯——在它的方案中,機器人本身既是執行終端,也是數據入口。
在靈御智能的端云協同架構中,云端并不是簡單承擔遠程控制角色,而是與端側實時控制、本體執行、任務調度和專家模型形成協同。機器人在真實場景中完成任務的同時,視覺、力控、關節狀態等多模態數據持續回流,進入清洗、標注和訓練流程,反過來推動模型能力迭代。
其中,靈御TA機器人承擔著進入真實場景的物理執行角色,自研的低延遲通訊架構負責連接云端智能與機器人本體,而高質量真機數據飛輪則持續反哺模型訓練和能力迭代。
這就形成了“部署—數據—訓練—進化”的完整閉環:部署規模越大,真實場景越豐富,系統獲得的數據就越多;數據越多,模型能力就越強,進而提升機器人的執行能力,反過來又能采集更多高質量數據,實現自我強化。
![]()
“數據飛輪”的成型,離不開全鏈路的協同能力,這是靈御智能獨有的競爭壁壘。
行業內很多公司能做好機器人本體,但不一定能把云端AI穩定接入真實物理任務;有些公司能做好模型,但缺乏低延遲通訊技術和可落地的執行本體,而靈御智能實現了各環節的深度協同。
靈御智能和英特爾的合作是典型例子。此前,英特爾已開始使用靈御機器人開展模型訓練和數據采集,并提供云邊協同、數據處理與算力支持。雙方合作跑通了“數據—模型—執行”的閉環雛形:從真實任務中采集高質量數據,用于云端模型訓練,再將優化后的模型下發到機器人本體,進行執行驗證。
往后,類似的合作案例可能會越來越多,這也印證了其技術路線的可行性。
![]()
靈御智能 X 英特爾合作測試項目
從卷模型到卷數據,打破具身智能能力上限
隨著具身智能逐步告別概念炒作和樣機演示,進入規模化量產、商業化落地的關鍵階段,行業也從“卷模型”轉向“卷數據”。競爭重心正發生徹底改變,決定系統能力上限的,不再只是模型本身,而是它是否擁有足夠豐富的真實場景數據。
這種產業演進軌跡,與自動駕駛行業高度重合。正如特斯拉的核心壁壘從來不只是自動駕駛算法,還有其龐大的車輛部署規模,持續采集海量、真實路況數據。這些數據,才是調優算法應對極端天氣、突發路況等長尾問題的關鍵。
具身智能正走向類似的路徑:機器人只有走進各種復雜環境,持續與真實世界交互,才能獲得足夠的數據。
這便能看出靈御智能的獨特性:形成從設備、部署到數據交付的完整閉環,服務于科研機構、數據采集中心及復雜非結構化場景客戶,推動機器人數據從實驗驗證走向標準化、規模化生產。這讓其成功獲取了物理世界的數據入口,為機器人進入更復雜、更真實的任務環境提供數據基礎設施。
就像大模型時代的Scale AI,其價值不僅僅在于提供數據標注服務,更在于幫助行業建立了標準化的數據生產體系;在具身智能的領域,行業也需要靈御智能這樣的企業填補基礎設施層的空白。
靈御智能這種成為“基礎設施”的決心也貫穿在CEO金戈設定的2026年度目標中:全年出貨量突破800臺機器人;完成商業閉環驗證,在1-2個真實工作場景中,證明機器人能夠為客戶帶來正向ROI;構建數據資產,一年內為行業提供至少百萬小時、經過標準化處理、可直接用于模型訓練的高質量真機數據集。
![]()
靈御智能機器人應用于工業物流場景
這三個目標其實是環環相扣的:只有機器人部署規模上去,才能產生足夠豐富的場景數據;只有跑通商業閉環,才能證明基礎設施的商業價值;只有數據飛輪轉起來,才能發揮基礎設施的網絡效應——而這背后,或許也藏著整個具身智能行業未來幾年的真實發展方向。
未來,真正成熟的機器人,不會只存在于實驗室和演示視頻里,它們會走進餐廳、倉庫、醫院、工廠、商場,持續與真實世界發生交互;它們也會像今天的聯網汽車一樣,在工作過程中不斷學習、不斷進化;而每一次抓取、移動、任務失敗與修正,都會成為下一輪模型迭代的養分。
屆時,機器人產業真正重要的,可能不再是“制造機器人”,而是如何建立一張持續連接物理世界的數據網絡。誰能率先建立數據基礎設施,誰就更有機會找到這張數據網絡的入口。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.