如果把具身智能產業比作一場淘金熱,那么數據公司就是這場熱潮中賣鏟子、賣牛仔褲、修鐵路的人。它們的故事不如人形機器人那般吸睛,卻可能是整條價值鏈上確定性最高的生意。
近日,藝恩數據發布了《全球具身數據市場白皮書》,白皮書聚焦具身智能浪潮下最核心的生產要素——具身數據,系統梳理了全球具身數據市場的產業現狀、技術路徑、競爭格局及未來趨勢,為行業提供了全景式的參考坐標。并把視野擴展到全球約50家具身數據公司,并按「數據怎么來」重新梳理出一張更完整的譜系圖。
![]()
圖1:本系列基于《全球具身數據市場白皮書》四章框架展開
五條路線,一張譜系圖
具身數據的獲取,過去常被歸納為四大范式:真機遙操、便攜采集、仿真合成、視頻蒸餾。但隨著賽道成熟,第五條路線逐漸清晰——一類公司不只采集某一種數據,而是搭建覆蓋「采集硬件+數據產線+治理平臺」的全鏈路基礎設施,可稱為數據基礎設施層。簡智、光輪、覓蜂、諾亦騰正是其中代表。
還需厘清一個常被誤解的概念——egocentric(第一人稱視角)數據。它并非獨立的一條路線,而是一種橫跨兩條路徑的數據視角:既可以由人主動佩戴數據手套、頭戴相機采集(屬便攜采集),也可以從已有的第一人稱視頻中蒸餾(屬視頻蒸餾)。Meta的Project Aria、蘋果的EgoDex、學界的EgoMimic,都是這一視角的代表性工作。
![]()
![]()
![]()
范式一:真機遙操與觸覺
這是數據金字塔最昂貴的塔尖——動作與本體天然對齊,保真度最高,但成本與規模化難度也最高。帕西尼感知以6D觸覺傳感與采集工廠見長,2026年3月完成超10億元B輪,投后估值超百億元,比亞迪為第二大股東;諾亦騰機器人依托全球約七成份額的動捕技術,2025年12月由啟明創投領投Pre-A+輪;智元機器人則以開源的AgiBot World百萬真機數據集樹立標桿。星海圖、千尋、自變量等本體公司也憑強數據飛輪躋身其中。
![]()
范式二:便攜采集
可穿戴設備與數據手套以第一人稱采集,把成本壓到真機遙操的約十分之一,是質量與規模之間最性感的平衡點。靈初智能以多自由度觸覺手套見長,2026年披露天使輪加Pre-A輪累計20億元,背后是國開金融、央視產業基金等「國家隊」;它石智航的SenseHub一體化數采套件助其在2026年4月完成4.55億美元Pre-A輪,刷新中國具身單輪紀錄,估值約130億元;鹿明機器人走UMI路線,2026年5月獲三菱電機連續領投A1、A2輪。
![]()
范式三:仿真合成
用物理引擎加生成式模型批量「造數據」,可覆蓋海量長尾場景,成本僅為真機采集的約百分之一——這是最具想象力的「數據印鈔機」。光輪智能是當之無愧的標桿(詳見下文);群核科技于2026年4月17日登陸港交所,成為「全球空間智能第一股」,首日大漲、市值近350億港元;銀河通用以「一周生成十億級仿真數據」的管線,2026年3月再獲25億元、估值超200億元。海外的World Labs(李飛飛創立)則在2026年2月正式落地10億美元融資、估值約50億美元。
![]()
范式四:視頻蒸餾
直接從互聯網與第一人稱視頻中蒸餾動作先驗,近乎零邊際成本,但缺乏動作標簽、物理grounding較弱,是技術難點中的難點。樞途科技的SynaData系統把綜合數采成本降到行業的千分之五;極佳視界以世界模型切入,2026年一個月內累計融資25億元,成為國內首個世界模型百億獨角獸;星動紀元則把世界模型與端到端模型結合,2026年4月由順豐戰略領投新一輪。
![]()
第五類:數據基礎設施層
除了四種獲取方式,一類新公司正在浮現——它們不押注單一數據類型,而是搭建覆蓋「采集硬件 + 數據產線 + 治理平臺」的全鏈路基礎設施。我們將其單列為數據基礎設施層。簡智機器人是其中代表:它以「Gen Data 1+x」硬件矩陣 + 「Gen ADP」數據產線,搭建「人類技能數字化 → 云端數據治理 → 機器人應用」的全鏈路中立基礎設施。2026年6月1日,它完成由螞蟻集團、滴滴、德聯資本聯合領投的連續多輪共數億元融資,被業內稱為「具身智能無本體數據領域迄今最大規模融資」——其已覆蓋超 3000 名采集用戶、沉淀超百萬小時數據,海外收入占比超七成。
同處這一層的還有:以仿真合成定義底座的光輪智能、由智元控股并獲紅杉領投的覓蜂科技(MEgo 無本體采集硬件 + 數據治理引擎)、以及從動捕拆分而來的諾亦騰機器人。它們的共同點是:不押注單一數據類型,而是做「賣鏟人的賣鏟人」——為所有數據公司提供采集與治理的底層工具。
![]()
旗艦案例:全球首個「具身數據獨角獸」
如果要在這片賽道選出一個標志性案例,光輪智能當仁不讓。這家以「仿真合成」為核心的公司構建了 World / Behavior / Evaluation 三層架構,仿真數據生成成本僅為真機采集的約百分之一,2026年5月再獲螞蟻集團領投的新一輪融資。
![]()
圖 2:旗艦案例——光輪智能以 SimReady 仿真合成 + RoboFinals 評測基準切入
光輪的客戶名單幾乎覆蓋了產業鏈的「半壁江山」——NVIDIA、谷歌、Figure、1X、字節、智元、銀河等悉數在列,年營收已破億元。由前 NVIDIA、Cruise、蔚來自動駕駛仿真負責人謝晨創立的這家公司,用業績驗證了「仿真合成」范式不僅可規模化,更可獨立估值。
巨頭入場:從「買數據」到「自建飛輪」
數據的戰略價值,巨頭比誰都清楚。京東發布自研可穿戴采集終端 JoyEgoCam,計劃發動內部超 10 萬員工與外部數十萬人,打造「全球規模最大」的具身數據采集中心;NVIDIA 以 Cosmos 世界模型與 GR00T、開源 Physical AI 數據集定義全球基礎設施;Google DeepMind 的 Open X-Embodiment 匯聚全球34家實驗室、百萬級真機軌跡;Meta的Ego-Exo4D、特斯拉的Optimus純視覺數據飛輪、字節的Seed、華為的CloudRobo、螞蟻的靈波開源模型,各自圈地。
![]()
圖 3:開放生態 vs 封閉飛輪——巨頭具身數據布局的兩條路線
一個耐人尋味的細節是:螞蟻在2026年密集出手,先后領投或參投光輪、簡智、星塵、星海圖等多家具身數據資產,儼然成為這條賽道上最活躍的產業資本之一。當巨頭親自下場圈數據,獨立數據公司的價值不降反升——因為生態越大,越需要中立、合規、可擴展的第三方數據供給。
全球50家具身數據公司完整列表
下表匯總本文梳理的全球約50家具身數據相關公司,按五條路線 + 巨頭數據飛輪 + 海外數據專營分組,列出所屬路線與最新融資額或估值。融資數據均標注時間,并區分「已確認」與「傳聞 / 進行中」;估值多為投后或第三方盤點口徑,公司間不完全可比。
![]()
巨頭數據飛輪與海外數據專營公司,則構成這張譜系圖的另外兩極:
![]()
(注:上表合計約50家。部分本體/模型公司因擁有強數據飛輪而納入,并在「所屬路線」中加注;巨頭機構按其數據布局列示,非獨立數據公司。)
一份必要的邊界說明
本榜單只納入能清晰對應數據范式的具身數據公司。Scale AI、Surge、Appen、海天瑞聲等通用AI數據標注公司,雖體量龐大,但屬勞動密集型標注外包,并非具身數據專營,故不計入主體。此外,部分海外大額輪次仍在「進行中」——如Physical Intelligence約110億美元的新一輪,截至本文成稿時尚未正式交割;它石智航約180億元的新一輪亦屬傳聞。我們以「已確認 / 傳聞」分級標注,供讀者審慎判斷。
![]()
圖 4:四范式護城河對比(數據規模、成本、保真度、生態、標準化)
數據公司的競爭,本質上是「質量 × 規模 × 成本」三角的平衡藝術。從四種獲取范式到數據基礎設施層,從獨立創業公司到巨頭數據飛輪,這片賽道的格局仍在快速演變。但有一點已經清晰:在具身智能的下半場,得數據者得先機。
在數據公司競爭的賽道上,能否提供合規、可擴展的高質量數據,決定了一家數據公司的天花板。 作為AI時代中國垂類數據基礎設施的代表,藝恩數據數據(ENDATA,NEEQ:871430)以視頻、圖像、文本三模態數據為核心,面向大模型與具身智能廠商,提供從采集、清洗、標注、治理到資產化的全鏈路數據服務。
無論你在尋找VLA-Ready的視頻數據流、為大模型尋找「對的數據」,還是作為出海品牌尋找「懂中國也懂全球」的數據伙伴——藝恩數據都已準備好下一程。
藝恩數據數據針對行業痛點,推出了四類核心數據產品,旨在為開發者提供合規、可擴展的高質量數據支持:
預訓練數據集(PRE-TRAINING):提供TB級多語種垂類語料,深度覆蓋影視綜、社媒、電商等高價值場景,為大模型預訓練提供干凈、合規的底座數據。
2、對齊數據(SFT / RLHF):提供高質量指令與偏好對齊數據,全力支持監督微調與人類反饋強化學習,幫助模型精準對齊真實業務意圖。
3、多模態對齊(MULTIMODAL):打造視頻、圖像、文本三模態對齊數據,配套統一元數據Schema與多任務標簽,專項服務視頻理解、視頻生成及世界模型訓練。
4、定制化數據(CUSTOM):面向具體場景提供端到端定制采集與處理,支持私有化部署與嚴格的數據合規審查,滿足企業級安全與版權要求。
旗艦能力:VIDEO FEEDS for VLA
面向視頻原生AI與具身智能,藝恩數據以「影視綜+社媒+電商」全球級視頻資產為基礎,配套元數據Schema與多任務標簽,為視頻生成、視頻理解、世界模型與VLA訓練提供持續、合規、可擴展的視頻數據流。
2.3B+視頻片段800TB+日均帶寬120+任務族
從「數字世界」到「物理世界」,數據始終是AI能力躍遷的底層燃料。藝恩數據希望以高質量、合規、垂直的數據供給,成為這一進程中可信賴的長期伙伴。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.