5月18日,出行服務平臺公司如祺出行旗下數據業務板塊(以下簡稱“如祺數據”),首次對外完整披露AI數據資產全景版圖,正式亮出其布局通用AI、具身智能與世界模型賽道的核心數據底牌。據官方披露信息,如祺數據已搭建起覆蓋標注數據、行為數據、合成數據、多模態訓練數據集四大維度的完整數據資產體系,形成適配前沿AI模型訓練的高價值數據資源矩陣。
近年如祺出行AI數據業務實現爆發式增長。數據顯示,2025年,該公司以AI數據服務為核心的技術服務板塊營收達1.60億元,同比暴漲487.4%。截至2026年5月,如祺出行已在廣州、上海、重慶、沈陽等多座核心城市落地超300輛智能駕駛數據采集車,日均可產出1600小時、130TB的高質量合規數據,為AI模型迭代提供穩定、規模化的數據供給。
![]()
如祺出行表示,依托真實出行場景長期積累的數據,公司正支持自動駕駛及多行業AI模型訓練,并為具身智能、世界模型等提供可延展的數據支撐。
當前AI產業進入空間智能階段,能還原物理世界規則與場景交互的高質量數據成為稀缺資源。分析指出,類似如祺出行這樣的出行平臺積累的多模態數據包含駕駛員決策、道路交互、空間位置及時序變化等信息,可以成為世界模型與具身智能訓練的重要數據源。
鎖定真實出行場景,坐擁具身智能訓練“黃金數據礦”
具身智能、世界模型訓練正面臨核心瓶頸:適配物理交互、真實場景推理的高質量訓練數據極度匱乏,成為制約具身智能規模化落地、世界模型精準迭代的關鍵難題。
與傳統數據服務商不同,如祺出行擁有真實場景數據優勢。每年數億級出行訂單及車輛運行數據沉淀了高頻、復雜交通場景下的多模態數據,完整記錄“決策-響應-反饋”閉環。自2023年起,如祺出行開始投放搭載激光雷達、高清攝像頭等傳感器的智能駕駛數據采集車,在提供出行服務的同時合規采集包括駕駛行為、人車互動、交通交互等真實數據,從而大幅降低數據獲取邊際成本。
![]()
以泊車場景為例,如祺同步采集3D障礙物坐標、CAN總線信號、毫米波雷達回波、激光點云及全景視頻,構建起覆蓋“車輛行為、運行狀態、環境變化”的多模態聯合數據集。有從事大模型訓練的專業人士評價,該類數據具備完整的決策、推理、反饋閉環,能夠有效幫助具身智能體、世界模型理解真實空間關系、動態交互邏輯與長尾復雜場景,數據價值遠超傳統靜態數據與模擬合成數據,是空間智能模型訓練的優質“黃金數據礦”。
![]()
消息人士透露,如祺出行正探索將平臺積累的數據用于車后服務機器人訓練,覆蓋洗車、換電、維修等場景。
從單一數據服務到全棧能力,完成“數據集+標準化服務”進化
不同于國內多數傳統數據服務商將業務局限于基礎數據標注的單一環節,如祺出行已從單純的基礎標注服務供應商,升級為“數據集+全棧技術能力”的綜合AI數據服務商,具備數據采集、清洗、智能標注、合成數據生成、多模態處理等全鏈路能力。同時,公司具備全套AI數據服務標準化封裝能力,為客戶提供開箱即用的數據產品,大幅降低真實場景數據的使用門檻與落地成本。
這套完整能力能同時滿足智能駕駛等行業的基礎數據需求,以及具身智能、通用大模型等前沿AI賽道訓練要求,讓如祺出行實現場景數據價值跨行業落地。
公司在全國布局3大交付基地,擁有超1500人專業團隊、超1000家BPO合作伙伴及百萬級眾包資源,月均標注交付能力達千萬級。自研OCC自動化標注算法可替代90%人工標注,交付準確率超98%。此外,如祺自研合成數據覆蓋多時段、多天氣等場景,其多模態數據集涵蓋圖像、文本、音頻、視頻全品類,可直接適配各類大模型垂類微調與迭代優化。
![]()
目前,如祺AI數據服務已落地智能駕駛、具身智能、大模型、消費電子、醫療等領域,客戶包括騰訊、小馬智行、理想汽車、火山引擎、百度智能云、廣汽集團等,其商業模式和落地路徑,已開始得到市場充分驗證。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.