![]()
在京東設想的具身智能數據采集體系里,一名門店咖啡師完成手沖咖啡的過程,不再只是一次線下服務。研磨、注水、萃取等動作,會通過頭戴設備被第一視角記錄,轉化為可供模型訓練的視頻數據。
這類數據的價值,不只在于記錄某個標準動作,更在于沉淀人類在真實服務場景中的操作順序、力度控制和環境應對方式。對機器人而言,這些細節決定了它能否從“完成演示”走向“進入現場”。
不久前,京東開啟了一項數據采集計劃,并將其稱為“人類歷史上規模最大的數據采集行動”:發動最多60萬人,在兩年內累計超過1000萬小時人類真實場景視頻數據,目標是成為全球最大的具身智能數據公司。
在AI行業普遍追逐基礎大模型和Chatbot應用的背景下,京東選擇切入具身智能數據,表面上看不算性感,卻指向了另一個更底層的問題:當AI從屏幕走向倉庫、門店、家庭和工廠,誰能提供足夠多、足夠復雜、足夠貼近現場的數據?
這也是理解京東AI戰略的一個關鍵入口。高質量真實場景數據,正在成為物理AI落地前必須補上的一塊基礎設施。沒有它,具身智能很容易停留在大模型里,難以進入真實產業流程。
京東并不是唯一看到這個機會的公司,但它的特殊性在于,過去多年積累的供應鏈、履約網絡和線下業務場景,可以被重新解釋為一種數據礦藏。
一方面,京東覆蓋全國的供應鏈與線下場景,能持續產出高真實度、高多樣性的物理場景數據。從倉庫分揀到家庭保潔,從餐飲制作到商品導購,這些數據不僅實驗室難以模擬,也是純AI公司很難長期穩定獲取的資源。
另一方面,快遞、外賣、家政等業務讓京東擁有密集的線下人力網絡。數據采集、標注本身也是一項勞動密集型工作,京東的人力池與采集需求存在一定匹配度,這讓它更容易把采集任務嵌入日常業務。
因此,京東能否在物理AI時代占住位置,關鍵不只是它是否投入算力、芯片的堆疊和大模型的迭代,而是它能否把原有的零售、物流和服務體系,轉化成持續生產高質量數據的機制。
過去,京東是國內電子產品消費的重要渠道之一,但也長期面臨一個問題:電子消費品的購買頻次偏低,很多用戶一年才來京東消費一兩次。過去兩年,京東通過豐富品類、優化價格,推動日百品類連續8個季度保持高增長。進入2025年后,京東又進一步切入外賣、家政等服務業務。
這些動作當然首先服務于增長本身,但放在AI視角下,它們還有另一層含義:京東正在把自己的業務半徑,從相對標準化的商品交易,延伸到更高頻、更動態的線下服務。
場景多了,數據的可能性也隨之增加。但可能性不等于能力。京東2026年一季度財報顯示,京東體系內研發投入同比增長59%。這筆投入的一部分,流向了具身智能數據平臺這類基礎設施。它不像前端應用那樣容易被用戶感知,也很難立刻對應到收入增量,但如果京東要把線下場景變成AI訓練資源,這一步繞不開。
換句話說,京東這輪AI布局的重點,不是先推出一個更熱鬧的C端入口,而是嘗試把場景、人力和模型訓練接起來,把為用戶提供的生活服務業提升到為產業提供的生產服務業。它能不能形成商業回報,取決于這些分散在業務里的真實操作,最終能否被整理成可訓練、可復用、可交易的數據資產。
A
過去一年,機器人和具身智能頻繁出現在發布會和展廳里。許多演示看上去已經很流暢了,但這些演示幾乎只在特定的環境中才能展示。
物品擺放固定,動作路徑明確,外部干擾也被降到最低。的確“物理”,但是并不“AI”。
真實商業場景很少如此配合。
還是以京東MALL里的咖啡師為例。機械臂在固定臺面上完成一杯咖啡,和它在商場里服務顧客,是兩件難度完全不同的事。
![]()
后者要面對的是不斷變化的現場。有人靠近柜臺,有人臨時伸手取餐,地面可能剛被拖過,杯子、器具和人員動線也隨時可能發生變化。
在這樣的環境里,機器人要解決的已經不再是“能不能沖咖啡”了,是它能不能在不確定的現場里判斷什么時候繼續、什么時候減速、什么時候暫停等這一系列組合問題。
其中只要有一個判斷出錯,就有可能帶來碰撞、燙傷或設備損壞,一招誤判滿盤皆屬。
這也是物理AI比屏幕里的AI更難落地的原因。大模型說錯一句話,可以重新生成。
機器人在現實世界里如果做錯動作,那是要付出代價的。
要讓機器人離開樣板間,問題就不能只停留在動作本身。它需要看懂環境,理解現場約束,預判動作后果,還要把每一次執行后的反饋沉淀下來,反過來修正模型。
這解釋了為什么具身智能看上去熱鬧,但很多進展仍停留在單一場景、單一動作上。演示可以被設計,真實世界卻不會配合腳本。
京東選擇進入這件事,押注的正是這一點:AI如果只停在屏幕里,價值天花板終究有限;只有進入倉庫、門店、家庭和工廠,才可能真正變成一種新的生產力。而支撐這一切的,不是更漂亮的發布會演示,而是足夠多、足夠復雜、足夠貼近現場的真實數據。
從這個角度看,京東與物理AI之間確實存在某種業務耦合。
一方面,早年布局無人機、無人配送、無人倉,讓京東積累了一定的物理AI執行層經驗;另一方面,京東圍繞產業需求,戰略投資多家具身智能企業,補強感知與約束決策層能力。與此同時,京東擁有全國倉儲、路網、訂單流轉、履約服務所產生的線下實時數據,既能作為感知底座,也有機會依托業務運行數據形成反饋閉環。
這些數據能否成為京東的AI資產,取決于它能否完成從業務數據到訓練數據的轉化。為此,京東已經做了一系列布局。
在感知層,京東把遍布全國的線下場景變成AI的“眼睛”。
京東擁有覆蓋零售、物流、工業、健康、家政、外賣等上百個線下場景。在這些環境中,京東通過采集人機操作、空間軌跡、設備狀態與作業流程數據,為物理AI提供多模態感知信號。
在約束決策層,京東通過戰略投資具身智能企業,自研JoyAI大模型、工業大模型JoyIndustrial、JoyInside附身智能等模型體系,搭建物理AI的決策能力。
在執行層,京東將布局多年的物流機器人、無人倉、無人機、配送設備、智能家電、服務機器人等硬件終端,作為物理AI完成現實動作的載體。
在自我進化層,京東開展大規模具身智能數據采集,將真實場景產生的數據回流至模型訓練環節,嘗試形成數據、模型、終端、反饋之間的持續迭代。
相比行業里比拼模型參數、堆砌算力的顯性敘事,京東的路徑更偏基礎設施。它的難點也在這里:數據采集只是第一步,真正的考驗在于數據質量、訓練效率、場景遷移能力和商業化速度。
B
為什么偏偏是京東來講這個故事?
與其說這是一次突然的跨界押注,不如說是京東在重新利用上一輪互聯網競爭留下的資產。
上一輪互聯網戰爭中,留給京東的重要資產之一,是那支深入城市毛細血管的龐大履約隊伍,以及由此錘煉出的組織能力。
這讓京東有了從電商業務向即時零售、外賣業務橫向擴張的基礎。無論做電商、外賣還是即時零售,體驗、成本、效率都是核心能力。
但這項能力本身也有代價。龐大人力隊伍意味著成本壓力,只有讓人力不斷被復用,才能攤薄成本,讓組織能力釋放出新的價值。
如今,當競爭從互聯網切換到AI,這支曾經被視為“成本中心”的人力隊伍,有機會被重新定價。物理AI的訓練離不開高質量數據采集、標注和真實世界反饋,而這些工作同樣需要大量人力。
京東發動近60萬人參與的數據采集行動,表面上是試圖把一線履約隊伍,轉化為數據采集員、標注員和動作捕捉員,而更深層則是讓這些一線員工成為數據資產的生產者,從物理產業鏈的尾端轉入數字產業鏈的前端。
不同于其他企業需要額外招募、培訓專業團隊,京東的配送員、倉庫分揀員、門店店員及外賣騎手,日常就穿梭于各類真實場景。只要佩戴自研的JoyEgoCam采集終端,就能在本職工作中同步完成數據采集與標注。
![]()
這給京東帶來了一個相對特殊的起點:它不是從零搭建數據采集團隊,而是把已有組織網絡改造成數據網絡。
有了采集數據的人,還需要使用數據的場景。
近兩年,京東“四處出擊”,做外賣、開七鮮小廚、布局酒旅、切入汽車后市場。
一方面,這是為了尋找新的增長曲線;另一方面,當一家企業的核心能力積累到一定程度,也會向外溢出,催生新的業務形態和商業場景。
這些新業務為京東帶來增量收入、擴大用戶規模,同時也為AI訓練提供了土壤。AI要落地物理世界,必須依附于具體、復雜、不斷變化的現實場景。在AI視角下,每一個新場景都是一個新的“感知觸角”。
每一家新開的線下門店,每一位上門服務的家政人員,每一輛穿梭在城市中的物流車,都可以成為感知物理世界的傳感器,源源不斷地產生多模態真實數據。
支撐這一切的底座,是京東的超級供應鏈體系。
過去20余年,京東構建的超級供應鏈,已形成覆蓋全球的近2000個倉庫里的1億SKU商品。
僅昆山亞一智能物流園,就具備日均分揀超450萬件包裹的能力。其中,“狼族”機器人業務單量占比近半,日均出庫單量穩居百萬級,日常運營中持續產出海量人機交互和設備運行數據。
這套供應鏈打通了從生產、流通到消費的全鏈路。上游連接廠商,中端依托冷鏈與物流網絡,末端完成履約。對零售業務來說,這是效率系統;放到物理AI里,它又可以被理解為一套持續產生現實世界數據的系統。
根據京東披露,通過全鏈路數據基礎設施,原始數據可被精煉為用于AI訓練的素材,數據有效率高達95%,成本降低60%。
這些數字說明,京東已經開始把供應鏈數據工程化,但它們距離真正轉化為物理AI競爭力,還隔著模型訓練、產品落地和客戶付費幾道關。
C
數據采集聽起來不如大模型和C端應用有想象空間,卻正在成為AI產業里被重新定價的環節。
一個直接的參照是Scale AI。
它并不直接訓練基礎模型,也不面向普通用戶做應用,卻憑借數據服務進入OpenAI等大模型公司的供應鏈,估值一度升至290億美元。
Figure AI、1X Technologies、Covariant等具身智能公司能夠獲得高額融資,也與它們掌握的機器人訓練數據和真實場景經驗有關。
國內市場也出現了類似趨勢。
隨著具身智能的發展,光輪智能、靈初智能等布局數據業務的企業開始受到關注。資本看重的不是“標注”這個動作本身,而是這些公司能否持續拿到高質量、可訓練、能反映真實世界復雜性的樣本。
從這個角度看,京東切入“水源地”,本質上是在爭奪物理AI落地前最基礎、也最稀缺的數據供給位置。
誰能穩定提供場景化、專業化數據,誰就可能在物理AI落地過程中獲得新的議價位置。
話又說回來,問題也要辨證地去看。
目前,行業內主流盈利方式大致可以分為硬件銷售、平臺訂閱和數據分析服務三種。這與傳統“賣水人”面臨的天花板有關:它們的數據多來自眾包或客戶提供,來源偏二手,場景也相對碎片化,缺乏對數據生產源頭的控制力。
當AI競賽進入“物理智能”深水區,實驗室合成數據或簡單標注圖片已經遠遠不夠。行業真正需要的,是能反映真實世界復雜性與不確定性的“活數據”。
京東的機會正在這里。它擁有真實場景、全鏈路數據基礎設施和供應鏈資源,理論上既能低成本規模化采集高質量數據,也能在真實業務中完成閉環迭代。
![]()
不過,機會和結果之間還有距離。數據能不能標準化、能不能對外交易、能不能跨行業復用,都會決定這門生意的天花板。
也正因如此,京東的商業前景不能只理解為“賣數據”。隨著JoyInside附身智能進入更多智能家電,工業大模型JoyIndustrial服務超萬家大型企業,京東有可能持續從家庭和工業兩類物理場景中沉淀原生數據。
這意味著,京東未來可能不僅向外輸出標準化數據集,也可能提供一整套基于真實物理場景的AI解決方案:從倉儲機器人的路徑規劃,到家庭服務機器人的交互,再到工業采購的智能決策。
更大的變量在于,京東能否圍繞具身智能超級供應鏈,建立數據交易、機器人售后、零售場景落地等生態業務。如果這些能力跑通,京東才有可能從數據采集方,進一步變成物理AI基礎設施提供方,真正成為全球最大的物理世界運營公司。
未來,京東甚至可能把數據采集、標注、存儲、交易等能力單獨拆分出來,成為AI時代的“礦業公司”。但在此之前,它仍需要證明:這套來自零售和供應鏈的現實世界數據,究竟能在多大程度上轉化為可復制的AI生產力。
淘金熱里,賣鏟子的人往往不直接參與淘金,卻可能掌握更穩定的現金流。放到物理AI這輪競爭中,京東正在嘗試扮演的,正是這樣一個更靠近基礎設施的位置。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.