網易首頁 > 網易號 > 正文申請入駐

數據荒漠中的“嬰兒”具身智能，距離GPT時刻還有多遠？

美洲一國墓地發現50具嬰兒遺骸

2026-04-20 14:05:22　來源: 未來圖靈

北京舉報

分享至

4月17日，上海張江科學會堂。2500多名來自34個國家和地區的合作伙伴匯聚一堂，智元合作伙伴大會（APC2026）座無虛席。智元創始人、董事長兼CEO鄧泰華發布了四大本體新品、六大AI模型、七大生產力解決方案，首次提出具身智能產業XYZ曲線。更是直言：“具身智能這個產業也是我工作二十多年來多個產業里面最讓人興奮和激動的產業。”

臺下，投資人、供應商目不轉睛地盯著大屏幕。成立三年，年營收突破10億元、行業首個萬臺機器人下線、“358”宏圖計劃（用三年實現生產力的入門，用五年實現生產力的落地，用八年實現生產力的推廣）劍指千億目標。

臺上，智元聯合創始人、總裁兼CTO彭志輝正與靈犀X2機器人互動。他示意機器人走到舞臺中央，或許是緊張，或許是真的“步履蹣跚”，那個價值不菲的機器人走得有些慢。彭志輝半開玩笑地催促：“走太慢了，跑兩步。”

這一幕，像極了當下具身智能產業的絕妙隱喻。我們都在催促這個行業“跑兩步”，甚至期待它能立刻“飛起來”，去工廠打工，進家庭服務，撐起下一個萬億級市場。 然而，現實是，這個被寄予厚望的行業，甚至連“走路”都還在蹣跚學步。

具身智能這個“繼PC、手機之后下一代交互終端”，究竟走到了哪一步？

答案比多數人想象的更樸素：它目前可能還只是個嬰兒。

具身智能，這個被視為AI終局的賽道，正處在最微妙也最關鍵的“嬰兒期”。它有了“大腦”，有了四肢，但它距離真正站起來、走起來、跑起來，去創造生產力，還有漫長的路要走。

這個“嬰兒”時期的具身智能，到底面臨哪些成長的煩惱？

嬰兒期的具身智能

APC2026大會間隙，一位產業觀察者向小編打了個比方：訓練機器人像訓練孩子，孩子告訴他千百次才能記住嗎？不可能。但機器人每個動作都要訓練千萬次。這個比喻精準戳中行業痛點：嬰兒會哭會笑會揮手會走路，但離自己吃飯穿衣還有漫長距離。今天的具身智能機器人正是如此：能跑能跳能翻跟頭，能在春晚舞臺大放異彩，但進入工廠車間、家庭廚房就往往原形畢露。

1.表演態與部署態的鴻溝

在鄧泰華看來，2026年是部署態元年，具身智能正式從“開發態”邁入“部署態”，從“能動”走向“會干”。

彭志輝在演講中讓靈犀X2走到舞臺中央，與它流暢對話。機器人識別現場人數、跟隨指令做動作、與人握手并全身柔性控制。臺下掌聲雷動。但他隨后強調，為什么在強調部署態而不是表演態，表演態是單向對外輸出，部署態是真正能夠做到親和的靈動交互。

“表演態”，展會上那些炫酷Demo，已相當成熟。機器人能跳舞打拳空翻格斗，甚至完成川劇變臉。但“部署態”，在真實工作環境中持續穩定完成任務，仍處于起步階段。

數據是最佳證明。覓蜂科技董事長兼CEO姚卯青披露：全球領先大語言模型使用約100萬億tokens訓練語料，相當于人連續說話100億小時。而具身智能領域，全世界高質量真機數據湊湊可能只有50萬小時。兩者數據鴻溝高達數萬倍。

萬億市場風口就在眼前，但數據荒漠讓無數算法原型只能停留在實驗室。

2.為什么數據如此稀缺

答案藏在具身與“離身”智能的本質差異中。

大語言模型訓練數據，文本、圖片、視頻是互聯網數十年積累的數字沉淀，獲取成本極低。具身智能需要的數據，是機器人與物理世界交互的真實記錄：每次抓取、每次移動、每次力覺反饋。這些數據無法從互聯網爬取，需要真機等在真實場景中一點一點采集。

更關鍵的是數據需求維度。大語言模型處理文本序列這樣的一維空間；自動駕駛處理以視覺為主的二維平面移動；具身智能面對真正的三維空間：需要視覺識別物體，還需感知關節運動、力覺反饋、觸覺質感，以及多模態信息在時空上的精準同步。

姚卯青比喻更形象：大模型像人一樣讀書就行，具身智能要去真實世界摸爬滾打，從一維文本變成三維開放世界，數量級、復雜度、獲取成本不可同日而語。

3. “GPT時刻”還很遙遠

以大語言模型為參照，具身智能處于什么階段？

姚卯青判斷還在Bert時代，也就是 2018年的Transformer階段，還沒到GPT級。Bert證明了Transformer架構有效性，讓機器開始理解語言結構，但距智能涌現尚有距離。2020年ChatGPT-3才展現泛化能力，2022年ChatGPT才讓智能涌現成為公眾可感的現實。

按此時間線，具身智能從Bert時刻到ChatGPT時刻可能還需5年甚至更長。

鄧泰華提出的XYZ曲線印證：X曲線（具身突破）2022-2025年，讓機器人動起來；Y曲線（智能突破）2026-2030年，讓機器人干起來；Z曲線（智能涌現）2030年后，才迎來部署普及期。

也就是說，距機器人像人一樣干活至少還需五年以上。具身智能將長期處于嬰兒期，會走會跳會表演，但離真正的生產力還很遙遠。

破解嬰兒期困局

如果說數據匱乏是嬰兒期的營養不足，數據生態混亂則是消化系統紊亂。 當前問題不僅是數據量的不足，更是質的參差、標準的缺失、供需的錯配。

1. 數據荒漠：標準缺失與質量參差

姚卯青在發布會上表示，各家生產數據格式、標注自成體系，都是孤島很難互通復用，企業間、上下游協作成本非常高，產業很難形成合力。智源研究院具身Infra&數據負責人姚國才在圓桌論壇上也表示：“我們在訓模型過程中用了很多開源數據，發現我們有大量時間都在做數據格式轉化。”

標準缺失導致數據質量參差。具身智能需要視覺、力覺、觸覺、關節角度等多模態數據精確同步，但當前傳感器標定誤差、時間同步偏差、標注質量粗糙普遍存在。他警告說，垃圾數據進就垃圾模型出，更嚴重的是好算法訓練沒出好結果。“垃圾數據有可能把好的算法和模型給否定了了。”姚國才說。

姚卯青更是直言不諱：“算法再強，無數據則無源。愿景再美，無基建則空懸。”

圓桌討論中，極佳聯合創始人朱政補充：目前數據多在實驗室或人工設置場景采集，不夠真實，希望數據能泛化到泛服務、工業甚至家庭場景。原力靈機聯合創始人范浩強則直指價值衡量難題：市面上數據讓人挑花了眼，啥樣都有，但我需要什么、缺什么，很難回答。

數據，就是具身智能嬰兒的“母乳”，而現在，這個嬰兒正面臨著嚴重的“營養不良”。

2.供需錯配：一邊數據荒，一邊產能空轉

吊詭的是，行業一邊喊數據荒，一邊大量數據采集產能空轉。

近年來全國涌現大量政府或企業投資的數采中心，購置大量機器人設備，但運營效率堪憂。姚卯青觀察，很多數采中心沒有以市場或用戶為中心采集數據，更像為運營而運營，存在重復勞動、重復場景問題。

這種為采集而采集造成巨大浪費。真正需要數據的企業找不到高質量供給，數采中心產出的數據卻無人問津。 核心原因是采集與需求脫節： 采集方不知什么是好數據，需求方缺乏定制化獲取渠道。

3. 模型路線的“百家爭鳴”

模型架構是具身智能的消化系統，但當前技術路線遠未收斂。

彭志輝發布智元六大AI模型規劃，涵蓋運動、交互、作業三大智能 。運動智能有感控一體運控基座模型和生成式運控基座模型；交互智能有WITA大模型和即將發布的端到端WITA Omni 1.0；作業智能有GO-2模型和動作世界模型GE-2。

即便智元內部，路線也非鐵板一塊。WITA采用三段式架構,語音轉文本、大模型推理、文本轉語音,過程中損失語氣、情緒等模態信息。而WITA Omni 1.0轉向端到端，試圖保留完整多模態信息，把動作、表情、情感、語境融合起來。

放眼行業，分歧更加明顯。在覓蜂科技的圓桌上，光輪智能CEO謝晨認為，“仿真最后提供的是一個足夠廣泛的、開放的，足夠落地到真實場景的且足夠規模化的評價。”而自變量創始人王潛則堅持“以物理世界真實數據為主”。范浩強則打了個圓場：“天下真機采的數據也全是模擬和仿真出來的……用物理手段生成還是用計算手段生成，哪個成本更便宜那就用哪個。”

有團隊押注VLA架構，有團隊認為VLA毫無價值堅持世界模型，還有人主張強化學習才是正途。綠洲資本張津劍曾形容，即便在北坡賽道，科學家觀點也截然不同，堪稱百家爭鳴。

技術路線不確定性是行業初期必然特征，但也意味著大量資源可能投入最終被證偽的路徑。

4. 工業應用的“虛假繁榮”

一個常見反駁：如果具身智能還是嬰兒，為何工業場景已有大量機器人部署？

答案在于，工業應用成功很大程度上依賴過去二三十年傳統工業機器人積累的基礎，而非具身智能自身突破。機械臂、AGV、AMR已在工廠運行多年，積累大量場景數據和工程經驗。 大模型加入更多是加速深度學習，而非從零創造能力。

智元發布的七大部署態方案也能印證。工業制造類三個場景中，傳統工業機器人早已深耕多年。具身智能更多是提升柔性和泛化能力。 即便最成熟的工商業清潔場景，產品基于早期孵化的智鼎公司，清潔機器人本身是相對成熟品類，與通用具身智能尚有距離。

不做孤勇者，要做擺渡人

嬰兒期混沌中，總有一些企業選擇更冷靜、更長期的打法。智元在APC2026展示的戰略布局，提供值得審視的樣本。

1. 從“賣機器人”到“交付結果”

彭志輝一句話點出行業轉型關鍵： “ 具身智能真正分水嶺，不是AI模型進入物理世界，而是產品開始進入真實工作流，邏輯從賣機器人變成交付結果。”

從 賣產品到交付結果，是商業模式轉變更是思維根本轉折。 賣產品只需交付硬件；交付結果意味著確保機器人在客戶場景真正創造價值——更低人工依賴、更高穩定性、更強泛化性、更可量化收益。

龍旗南昌產線案例是最佳注腳。 3C電子上下料場景中，智元機器人實現8小時連續作業，完成2283項任務，零失誤、100%成功率。 這不僅證明技術驗證，更證明具身智能可在真實產線交付結果。

龍旗方面分享，從有項目到最后POC花了四個月，雙方團隊駐扎產線解決了很多問題。 即便頭部企業，從實驗室到產線部署也需數月,這恰印證嬰兒期判斷。

正如彭志輝所言：“一臺機器人進入具體場景，往往意味著要拆解、解決數十甚至上百個細碎問題。” 即便對于頭部企業，從實驗室到產線的部署也需數月 。這恰恰印證了嬰兒期的判斷。

2.不做“獨行俠”，要做“組局者”

智元另一值得關注的動作是生態建設。鄧泰華宣布“元苼生態”計劃，未來五年投入不低于20億元，用于科研學術、人才培養、生態伙伴與開發者社區。他直言生態需要投入，不是索取，是要投入要讓利的。

行業發展初期，很多企業閉門造車，視數據模型為核心機密不愿共享。但具身智能復雜度決定，沒有企業能獨力解決所有問題。

智元策略是全方位開放：開源操作系統靈渠OS、開源數據集AGIBOT WORLD、開放開發平臺AIMA、不要求生態伙伴排他獨占。鄧泰華表示，如果在智元體系基礎上別家跑出來推動產業發展也歡迎，產業成功生產力進步每個人都是受益者。

這種開放心態在競爭激烈的科技行業不多見。 長遠看，誰能率先構建繁榮生態，誰更可能在技術路線收斂時占據有利位置。通過成立“擎天租”租賃平臺等方式，智元正試圖降低機器人使用門檻，加速“數據飛輪”的旋轉。

3. “兩條腿走路”的務實策略

面對技術路線不確定性，智元采取兩條腿走路：一方面繼續投入主流真機數據采集和模型訓練，確保不掉隊；另一方面布局世界模型等前沿方向，為范式轉移做準備。

數據層面，智元孵化獨立覓蜂科技，定位全球領先一站式物理AI數據服務平臺， 試圖通過平臺化解決數據采集標準化和規模化問題。 覓蜂發布MEgo系列無本體采集設備， 正是為降低門檻、提升效率。

覓蜂計劃2026年實現千萬小時級數據產能，2030年達百億小時級，若實現將極大緩解行業數據饑渴。

但數據平臺商業模式仍在驗證。姚卯青坦言，當前數據交易以B端定制為主，數據商城更多是櫥窗展示，真正交易需商務對接。定價、質量評估、隱私保護等問題尚無成熟方案。

誰閉環，誰擁有未來？

彭志輝拋出一個觀點：“所以具身智能現在也不只是一個概念，我覺得是一種新的生產力的基礎設施，未來的機器人既會是一個執行器，也會是一個流量的入口，機器勞動者也是連接AI的模型與物理世界的接口，誰能率先把這個閉環跑通，誰就有機會定義下一代的生產力的平臺。”

這句話可看作整場總結，也可看作行業預言。具身智能競爭不是單一技術點競爭，而是從數據采集、模型訓練、本體制造、場景部署到生態構建的全鏈條競爭。誰能率先打通閉環，讓數據飛輪真正轉起來，誰就可能占據未來主導。

1. 中國的獨特優勢

這場全球競賽中，中國有不可復制的優勢：完整制造業產業鏈。

鄧泰華說，具身智能有個具身，這是中國無以比擬的優勢。具身智能必須有物理實體，必須與制造業深度耦合。中國擁有全球最完整機器人供應鏈 :從電機、減速器、傳感器到芯片、電池、結構件，幾乎每環節都有成熟供應商。這種供應鏈優勢使中國在硬件成本控制和量產速度上擁有天然優勢。

彭志輝曾調侃，特斯拉相比我們量產進度有點落后，這半年我們可以享受領跑快樂。 雖有營銷成分，但中國在具身智能硬件量產上的領先是事實。

更重要的是場景優勢。中國有全球最大制造業基地和最豐富應用場景。從3C電子到汽車零部件，從物流倉儲到餐飲服務，每個場景都是具身智能訓練場。這種場景豐富度，任何其他國家難以比擬。

2. 冷靜比狂熱更重要

產業鏈優勢不等于成功保障。資本狂熱當下，保持冷靜比追逐風口更重要。

鄧泰華發出罕見警示： “現在二級市場起來了，但不該簡單把二級市場情緒傳導到一級市場，現在看到機會所有人閉眼投，往往不是機會而是另一個東西。”

這種逆向降溫在創始人中不多見。但它揭示殘酷真相：當所有人都覺得是機會，泡沫往往已形成。2025年下半年，數家具身智能明星企業傳出裁員、融資困難消息，行業洗牌已開始。

張津劍將具身智能比作 攀登者們的“北坡”（大語言模型為“南坡”），通往AGI的兩條路之一，但更難。他認為離登頂還遠，甚至沒遇到真正冰凍地帶，剛走過GPT2階段，順利的話還需1000萬到2000萬小時數據，最快明年中才可能進入GPT3階段。

嬰兒期的正確姿態

回到文章開頭那個場景。彭志輝催促機器人“跑兩步”，或許是對技術迭代速度的自信，或許只是活躍氣氛的調侃。

但冷靜下來看，我們必須承認，具身智能的“牛頓”還沒有誕生。我們還在黑暗中摸索，尋找那個能夠統一物理世界智能的“萬有引力定律”。

回到開篇比喻：具身智能正處于嬰兒期。嬰兒特征是什么？成長快但不穩定；潛力大但需悉心照料；會驚喜也會抓狂。對行業參與者，認識嬰兒期基本判斷比追逐短期估值融資更重要。嬰兒期正確姿態不是急著讓孩子打工賺錢，而是耐心喂好每口飯、做好每次訓練、糾正每個錯誤。

海底撈信息科技部副部長楊旋之在大會上分享的合作經驗頗具啟發：前期更多聚焦情緒價值，后期戰略合作不僅情緒價值提供，要真實幫門店提效。這是務實進化路徑,先做能做的，積累數據和經驗，再向更難目標邁進。

不要因舞臺炫酷表演盲目樂觀，也不要因商業化步履蹣跚妄自菲薄。 具身智能需要十年甚至更長時間兌現，不可能像移動互聯網爆發增長，但可能帶來的變革遠超移動互聯網。

大會最后，鄧泰華說，智元成不成沒關系，產業成就好。只要產業成功生產力進步，每個人都是受益者。這既是漂亮話也是樸素真理： 嬰兒期重要的不是誰家孩子先會走路，而是整個育兒體系——數據、模型、硬件、生態、標準——是否朝正確方向進化。

嬰兒期的行業，需要的是耐心和定力。資本應該更理性，不再追捧那些只會做“表演”的炫技公司，而是支持那些愿意在數據、基模、標準這些“基礎設施”上深耕的“老實人”。 企業應該更務實，放下“人形崇拜”，先找到能讓自己活下來的垂直場景，哪怕只是擰好一顆螺絲、疊好一件衣服。

嬰兒終將長大。關鍵是長大的過程中，有沒有給它足夠營養、正確引導和安全邊界。

這條路，注定漫長且充滿荊棘。 但當我們不再為機器人跳一支舞而歡呼，而是為它默默在工廠里擰好第10000顆螺絲而鼓掌時，具身智能的“嬰兒”，才算真正邁出了長大的第一步。

隨著人工智能技術的快速迭代，大模型的能力邊界不斷拓展，智能體作為大模型的重要應用模式，正憑借其在規劃決策、記憶、工具使用等方面獨特的創新性和實用性，引領著一場產業變革。

為貫徹實施《國家人工智能產業綜合標準化體系建設指南（2024版）》，中國移動通信聯合會正式啟動三項團體標準研制工作：

●《人工智能智能體能力要求》 (計劃號:T/ZGCMCA 011-2025)

●《人工智能智能體內生安全技術要求》 (計劃號:T/ZGCMCA 023-2025)

●《人工智能智能體互操作性接口規范》 (計劃號: T/ZGCMCA 024-2025)

現誠邀數據服務企業、醫療機構、科研院所、高校、檢測認證機構等全產業鏈行業機構及研發工程師、項目經理、應用專家等專業人士共同參與標準編制。

期待您的積極參與，讓我們攜手共進，共同引領人工智能產業的發展方向！

聯系人：李貞琦

聯系方式：18519753675（同微信）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.