田晏林 發自 凹非寺
量子位 | 公眾號 QbitAI
物理AI發展到現在,所有玩家都奔著同一個方向使勁:
讓機器人「讀懂」所處的物理環境。
這不僅是具身智能玩家拉開身位的關鍵,也決定了機器人未來能否進入真實場景,創造商業價值。
人類看到一張桌子,會知道它在哪里、是什么材質、能不能移動;看到一個門把手,會自然判斷它可以被旋轉;面對突然出現的人,會馬上調整自己的動作。
但對機器人來說,做出這些看似簡單的判斷,并不容易。
![]()
△AI生成
因為它面對的不是一張圖片,而是一個不斷變化的三維世界。
想要讓機器人真正長出能理解物理世界的「腦子」,不能只依靠參數量更大的基礎模型。
機器人大腦需要海量真實物理交互數據做訓練燃料。
而高質量視覺感知,正是把現實環境轉化為模型可讀信息、持續產出訓練數據的核心入口。
更強的視覺感知持續供給真實世界數據,不斷迭代升級機器人的物理世界大腦。
最近登陸港交所主板的樂動機器人,過去十年押注的,就是這樣一條路線。
從掃地機器人、物流倉儲機器人,到無接觸式酒店和餐廳的服務機器人,再到如今的人形機器人、機器狗等新賽道爆發,樂動持續圍繞一個底層問題布局:
機器人如何感知空間,并理解環境。
這也讓其在多輪機器人產業發展中,逐漸積累了「空間感知技術」的先發優勢。
但上市之后,市場關注的不只是這家企業過去的成績。
大家更想知道,在人人都要機器人「讀懂世界」的物理AI時代,智能化的底層地基該怎么打?
機器人競賽,焦點變了
論機器人行業未來的通用底層剛需,答案離不開一個:環境感知能力。
背后邏輯很好理解。
無論機器人最終落在哪個場景,家庭、酒店、餐廳、倉儲、工廠,包括未來要規模化商業落地的人形機器人,它首先要會回答:
- 我在哪里?
- 我看到了什么?
- 眼前的東西意味著什么?
- 我下一步應該怎么行動?
如果沒有對環境的理解,機器人就只能停留在固定場景、固定動作的自動化設備階段。
就像傳統工業機械臂,可以精準完成焊接、搬運等重復任務,但它并不真正「知道」自己面對的是什么。
過去,機器人行業的競爭敘事一直圍繞一個詞展開:運動能力。
誰能走路、誰能避障、誰能抓取、誰能完成復雜動作。
但隨著具身智能進入真實應用階段,這套評價體系開始失效。
下一代機器人要進入真實世界,面對的是大量開放環境和長尾情況:
一個隨意擺放的物品、一扇半開的門、一個突然移動的人,甚至是光線變化都可能讓系統崩潰。
空間變化帶來的不確定性,要求機器人具備對世界持續理解的能力。
而理解世界的前提,是感知。
![]()
△AI生成
特別是進入物理AI時代,「感知」更是連接現實世界與AI模型的必要入口
它負責把復雜的物理世界轉化為AI能理解的數據,再交由模型完成認知、決策。
某種程度上,機器人的智能上限,取決于它感知世界的深度。
所有空間智能,本質上都依賴同一件事:真實世界數據的持續供給。
沒有數據,再強的模型也只是靜態能力。
數據一旦斷供,所謂泛化能力就會迅速塌縮。
也正因此,行業的競爭焦點正在發生遷移:從「誰的模型更聰明」,變成「誰能持續生產真實世界」。
而這本質上就是一件更工業化的事情:把物理世界變成數據流。
這也是感知能力被重新定義的地方。
它不再只是機器人的一個模塊,而是整個系統的入口。
一個決定后續所有智能上限的入口。
從傳感器到「數據精煉廠」
但想把物理世界變成AI能理解的數據,并沒有那么簡單。
現實世界的數據,天然就是混亂的。
就像剛從礦井里開采出來的原油。有價值,但不能直接用。
真正決定機器人智能水平的,不只是有沒有傳感器,而是有沒有能力把這些原始信息加工成模型可以理解的「燃料」。
這也是樂動機器人過去十年持續投入的方向。
![]()
在公司成立之初,團隊就做了一個判斷:
機器人未來無論進入家庭、酒店、餐廳、倉庫還是工廠,最底層的共性需求一定是理解環境。
樂動機器人董事長周偉告訴量子位,「感知」可分為兩層:
第一層是感,負責通過傳感器采集環境數據;
第二層是知,通過算法和模型把數據變成機器人對環境、空間和物體的認知。
這意味著,感知從來不是一個單獨硬件問題。傳感器只是入口。
真正的競爭,在于誰能把入口采集的數據,進一步加工成空間智能。
這也是樂動沒有停留在硬件公司的原因。
![]()
這些年,機器人產業經歷過多輪周期:
- 2017年~2018年,掃地機器人快速普及;
- 2019年,物流倉儲機器人興起;
- 2020年~2021年,無接觸服務機器人進入酒店、餐廳;
- 2023年~2024年,割草機器人開始爆發。
到如今,人形機器人、機器狗、無人小車等新方向集中出現。
每一輪機器人浪潮,最終都會回到同一個問題:機器人如何理解自己所在的世界。
樂動踩中的,正是這個長期不變的底層需求。
為了讓機器人擁有理解真實世界的最佳能力,樂動的「感知產品」經歷過多輪技術迭代。
![]()
△AI生成
先說傳感器
過去單一傳感器時代,視覺解決語義問題,激光雷達解決空間定位問題。
但單一能力始終存在缺陷。
激光雷達知道距離,卻不知道那是什么;視覺知道物體,卻不一定精準知道空間位置。
而物理世界中的機器人,需要同時回答:這是一個什么東西?它在哪里?我能不能移動它?我應該如何行動?
所以,周偉認為,未來傳感器硬件的趨勢,必然走向多模態融合。
視覺、激光、深度信息、IMU(慣性測量單元)等不同數據源,需要被統一理解。
再看算法模型。
樂動早期也是依靠工程師人工編寫代碼。
但這種方式的問題很明顯,不僅效率低,而且工程師可以寫出100個規則,卻很難覆蓋真實世界里的第101種情況。
變化發生在AI進入機器人之后。公司完成了從人工規則算法到端到端AI模型的范式革新,依靠AI自主學習、自主認知環境。
在周偉看來,硬件負責收集世界,模型負責理解世界。
只有兩者結合,才能形成真正的空間智能。
![]()
如何把這些不同來源的數據,變成機器人可以學習的語言呢?
樂動自研了LD-SenseWorld靈境物理空間交互大模型。
它不是通用大模型,而是聚焦物理空間智能。核心目標只有一個:讓機器人真正理解空間。
它的第一項能力是數據預處理與多模態融合。
現實世界的數據來自視覺、激光雷達、IMU等多個通道,但這些信息天然不同步、不同結構。
如果不做統一處理,本質就是噪聲疊加。
LD-SenseWorld通過對齊、清洗與融合,把多源數據拉回同一時間與空間基準,形成可用的世界輸入。
第二項能力是特征提取與空間Token化。
連續變化的物理世界,必須被轉化為機器可學習的離散表達。
系統將位置、距離、物體關系與運動狀態等信息壓縮為“空間Token”。
相當于為機器人建立一套描述現實的基礎語言,讓空間本身變得可讀、可計算。
![]()
第三項能力是語義化與物理一致性注入。
機器人最終不是為了識別,而是為了行動。
僅有結構還不夠,機器人還需要理解規則:什么能移動、什么會墜落、人在何種情況下會改變路徑。
通過引入物理約束與語義理解,數據不再只是坐標與點云,而是具備因果與行為邏輯的認知輸入。
本質上,LD-SenseWorld做的不是建模,而是把混亂無序的數據,加工成可學習的世界「燃料」。
這也是樂動作為「數據精煉廠」的核心所在。
百萬臺設備,撐起物理AI的數據飛輪
對于物理AI來說,模型只是開始。
真正決定機器人能不能進入現實世界的,是模型背后的數據供給能力。
這也是當前機器人行業最大的挑戰。
周偉提到,行業數據來源主要有三類:
仿真數據、實驗室或數據工廠數據,以及真實場景落地數據。
這里最大的問題,是前兩者很難覆蓋真實世界里的大量未知情況。
這也是為什么,越來越多機器人公司開始意識到,真正稀缺的不是訓練模型的方法,而是訓練模型的原料。
特斯拉FSD的優勢,本質上來自大量真實道路數據積累。
![]()
△AI生成
機器人也一樣。
沒有真實設備持續運行,就沒有持續進化的數據來源。
樂動的路徑,是通過構建「物理AI三層核心架構」,給模型落地做底層支撐。
- 硬件感知層:負責用多模態傳感器采集真實世界海量原始數據。
- 模型層:空間交互大模型負責讓機器人理解真實世界,打造真實物理世界的數據精煉廠。
- 數據層:區別于仿真數據,基于真實設備持續采集,自研大模型持續加工,輸出源源不斷的結構化、語義化、物理一致性的空間Token,可直接輸入世界模型訓練。
最終形成從硬件采集數據,到數據訓練模型,再到模型反向定義硬件的「數據飛輪」。
這也是樂動和傳統硬件公司的區別。
傳統硬件公司的邏輯是生產設備——銷售設備——結束交易。
但樂動在物理AI時代,通過更多的設備,采集豐富的數據。
“數據越豐富,模型越強。模型越強,產品體驗越好。體驗越好,又容易推動更多設備進入真實場景。”周偉說。
這是一個不斷加速的循環。
![]()
△AI生成
樂動已經在這條路上積累了規模化基礎
2025年,其核心產品DTOF激光雷達出貨量超過400萬臺。
但樂動擁有的不只是傳感器出貨量,而是一個持續運行的真實世界數據入口。
據悉,搭載樂動視覺感知技術的設備量已突破2000萬臺。
在樂動的財報里,割草機器人是該公司第二增長引擎。產品目前主要銷往歐美、澳洲等高潛力智能花園養護市場。
第三方機構統計,到2030年,全球智能割草機器人市場規模預計將增至62.5億~100億美元。
什么概念?這意味著,將有更多源源不斷的真實場景數據,等待被樂動收集。
這是「數據精煉廠」成立的基礎,也是數據飛輪能夠快速起飛的前提。
20年機器人長跑,周偉的「直覺」
回看樂動的發展路徑,會發現這并不是一次突然押中的風口,而是一場持續二十年的積累。
1986年的周偉,是機器人行業典型的“少壯派”。
早在大學時期,他就獲得了中國機器人足球錦標賽冠軍。
![]()
△樂動機器人董事長周偉
2012年畢業后,周偉與華科的學長郭蓋華在深圳共同創立樂行天下。
最初選擇體感車行業時,二人的目標就不僅僅是做交通工具,而是想做出更便捷、更張揚個性自由的智能出行機器人。
2013年秋,第一款樂行智能平衡車發布,也讓樂行成為國內平衡車領域的開創者之一。
2014年,樂行天下完成1億元的B輪融資。周偉也于2015年入選“福布斯中國30位30歲以下創業者”榜單并成為封面人物。
2017年,周偉和郭蓋華兩人再次踏上創業征程,樂動機器人成立了。
從樂行天下再到樂動機器人,周偉積累了大量機器人產業經驗。
以至于創業多年后,公司遇到難關時,他還能保持技術者的敏銳直覺。
2022年那段時間,國內外宏觀環境與資本市場低迷,樂動機器人的經營狀況并不樂觀。
高研發投入、商業化周期長、訂單規模受限,投資者都開始勸周偉降低研發投入,優先保證業務。
但究竟是要短期現金流,還是積累長期技術壁壘?這是科技創業公司常見的典型試題。
頂著投資人的壓力,周偉決定all in感知技術。
原因很簡單。他認為感知不是一個階段性需求,而是所有機器人未來都會需要的底層能力。
![]()
事實證明,這個判斷最終迎來了行業回報。
2024年至2025年,機器人產業進入新一輪爆發期,樂動早期的技術投入開始釋放價值。
對外,周偉常半開玩笑說,當初的決定源于一時直覺。
所謂直覺,其實都是長期認知形成的本能。沒有二十年機器人領域的功力,恐怕很難做出這般取舍。
One more thing
傳統AI和物理AI最大的不同,是后者在面對一個復雜、連續、不斷變化的現實空間。
誰能把這個空間高質量地數字化,誰就掌握了下一階段機器智能的入口。
從這個角度看,樂動正在做的事情,已經不只是提供感知硬件,它更像是在建設一套物理世界的數據加工體系。
讓機器人看懂世界,讓模型理解世界,再讓機器人基于真實世界不斷進化。
從傳感器產品公司,到物理AI的「感知基礎設施平臺」,樂動正在完成身份重塑。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.