![]()
![]()
- 時(shí)代的機(jī)遇,
- 只眷顧那些早已準(zhǔn)備好的人。
![]()
![]()
被數(shù)據(jù)“卡住”的具身智能,
需要一種現(xiàn)實(shí)解法
2026年,無(wú)疑是機(jī)器人從技術(shù)驗(yàn)證走向產(chǎn)業(yè)應(yīng)用的關(guān)鍵一年。當(dāng)下的機(jī)器人,已經(jīng)走出實(shí)驗(yàn)室的演示階段,開(kāi)始逐步進(jìn)入到工業(yè)、公共服務(wù)等真實(shí)環(huán)境中。
然而技術(shù)驗(yàn)證并不等于大規(guī)模商業(yè)化的到來(lái)。在不少行業(yè)人士看來(lái),真實(shí)環(huán)境遠(yuǎn)比實(shí)驗(yàn)室復(fù)雜——光線(xiàn)變化、地面雜物、非標(biāo)操作……每一個(gè)細(xì)節(jié)都可能讓機(jī)器人“失靈”。
泛化能力不足,仍是橫亙?cè)诰呱碇悄芤?guī)模化落地面前最難繞開(kāi)的核心瓶頸。而這一困局的根源,指向行業(yè)普遍共識(shí)的數(shù)據(jù)桎梏。
問(wèn)題首先出在數(shù)據(jù)匱乏和標(biāo)準(zhǔn)的不統(tǒng)一。百小時(shí)量級(jí)的數(shù)據(jù)僅能支撐單一動(dòng)作的泛化——比如讓機(jī)器人學(xué)會(huì)分揀。而要實(shí)現(xiàn)真正意義上的通用具身智能,所需數(shù)據(jù)量需要數(shù)量級(jí)的躍升。
更棘手的是,各家企業(yè)的機(jī)器人本體構(gòu)型不同,數(shù)據(jù)格式與采集邏輯難以互通,行業(yè)內(nèi)部事實(shí)上已經(jīng)形成了一道道隱形的數(shù)據(jù)壁壘,各自為戰(zhàn)、無(wú)法共享。
另一重壓力來(lái)自獲取的成本。大語(yǔ)言模型的訓(xùn)練,可以借助互聯(lián)網(wǎng)上海量的公開(kāi)文本完成預(yù)訓(xùn)練,數(shù)據(jù)獲取的邊際成本極低。但機(jī)器人所需的數(shù)據(jù)截然不同——它必須來(lái)自真實(shí)物理世界的交互,采集鏈路長(zhǎng)、標(biāo)注難度高、復(fù)現(xiàn)成本大。這道門(mén)檻,對(duì)中小企業(yè)而言幾乎是一堵墻。
數(shù)據(jù)成本究竟有多高?國(guó)地中心數(shù)據(jù)負(fù)責(zé)人曾給出過(guò)一個(gè)直觀(guān)的估算:特斯拉人形機(jī)器人Optimus若要完全準(zhǔn)備好在工廠(chǎng)獨(dú)立工作,至少需要數(shù)百萬(wàn)小時(shí)的訓(xùn)練數(shù)據(jù),對(duì)應(yīng)的數(shù)據(jù)采集成本可能高達(dá)5億美元。這個(gè)數(shù)字,已經(jīng)足以讓絕大多數(shù)玩家望而卻步。
如果說(shuō)算法是具身智能的大腦,數(shù)據(jù)就是讓大腦持續(xù)進(jìn)化的燃料。真實(shí)世界的數(shù)據(jù)更像是一種與硬件深度綁定的工業(yè)產(chǎn)出——誰(shuí)擁有設(shè)備、控制部署、理解場(chǎng)景,誰(shuí)才有能力持續(xù)生產(chǎn)高價(jià)值數(shù)據(jù)。
“具身智能的數(shù)據(jù),就是物理AI時(shí)代的基礎(chǔ)設(shè)施”,聆動(dòng)通用CEO季超告訴36氪,在基礎(chǔ)設(shè)施還不夠完善的情況下,即使技術(shù)路線(xiàn)產(chǎn)生了突破之后,依然沒(méi)有辦法產(chǎn)生產(chǎn)品和市場(chǎng)級(jí)的商業(yè)突破。
聆動(dòng)通用成立于2024年12月,作為科大訊飛在具身智能領(lǐng)域的戰(zhàn)略布局,是安徽省首家實(shí)現(xiàn)“大腦-小腦-本體”全鏈路自主可控的硬科技初創(chuàng)企業(yè)。其提出大腦-小腦-本體的分層端到端架構(gòu),正是在當(dāng)前動(dòng)作數(shù)據(jù)極度匱乏的現(xiàn)實(shí)約束下,為具身智能大規(guī)模產(chǎn)業(yè)落地蹚出的一條關(guān)鍵路徑。
對(duì)于核心競(jìng)爭(zhēng)力,季超用“生態(tài)位”而非單點(diǎn)能力來(lái)定義:“訊飛生態(tài) + 聆動(dòng)通用垂直整合的全棧自主可控。”
這背后是三個(gè)層次的協(xié)同——數(shù)據(jù)端海量積累的真實(shí)作業(yè)數(shù)據(jù)讓模型真正貼近落地場(chǎng)景;模型端從預(yù)訓(xùn)練到后訓(xùn)練全鏈路自主可控,上述數(shù)據(jù)的優(yōu)勢(shì)進(jìn)一步強(qiáng)化了模型的優(yōu)勢(shì);硬件端則擁有觸達(dá)芯片級(jí)的工規(guī)級(jí)研發(fā)能力,真正滿(mǎn)足“進(jìn)工廠(chǎng)、真干活”。在季超看來(lái),聆動(dòng)通用依托“全模態(tài)數(shù)據(jù)采集管線(xiàn) + AI原生預(yù)訓(xùn)練-后訓(xùn)練模型全棧能力 + 工規(guī)級(jí)軟硬一體垂直整合的獨(dú)特生態(tài)位”才是行業(yè)里真正難以復(fù)制的壁壘。
借助其最新推出的具身智能通用機(jī)器人LDB與具身智能采訓(xùn)推機(jī)器人LDT,聆動(dòng)通用實(shí)現(xiàn)從數(shù)據(jù)采集、模型訓(xùn)練、硬件部署與場(chǎng)景應(yīng)用的完整閉環(huán):讓機(jī)器人“干活”與“變聰明”同步發(fā)生,以此打通具身智能從實(shí)驗(yàn)室走向真實(shí)產(chǎn)線(xiàn)的最后一公里。
![]()
大小腦結(jié)合:機(jī)器人
走向真實(shí)場(chǎng)景應(yīng)用的更優(yōu)解
為什么是大腦-小腦-本體的分層端到端架構(gòu)?
在具身智能的技術(shù)分野中,“完全端到端”一度被視為最具想象力的方向:一個(gè)模型,從感知到?jīng)Q策再到執(zhí)行,一步到位。但當(dāng)機(jī)器人走出實(shí)驗(yàn)室,進(jìn)入真實(shí)產(chǎn)線(xiàn)時(shí),問(wèn)題開(kāi)始集中暴露:機(jī)器人可以理解,卻無(wú)法穩(wěn)定執(zhí)行。
這主要是因?yàn)椋I(yè)場(chǎng)景對(duì)機(jī)器人實(shí)時(shí)性、穩(wěn)定性與可控性的要求,遠(yuǎn)高于任何消費(fèi)級(jí)應(yīng)用。一方面,由于大模型的推理本身存在延遲,難以支撐高速流水線(xiàn)下的連續(xù)操作;另一方面,端到端模型的“黑盒”屬性,在工業(yè)場(chǎng)景中意味著更高的不確定性。一旦出現(xiàn)誤判,很難定位問(wèn)題來(lái)源,更難進(jìn)行工程層面的修正。
這也是為什么,聆動(dòng)通用所采用的“大小腦”分層端到端架構(gòu),為機(jī)器人走向產(chǎn)業(yè)落地提供了一種更現(xiàn)實(shí)的工程解法,它將具身智能的能力拆解為兩個(gè)協(xié)同運(yùn)作的層級(jí)——大腦主感知決策,小腦主動(dòng)作執(zhí)行。二者背后各有一條獨(dú)立的數(shù)據(jù)管線(xiàn)支撐,各司其職、互不拖累。
首先,是作為大腦的行業(yè)級(jí)iFlyBot_VLM具身基礎(chǔ)模型,負(fù)責(zé)感知環(huán)境與任務(wù)決策。它基于互聯(lián)網(wǎng)海量數(shù)據(jù)預(yù)訓(xùn)練而成,形成對(duì)特定任務(wù)的先驗(yàn)知識(shí),賦予機(jī)器人理解指令、推理意圖的能力。
其次,是作為小腦的iFlyBot_VLA技能操作模型,負(fù)責(zé)將大腦的決策指令轉(zhuǎn)化為柔性、可泛化的精準(zhǔn)動(dòng)作,并通過(guò)具身智能采訓(xùn)推機(jī)器人在真實(shí)場(chǎng)景中持續(xù)采集的真機(jī)數(shù)據(jù)進(jìn)行針對(duì)性微調(diào),讓機(jī)器人具備可靠的落地執(zhí)行能力。
聆動(dòng)通用依托全棧自研的 iFlyBot_VLM 與 iFlyBot_VLA 模型能力,并接入訊飛生態(tài)近千人規(guī)模的數(shù)據(jù)團(tuán)隊(duì),已構(gòu)建起覆蓋互聯(lián)網(wǎng)數(shù)據(jù)、仿真合成數(shù)據(jù)、Embodied UMI 真機(jī)數(shù)據(jù)及高精度同構(gòu)遙操作數(shù)據(jù)的全鏈路數(shù)據(jù)體系。
這背后,是聆動(dòng)通用構(gòu)建的“數(shù)據(jù)-模型-硬件-應(yīng)用”全鏈路閉環(huán)。通過(guò)機(jī)器人遙操作采集真實(shí)數(shù)據(jù),然后反哺模型提升智能化水平,繼而輸出指令給硬件,實(shí)現(xiàn)“知行合一”,真正做到機(jī)器人既能干活,又能產(chǎn)生數(shù)據(jù)。
2026年4月16日,聆動(dòng)通用全球首發(fā)新一代具身智能通用機(jī)器人——LDB01。其硬件規(guī)格按照工規(guī)級(jí)標(biāo)準(zhǔn)設(shè)計(jì),算力、感知及功能安全模塊均針對(duì)工業(yè)嚴(yán)苛環(huán)境優(yōu)化,是真正意義上滿(mǎn)足工業(yè)場(chǎng)景MTBF和壽命要求的具身智能機(jī)器人。
截至目前,聆動(dòng)通用已經(jīng)與物流、汽車(chē)、3C電子領(lǐng)域的頭部客戶(hù)進(jìn)行驗(yàn)證,預(yù)計(jì)可實(shí)現(xiàn)三周內(nèi)快速上線(xiàn)部署。
某種意義上,分層端到端架構(gòu)為具身智能產(chǎn)業(yè)化落地提供了一種“沿途下蛋”的商業(yè)選擇。它允許在達(dá)到“完全端到端”之前,先在特定的工業(yè)場(chǎng)景(如物流、汽車(chē)、3C電子)實(shí)現(xiàn)階段性落地,為具身智能企業(yè)創(chuàng)造商業(yè)現(xiàn)金流。
在季超看來(lái),或許未來(lái)還有更高效的數(shù)據(jù)采集方式,但就當(dāng)下而言,這是目前行業(yè)兼顧規(guī)模、成本、質(zhì)量與效率的最優(yōu)解決方案。
![]()
具身智能背后的萬(wàn)億藍(lán)海:
聆動(dòng)通用如何驅(qū)動(dòng)產(chǎn)業(yè)落地?
當(dāng)大小腦模式在真實(shí)場(chǎng)景中得到有效驗(yàn)證,具身智能也逐漸迎來(lái)產(chǎn)業(yè)落地的下半場(chǎng)。
2026年,無(wú)疑是具身智能逼近規(guī)模化落地的臨界點(diǎn)。市場(chǎng)規(guī)模的爆發(fā)式增長(zhǎng)與資本爭(zhēng)相涌入的熱情早已相互印證,這是一個(gè)萬(wàn)億藍(lán)海賽道。據(jù)中商產(chǎn)業(yè)研究院分析師預(yù)測(cè),2026年中國(guó)具身智能市場(chǎng)規(guī)模將達(dá)到10904億元。
但是在市場(chǎng)規(guī)模爆發(fā)之外,產(chǎn)業(yè)落地需要的不再只是誰(shuí)的模型更強(qiáng)、誰(shuí)的硬件在展會(huì)上更酷炫,而是誰(shuí)能率先建立數(shù)據(jù)標(biāo)準(zhǔn)、打通產(chǎn)業(yè)生態(tài)、將技術(shù)能力真正轉(zhuǎn)化為可大規(guī)模復(fù)制的交付能力。
這正是聆動(dòng)通用給自己設(shè)定的目標(biāo)。在季超看來(lái),聆動(dòng)通用只做兩件事:第一個(gè)是數(shù)據(jù),第二個(gè)則是應(yīng)用。這本身就不是一家傳統(tǒng)機(jī)器人公司的創(chuàng)業(yè)思維。傳統(tǒng)機(jī)器人公司的核心競(jìng)爭(zhēng)力是本體制造與運(yùn)動(dòng)控制,而聆動(dòng)通用把數(shù)據(jù)和應(yīng)用并列為戰(zhàn)略核心,依托自主可控的全模態(tài)數(shù)據(jù)采集管線(xiàn)、預(yù)訓(xùn)練-后訓(xùn)練模型全棧能力、工規(guī)級(jí)軟硬件一體化垂直整合的獨(dú)特生態(tài)位,實(shí)則是在構(gòu)建具身智能時(shí)代的底層供給能力。
聆動(dòng)通用從創(chuàng)立之初就沒(méi)有把自己框定為一家傳統(tǒng)的機(jī)器人公司,而是立志成為具身智能產(chǎn)業(yè)基礎(chǔ)設(shè)施的構(gòu)建者。這背后,得益于科大訊飛體系的成熟孵化以及從技術(shù)研發(fā)到產(chǎn)品落地的連續(xù)性。“做大模型、自動(dòng)駕駛和傳統(tǒng)工業(yè)機(jī)器人的公司均在積極布局具身智能。”季超說(shuō),“但我們?cè)诘讓釉搭^技術(shù)的演進(jìn)上,一直有非常清晰的連續(xù)性。”
對(duì)于2017年就加入科大訊飛、長(zhǎng)期深耕機(jī)器人感知、交互與運(yùn)動(dòng)控制領(lǐng)域的他而言,具身智能從來(lái)不是一個(gè)風(fēng)口,而是一件從未中斷過(guò)的事業(yè)。
資本市場(chǎng)對(duì)這份積累給出了快速回應(yīng)。成立不到一年,聆動(dòng)通用已完成三輪融資。其中去年8月披露的數(shù)億元人民幣天使輪融資,由元禾璞華領(lǐng)投、訊飛創(chuàng)投加碼——老股東的持續(xù)押注,新一輪融資即將敲定,是對(duì)這支團(tuán)隊(duì)最有力的背書(shū)。
作為具身智能產(chǎn)業(yè)基礎(chǔ)設(shè)施的構(gòu)建者,聆動(dòng)通用也在用實(shí)際行動(dòng)兌現(xiàn)這一價(jià)值定位。
在科技創(chuàng)新層面,聆動(dòng)通用聚焦打造高泛化性的具身大模型和通用魯棒的機(jī)器人本體,推出了全棧自研的“行業(yè)級(jí)iFlyBot-VLM視覺(jué)語(yǔ)言基座大模型和iFlyBot-VLA視覺(jué)-語(yǔ)言-動(dòng)作操作大模型”分層端到端架構(gòu)。
在成果轉(zhuǎn)化上,聆動(dòng)通用最新發(fā)布的LDB通用機(jī)器人歷經(jīng)六輪內(nèi)部迭代,自研率超過(guò)90%,算力、感知與功能安全模塊全部按照工規(guī)級(jí)標(biāo)準(zhǔn)設(shè)計(jì),是真正意義上能夠在工業(yè)嚴(yán)苛環(huán)境下持續(xù)穩(wěn)定作業(yè)的生產(chǎn)力工具。
在產(chǎn)業(yè)賦能上,聆動(dòng)通用的目光落得更遠(yuǎn)。作為副組長(zhǎng)單位,深度參與工信部首個(gè)具身智能行業(yè)標(biāo)準(zhǔn)的起草制定,該標(biāo)準(zhǔn)將于今年6月1日正式試行;同時(shí)推出國(guó)內(nèi)首個(gè)具身智能基準(zhǔn)測(cè)試評(píng)測(cè)標(biāo)準(zhǔn),成為國(guó)內(nèi)首批、安徽省首個(gè)通過(guò)可信AI評(píng)測(cè)的企業(yè)之一,讓具身智能告別技術(shù)混戰(zhàn),走向有標(biāo)可依的規(guī)范化發(fā)展。
季超強(qiáng)調(diào),聆動(dòng)通用打造的是未來(lái)懂知識(shí)、善學(xué)習(xí)、能進(jìn)化的硅基勞動(dòng)力,不是一種工具,而是直接創(chuàng)造結(jié)果的生產(chǎn)伙伴,“我們致力于改變?cè)谥圃鞓I(yè)領(lǐng)域勞動(dòng)力逐漸缺失,人類(lèi)越來(lái)越不愿意從事繁重的體力勞動(dòng)的現(xiàn)狀,用具身智能 + 機(jī)器人重新賦能傳統(tǒng)制造業(yè)智能化升級(jí)”。
作為人工智能走向現(xiàn)實(shí)世界的重要載體,具身智能所帶來(lái)的新質(zhì)生產(chǎn)力升級(jí)遠(yuǎn)不止于制造業(yè)。從物流、醫(yī)療到公共服務(wù),智能正在突破認(rèn)知層的邊界,第一次真正進(jìn)入物理世界、作用于真實(shí)生產(chǎn)。
這場(chǎng)生產(chǎn)力革命的起點(diǎn),已經(jīng)從每一條有序運(yùn)轉(zhuǎn)的工業(yè)產(chǎn)線(xiàn)上悄然發(fā)生。就在萬(wàn)億級(jí)市場(chǎng)爆發(fā)的前夜,聆動(dòng)通用以多年的技術(shù)積累與產(chǎn)業(yè)驗(yàn)證為基礎(chǔ),率先打通了從數(shù)據(jù)到應(yīng)用的全鏈路閉環(huán)。而這條路,正在成為具身智能規(guī)模化落地最清晰的一條航線(xiàn)。
時(shí)代的機(jī)遇,只眷顧那些早已準(zhǔn)備好的人。夯實(shí)數(shù)據(jù)地基,托舉產(chǎn)業(yè)未來(lái)——正是聆動(dòng)通用選擇的使命,也是它認(rèn)為這個(gè)時(shí)代最值得全力以赴的一件事。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.