![]()
![]()
以實干破局,打造中國具身智能自主通用底座。
作者|云凡
編輯|栗子
2月28日,一場名為“啟智涌現(xiàn)”的機器人通用技術(shù)底座開發(fā)者大會如期舉行。這不僅是一次硬核技術(shù)的系統(tǒng)發(fā)布,更像是一場針對具身智能行業(yè)集體焦慮的正面破局。
在近幾年的科技頭條里,機器人幾乎成了全能的代名詞:它們在春晚舞臺上整齊劃一地起舞,在馬拉松賽道上奔跑,在商場展廳完成后空翻或是耍雜技。這些被精心設(shè)計、反復(fù)調(diào)優(yōu)的視覺表演,給外界營造出一種智能機器人的繁榮感。
然而,當(dāng)視覺濾鏡褪去,產(chǎn)業(yè)界不得不直面一個尷尬的現(xiàn)實:一旦機器人進入非結(jié)構(gòu)化、充滿不確定性的真實作業(yè)環(huán)境時,往往會表現(xiàn)得無所適從。它們難以應(yīng)對隨機性的挑戰(zhàn),于是,我們在新聞里或工廠角落,經(jīng)常能看到機器人突然踉蹌摔倒、或者因抓取失敗而導(dǎo)致物件滑落的無奈畫面。
對于當(dāng)前機器人的產(chǎn)業(yè)現(xiàn)狀,業(yè)內(nèi)有個形象的比喻:小腦過于發(fā)達,大腦卻略顯遲鈍。這已成為大家心照不宣的共識。運動控制算法(小腦)的飛速演進,已經(jīng)足以支持機器人完成復(fù)雜的肢體動作;但任務(wù)理解與自主決策能力(大腦)的發(fā)展卻步履維艱。
更危險的暗礁隱藏在水面之下。
我國核心硬件的自主化率雖然在快速攀升,但支撐機器人思考與進化的核心軟件平臺,依然高度依賴國外的ROS(機器人操作系統(tǒng))或英偉達的Isaac Sim等生態(tài)。這構(gòu)成了隨時可能引發(fā)“卡脖子”風(fēng)險的命門。
在這種強烈的產(chǎn)業(yè)落差中,由中國工業(yè)機器人鏈主企業(yè)埃夫特聯(lián)合多方孵化的「啟智機器人」,選擇了一條極其陡峭的攀登路線:啟智并未將研發(fā)重心停留在硬件軀殼的內(nèi)卷上,其核心愿景指向了更底層的“智能機器人通用技術(shù)底座”,要做產(chǎn)業(yè)的“奠基者”。
這家?guī)в袧夂瘛皣谊牎被虻男落J企業(yè),試圖系統(tǒng)性地解決當(dāng)前行業(yè)軟硬件耦合深、開發(fā)效率低、技能無法復(fù)用等根本矛盾。2026年初的這場發(fā)布會,正是這套底座能力交出的首份實干成績單。
啟智機器人,這家坐落在安徽蕪湖的公司,正在為中國機器人打響一場跨越“演示時代”、走向真實生產(chǎn)力的實干保衛(wèi)戰(zhàn),試圖讓機器人真正融入千行百業(yè)。
1.撕掉“不大不強”標(biāo)簽的底層重構(gòu)
回溯啟智的誕生軌跡,這本身就是中國機器人產(chǎn)業(yè)一次帶有極強預(yù)見性的底層重構(gòu)。
客觀審視當(dāng)前的機器人行業(yè),盡管熱度極高,但按國際機器人聯(lián)合會(IFR)相關(guān)報告估算,全球市場規(guī)模僅約600億到800億美元;而據(jù)中國電子學(xué)會等機構(gòu)統(tǒng)計,中國市場真實口徑不足1000億元人民幣。與汽車、手機等數(shù)萬億規(guī)模的支柱產(chǎn)業(yè)相比,整個行業(yè)依然貼著“不大不強”的標(biāo)簽。
道理很簡單,產(chǎn)業(yè)不大的核心癥結(jié)在于滲透率低,而滲透率低的原因在于機器人還“并不好用”,缺乏通用的開發(fā)生態(tài)。
作為啟智的母公司,埃夫特在工業(yè)機器人領(lǐng)域是公認的“鏈主”企業(yè)。其16大系列、80款機器人產(chǎn)品矩陣中,大負載機型能扛起500公斤重物并保持±0.1mm的定位精度。同時,埃夫特在橋梁船舶智能焊接,高端家具智能噴涂、汽車零部件拋光等高價值工藝上積淀了海量的制造經(jīng)驗。
只是,在智能化浪潮席卷全球的今天,硬件與工藝固然重要,但軟實力同樣成為決定未來的關(guān)鍵。2017年,研發(fā)團隊敏銳察覺到了這一點,開始探索基于云端的工藝技能架構(gòu),為后續(xù)智能機器人通用技術(shù)底座埋下伏筆。
2024年,啟智機器人正式獨立。
在產(chǎn)業(yè)分工中,埃夫特繼續(xù)精研高價值工藝與硬件軀干;啟智則專注于打造面向未來的智能機器人通用技術(shù)底座,全面接管操作系統(tǒng)、開發(fā)工具、數(shù)據(jù)平臺等深層軟件生態(tài)的構(gòu)建,構(gòu)成可復(fù)用的大腦側(cè)能力。
這樣的分工帶有鮮明的國家隊底氣與擔(dān)當(dāng)。
要知道,啟智機器人是由埃夫特聯(lián)合國家先進制造產(chǎn)業(yè)投資基金等發(fā)起設(shè)立,為國資控股企業(yè),并在Pre?A輪融資中再次獲得國家級基金領(lǐng)投,是典型的國家隊加持的硬科技企業(yè)。公司承載著構(gòu)建自主可控機器人軟件生態(tài)的國家意志。
作為牽頭方,埃夫特啟智聯(lián)合了包括哈工大、清華、上交、浙大、中科院沈自所,中科院自動化所等國內(nèi)機器人和具身智能領(lǐng)域頭部高校,以及埃斯頓、新松、遨博,極智嘉,奇瑞,富士康等國內(nèi)頭部機器人主機廠及生態(tài)伙伴,在國家級重大科技攻關(guān)項目的加持下進行聯(lián)合研發(fā)和協(xié)同攻關(guān)。啟智的定位極為清晰:不做機器人本體去搶奪市場,專門為行業(yè)提供“智能化升級”的武器。
也就是說,啟智不涉足終端領(lǐng)域知識,不做具體車型焊接等工藝,而是專注提供焊縫跟蹤、避障規(guī)劃、柔順抓取等原子級技能。
對于主機廠而言,自研一套智能底座投入巨大且周期漫長,容易陷入重復(fù)造輪子的內(nèi)耗。啟智通過開源接口與深度兼容,與伙伴共建產(chǎn)業(yè)基礎(chǔ)設(shè)施。
這種軟硬分離、專業(yè)協(xié)同的模式,讓中國機器人的“大腦”扎根于自主可控的技術(shù)地基,也推動行業(yè)從封閉的“諾基亞時代”邁向開放的“安卓時代”:前者軟硬件深度綁定、生態(tài)割裂;后者平臺開放、分層解耦、軟硬分離,協(xié)同共創(chuàng)、技能可復(fù)用,助力產(chǎn)業(yè)走向規(guī)模化、標(biāo)準(zhǔn)化、生態(tài)化。
2.從數(shù)據(jù)到技能,啟智如何構(gòu)建具身智能的“全自動工廠”?
如果說底層技術(shù)的重構(gòu)是夯實地基,那么如何高效生產(chǎn)機器人“技能”,則決定了技術(shù)的普及速度。
在2月28日的開發(fā)者大會上,啟智機器人通過一場“商超理貨”實景演練,向外界完整展露了其打磨多時的“核心武器庫”:大衍數(shù)據(jù)平臺、墨斗IDE與Openmind OS。這三大模塊緊密咬合,構(gòu)成了一套高速運轉(zhuǎn)的“技能進化引擎”。
驅(qū)動這套引擎的內(nèi)核,源于啟智對底層技術(shù)路線的獨到判斷。
面對當(dāng)前行業(yè)嚴(yán)重的“大腦萎縮”的痛點,啟智沒有盲目跟風(fēng)市面上主流的“大語言模型+傳統(tǒng)控制”路線,而是堅定地重兵投入HumanGPT原生世界模型。
語言大模型雖然“會說”,但由于缺乏物理常識,直接嫁接極易產(chǎn)生物理幻覺。相比之下,HumanGPT則從第一性原理出發(fā),將4D時空結(jié)構(gòu)與物理動力學(xué)規(guī)律內(nèi)化。它能預(yù)判動作對周圍場景的影響,并在抓取、搬運等強交互任務(wù)中保持極高的物理一致性。
有了這種具身智能不可或缺的“物理直覺”,整個技能引擎的運轉(zhuǎn)邏輯便豁然開朗。
引擎的源頭,是大衍數(shù)據(jù)平臺與HumanGPT構(gòu)筑的“技能煉丹爐”。
為什么有時候,我們在展會上看到一些機器人還是顯得“笨笨的”?動作僵硬,反應(yīng)遲鈍,就像沒開竅的孩子。這種“笨”的本質(zhì),是因為缺乏高質(zhì)量、多維度的真實數(shù)據(jù)。
大衍數(shù)據(jù)平臺顛覆了低效的數(shù)據(jù)采集邏輯,承擔(dān)起繁重的數(shù)據(jù)清洗、自動標(biāo)注與多模態(tài)對齊工作,專門負責(zé)提煉人類的隱性經(jīng)驗。
想象一下,一位擁有20年經(jīng)驗的老焊工,穿上啟智的技能采集服,他手腕每一次的微妙轉(zhuǎn)動、視線的聚焦點、腳步的進退——這些只可意會不可言傳的“老手藝”,被完整捕捉并轉(zhuǎn)化為數(shù)字信號喂給HumanGPT。
![]()
與此同時,模型將這些隱性知識濃縮、標(biāo)準(zhǔn)化,最終煉成一個個可復(fù)制、可遷移的“原子技能包”,比如“高精度弧焊v2.0”或“易碎品抓取v1.0”。
據(jù)悉,目前該平臺已經(jīng)沉淀數(shù)十項核心原子技能,并推出“快速模式”與“專業(yè)模式”,讓技能的沉淀周期從過去的按月計算加速到按天甚至按小時。
引擎的調(diào)度端,是墨斗IDE與Vibe Coding組成的“應(yīng)用指揮部”。
擁有了豐富的技能儲備后,如何讓千行百業(yè)的用戶輕松調(diào)用它們?
啟智用墨斗IDE與Vibe Coding搭建起零門檻的應(yīng)用指揮部,讓機器人開發(fā)告別代碼壁壘。也就是說,Vibe Coding作為AI輔助編程范式,實現(xiàn)了“對話即開發(fā)” 的一鍵生成。
在商超理貨演示中,一名毫無編程基礎(chǔ)的店長只需用最自然的語言下達指令:“去冷鏈區(qū)取A品牌飲料,補充到B貨架空位”。
話音剛落,系統(tǒng)內(nèi)部的多智能體架構(gòu)(Multi-Agent)便迅速將模糊語義解構(gòu)成清晰的執(zhí)行:識別機器人角色、目標(biāo)對象、操作動作,隨后自動從仿真環(huán)境中拉取物理屬性(比如坐標(biāo)、尺寸、承重),精準(zhǔn)調(diào)用“自主導(dǎo)航”、“視覺識別”、“柔性抓取”等原子技能。
整個過程中,店長沒有編寫一行代碼,在短短幾分鐘內(nèi),一個具備前端界面的“智能理貨APP”就搭建好了。這讓場景專家直接跨越了技術(shù)壁壘,化身為應(yīng)用開發(fā)的主導(dǎo)者。
引擎的執(zhí)行終端,是Openmind OS打造的“實時神經(jīng)系統(tǒng)”。
畢竟,軟件層寫得再好,如果機器人在物理世界一走步就摔跤,一切都是零。Openmind OS正是兜底這“最后一厘米”問題的保障底座。
它的核心職能,是確保“大腦”的指令在下發(fā)給不同構(gòu)型的機器人(無論是人形R2V2還是復(fù)合機器人W2)時,動作不走樣、實時不卡頓。它解決了最底層的硬件接口標(biāo)準(zhǔn)化問題,屏蔽了不同電機、不同傳感器的差異。
比如,在商超實景演示中,當(dāng)總指揮部發(fā)出指令,Openmind OS立即進入毫秒級調(diào)度:它一邊調(diào)度復(fù)合機器人平穩(wěn)駛向冷鏈區(qū),規(guī)劃最優(yōu)路徑并實時避讓行人;一邊協(xié)調(diào)人形機器人的雙臂準(zhǔn)備接替后續(xù)的開箱和上架動作。
這一系列流暢的多機協(xié)同,全靠Openmind OS在底層進行任務(wù)級與動作級的精準(zhǔn)控場。同時,它對ROS等現(xiàn)有生態(tài)的友好兼容,也大大降低了開發(fā)者的遷移門檻。
至此,三大工具鏈在商超理貨場景中完成了無縫的實干閉環(huán):大衍平臺賦能機器人基礎(chǔ)操作能力,墨斗IDE讓店長用自然語言編排任務(wù)流,Openmind OS則在底層統(tǒng)一發(fā)號施令,全流程自主完成、一氣呵成。
在硬核的技術(shù)攻堅之外,啟智也在重塑機器人的產(chǎn)品哲學(xué)。大會上亮相的yobot家族——R2V1、W2、R2V2,分別被賦予了“少年、媽媽、爸爸”的人格化標(biāo)簽。這種設(shè)計理念跳出了傳統(tǒng)工業(yè)機器人的“唯效率論”,轉(zhuǎn)向“科技感與溫度感并重”。
在醫(yī)院承擔(dān)導(dǎo)診任務(wù)的W2,憑借具有親和力的流式語音與精準(zhǔn)語義理解,為患者帶去如沐春風(fēng)的交互體驗;在商超負責(zé)高強度作業(yè)的R2V2,則展現(xiàn)穩(wěn)定可靠的實干底色。通過在B端與G端公共服務(wù)場景中反復(fù)驗證、沉淀人機信任關(guān)系,啟智正在為機器人最終走入千家萬戶、成為人類的“家人”鋪設(shè)一條堅實的道路。
從數(shù)據(jù)提煉到技能調(diào)用,再到物理世界的執(zhí)行,啟智正以“ABC+X”(AI+大數(shù)據(jù)+云+機器人)的立體架構(gòu),將具身智能復(fù)雜的流程轉(zhuǎn)化為一條高效的“全自動工廠”。
![]()
當(dāng)技能可以像APP一樣被快速創(chuàng)建、調(diào)用、迭代和分發(fā),那個機器人全面融入人類生產(chǎn)與生活的奇點時刻,正在被無限拉近。
3.未來:如何用新的商業(yè)模式來構(gòu)建生態(tài)飛輪?
在跨越技術(shù)原型的驗證階段后,商業(yè)化落地必然成為檢驗具身智能的核心命題。
啟智判斷,2026年到2027年,將是全球機器人產(chǎn)業(yè)從量變邁向質(zhì)變的臨界點。之所以錨定這個節(jié)點,是因為屆時具身智能原生世界模型實現(xiàn)物理世界自主推理、自主決策,打破機器人依賴預(yù)設(shè)程序的局限。
當(dāng)機器人不再只是機械地跳舞,而是能穩(wěn)定地在倉庫理貨、在醫(yī)院導(dǎo)診時,行業(yè)的涌現(xiàn)臨界點就真正到來了。
當(dāng)然,要想接住這一爆發(fā)點,啟智在打磨自身的同時,更在以前瞻性的商業(yè)邏輯構(gòu)建一套自我進化的“生態(tài)飛輪”。
這個飛輪的軸心,是對高質(zhì)量數(shù)據(jù)獲取模式的顛覆。
當(dāng)前行業(yè)最大的痛點之一,是數(shù)據(jù)采集長期停留在“人適應(yīng)機器人”的低效模式。傳統(tǒng)遙操作不僅流程繁瑣,更會扭曲人類專家原本的作業(yè)邏輯,導(dǎo)致數(shù)據(jù) “形似而神不似”,難以支撐機器人走向通用智能。
為此,啟智推進了人類全模態(tài)技能采集服系統(tǒng),將采集邏輯從“捕捉機器人動作” 轉(zhuǎn)向“還原人類專家技能”,在自然作業(yè)狀態(tài)下同步捕捉視覺、意圖、軌跡、力覺與觸覺信息,再通過跨具身遷移與標(biāo)準(zhǔn)化預(yù)處理,把老師傅的手藝、店長的流程、醫(yī)護的規(guī)范,轉(zhuǎn)化為機器人可直接學(xué)習(xí)的“黃金數(shù)據(jù)”。
與此同時,為了讓數(shù)據(jù)來源可持續(xù)、規(guī)模化,啟智給出了一套產(chǎn)業(yè)界極具想象力的解決方案——機器人未來社區(qū) + 設(shè)備租賃 + 數(shù)據(jù)回購。
在蕪湖落地的機器人未來社區(qū),囊括家庭、商超、醫(yī)療、工業(yè)等全場景真實環(huán)境。通過與職業(yè)院校合作,啟智向?qū)嵱?xùn)師生租賃標(biāo)準(zhǔn)化采集設(shè)備,讓數(shù)據(jù)采集自然嵌入日常教學(xué)與作業(yè)流程。
緊隨其后,大衍平臺對數(shù)據(jù)進行智能質(zhì)量評估,并實行“優(yōu)質(zhì)優(yōu)價”的數(shù)據(jù)回購。這種模式既完美解決了數(shù)據(jù)隱私與合規(guī)問題,又讓龐大的產(chǎn)業(yè)人口成為了具身智能最可靠的“訓(xùn)練師”,為模型輸送源源不斷的養(yǎng)料。
在商業(yè)化落地層面,啟智用RaaS(Robot as a Service,機器人即服務(wù))模式,徹底打開行業(yè)規(guī)模化落地的最后一道閘門。
長期以來,噴涂、焊接等高價值工業(yè)場景,以及商超、康養(yǎng)等服務(wù)場景,都面臨中小微企業(yè)“買不起機器人、更用不好機器人”的困境。啟智將重資產(chǎn)投入轉(zhuǎn)為輕量化運營支出,提供按需租賃、按使用計費、技能訂閱等靈活方式,把使用門檻降到最低。
更關(guān)鍵的是,這套模式并非簡單的“以租代售”。機器人在真實場景持續(xù)作業(yè)的過程,也是高質(zhì)量工藝數(shù)據(jù)、交互數(shù)據(jù)、場景數(shù)據(jù)持續(xù)回流的過程,數(shù)據(jù)反哺底座與模型,模型再提升機器人通用性與可靠性,形成“場景落地—數(shù)據(jù)積累—能力進化—更廣泛落地”的正向循環(huán)。
簡單來說,啟智打的這張牌是:以服務(wù)換數(shù)據(jù),以數(shù)據(jù)強生態(tài),讓商業(yè)價值與技術(shù)進化彼此咬合、不可分割。
在啟智的生態(tài)版圖中,開發(fā)者群體被視為最活躍的根系。
啟智的生態(tài)合作極其務(wù)實,堅守“不做概念合作,只做場景共建”。針對清華、中科大等頂尖高校,啟智全面開放底層工具與算力,聯(lián)合攻關(guān)前瞻技術(shù);面對華為、富士康等產(chǎn)業(yè)龍頭,則采用POC驗證加規(guī)模化復(fù)制的模式,深度嵌入真實工業(yè)場景。
同時,通過“開發(fā)者扶持計劃”,啟智正在為萬千應(yīng)用型開發(fā)者提供全套裝備,鼓勵他們在非結(jié)構(gòu)化環(huán)境下開發(fā)出千姿百態(tài)的應(yīng)用,共同構(gòu)建起具身智能的繁榮生態(tài)。
4.寫在最后
如果只用一個關(guān)鍵詞來定義啟智的2026年,那毫無疑問會是“實干”。
在這個充滿喧囂與泡沫的賽道里,啟智給外界傳遞的印象是:不希望成為一棵孤傲的大樹,而是要成為一片土壤,將所有的技術(shù)積累與生態(tài)布局,扎根在真實的場景、真實的營收與真實的價值上。
在具身智能的這場長跑中,誰能率先構(gòu)建起讓千行百業(yè)低門檻入場的底層生態(tài),誰就有機會定義未來的規(guī)則。
2026年,當(dāng)?shù)谝慌嬲茉诜墙Y(jié)構(gòu)化環(huán)境下“實干”的機器人規(guī)模化上崗時,我們或許會回過頭發(fā)現(xiàn),這一刻的“底座建設(shè)”是關(guān)鍵的破題之策。
(本文封面圖及文中圖片來源:啟智機器人)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.