“機器狗會不會追壞人?現(xiàn)在的機器狗肯定不會,這就不是一項預(yù)設(shè)的任務(wù)。”4月10日,智元酷拓董事兼首席運營官邱恒對第一財經(jīng)記者表示。
現(xiàn)在四足機器人已經(jīng)應(yīng)用于倉庫巡邏、電力線路巡檢等場景。邱恒提到的這個案例,揭示了機器人面臨的現(xiàn)況:它們已經(jīng)能執(zhí)行預(yù)先規(guī)劃的特定任務(wù),但智能化水平還不足以使其自主完成一些工作,還遠(yuǎn)不足以成為優(yōu)秀的員工。
4月10日,兩家機器人公司同時公布新技術(shù)進展。智元酷拓推出新一代四足機器人,靈初智能則發(fā)布大模型Psi-R2與Psi-W0,并開源首批1000小時人類手部操作數(shù)據(jù)集。中國科技企業(yè)快步推進創(chuàng)新,但這些企業(yè)的管理層也指向共同難題:高質(zhì)量數(shù)據(jù)的稀缺,阻礙了機器人“大腦”的發(fā)育。
![]()
“真機數(shù)據(jù)一定很難Scale-Up”
對于固定路線的巡邏任務(wù),四足機器人已經(jīng)游刃有余。
目前四足機器人只有中國企業(yè)在大規(guī)模地研發(fā)和制造。據(jù)IDC報告,2024年全球四足機器狗市場出貨量約2萬臺。中國廠商憑借性價比和規(guī)模化能力重塑了產(chǎn)業(yè)格局,宇樹科技和云深處的市場份額分別為32.4%、18.9%,排名第三的美國企業(yè)波士頓動力份額12.2%。
“巡邏巡檢、定點拍照,這是單步固定流程。”邱恒說。實際作業(yè)場景,是有自主規(guī)劃、實時異常處理需要的,但機器人還不能自主地去追擊盜竊犯。“這就不是一項預(yù)設(shè)的任務(wù)。要追壞人,肯定無法先把路線設(shè)好,無法讓壞人按照路線跑。”
智元酷拓是智元集團旗下的子公司,專注于四足機器人開發(fā)。就人形機器人而言,宇樹科技與智元是中國出貨量排名靠前的企業(yè)。
人形機器人以站立作業(yè)為主,移動為輔。比如在工廠的工位上的人形機器人,工作主要由手臂來完成;四足機器人則以移動為主,手臂作業(yè)為輔,它更適合移動及較長距離的搬運工作。
中國企業(yè)已經(jīng)把人形機器人送上了春晚舞臺,送到了手機生產(chǎn)線做物料箱的搬運,但人形機器人和四足機器人當(dāng)下面臨相似的境況。
“機器人按照什么樣的路線去走,這是提前編程編好的。如果沒有提前編程設(shè)計,讓機器人獨立完成任務(wù),比如給它一個指令,把某個東西送到某個地方,它以前沒做過,要自己看地形往哪走,判斷哪里要上臺階,哪里要拐個彎。目前能做到這種能力的公司還不存在。”邱恒說。
中國有成熟的制造業(yè)基礎(chǔ),因此機器人的硬件能力容易補齊。雖然現(xiàn)在機器人的執(zhí)行器、靈巧手等部件還有待完善,但隨著時間的推移,硬件會更加成熟。
“大腦”能力的突破則更難。
所謂機器人“大腦”,是業(yè)界形象的表述,它指的是掌管機器人智能的模塊。相對應(yīng)的,小腦一般指掌管人形機器人運動的模塊。
“大腦”的發(fā)育需要好的環(huán)境,就如嬰兒需要在真實環(huán)境中認(rèn)知世界。但現(xiàn)在機器人“大腦”的培育所需的高質(zhì)量數(shù)據(jù)有限。
“我還是認(rèn)同,最終智能其實來源于數(shù)據(jù)。”靈初智能聯(lián)合創(chuàng)始人陳源培在4月10日的一場直播中表示。
當(dāng)晚,靈初智能推出大模型Psi-R2和Psi-W0,以及總規(guī)模近10萬小時的人類手部操作數(shù)據(jù)集,并開源了1000小時的數(shù)據(jù)。靈初智能這些數(shù)據(jù)是依靠人類佩戴高性能手套,在實際作業(yè)場景中采集而來。這有別于操作機器人采集的數(shù)據(jù)。
互聯(lián)網(wǎng)上存在大量的語言、視頻類數(shù)據(jù),它們成為大語言模型的燃料。而機器人的操作、運動方面的數(shù)據(jù)保存得非常少。而且,什么是可行的數(shù)據(jù)發(fā)展路徑,業(yè)界也搖擺不定。
“最早的時候,大家都是用真機數(shù)據(jù),直接拿機器人去采采采。后面發(fā)現(xiàn),真機數(shù)據(jù)的樣本效率太低了,所以又用了仿真數(shù)據(jù)。但是仿真又會有Sim2Real(模型從模擬域遷移到真實域時,由于數(shù)據(jù)分布不一致而產(chǎn)生的性能退化)的問題,所以現(xiàn)在大家又回到了真機。”陳源培表示,“但在有限的時間里,真機數(shù)據(jù)是一定很難Scale-Up(批量擴展)的。我們的解決方案就是(采集)人類數(shù)據(jù)”。
![]()
在工廠里進化
“雖然看得到一些東西,但是我覺得具身智能還沒有到GPT-3的時候。”陳源培表示。
GPT-3是OpenAI于2020年推出的參數(shù)為1750億的大模型,它的出現(xiàn)令科技界看到了大語言模型的智慧曙光。
在大語言模型,縮放定律(Scaling Law)已經(jīng)證明了有效性:模型性能會隨著模型規(guī)模、數(shù)據(jù)量和算力的增加而改變。高質(zhì)量數(shù)據(jù)的稀缺,阻礙了縮放定律在機器人領(lǐng)域發(fā)揮作用。
“我對于機器人的商業(yè)化,是比較有信心的。但是對于機器人技術(shù)的進展是偏保守的。”陳源培表示,雖然技術(shù)瓶頸會突破,但是進度不會像大家想象的一下子就達到非常高的地步。
這意味著在相當(dāng)長時間里,機器人都難以進化出令人滿意的智力。不管是四足還是人形,機器人現(xiàn)在能完成的是部分特定任務(wù),而不能指望它變成一個通才。
這也是為什么眾多機器人公司選擇在行業(yè)場景,而非家庭場景里落地。
“我們的選擇很簡單,不會上來就做家庭場景,因為家庭產(chǎn)品的功能需求太多了。比如機器人擦桌子,碰到一張紙巾,要把它扔到垃圾桶里;碰到一個手機,就不能扔垃圾桶里,而需要把它放到旁邊。”陳源培表示,靈初智能更傾向于先在一些工業(yè)場景里尋找機會,“我認(rèn)為家庭場景短期內(nèi)肯定是進不去的”。
智元、宇樹科技等也有類似的考量。
“我們暫時沒有計劃做To C應(yīng)用。”邱恒對記者說。智元的人形與四足機器人,選擇應(yīng)用場景的時候有相似的邏輯。現(xiàn)在四足機器人已經(jīng)在做安防巡邏、工業(yè)巡檢、消防等。“先ToB再ToC,原因是跟技術(shù)成熟度有關(guān)系的。行業(yè)應(yīng)用環(huán)境比較限定,業(yè)務(wù)容易閉環(huán)。但一旦到了人和家庭中,面對多元化的環(huán)境,它需要的智能更加復(fù)雜。我們想先把電網(wǎng)干好,把煤礦干好,把安防干好,然后再看要不要去家里面干活。”
相對于其他國家,中國這樣體量龐大,場景多元化的經(jīng)濟體有獨特優(yōu)勢。那些已經(jīng)有一技之長的機器人,不難找到施展的空間。比如宇樹科技在2025年已經(jīng)出貨了5500臺人形機器人,近3萬臺四足機器人。智元在今年初,也已經(jīng)累計下線了萬臺人形機器人,部分機器人已經(jīng)在手機產(chǎn)線上打工了。
一家研究機構(gòu)的分析師此前對記者表示,現(xiàn)在一些整機廠商短期會交付一些工業(yè)場景的人形機器人,但仍需觀察這些機器人落地后的真實反饋,比如效率提升、下游客戶對于經(jīng)濟性的考量,以及試用3-6個月之后,同一個客戶是否重復(fù)購買。
這些進入制造業(yè)流水線的機器人,會向開發(fā)企業(yè)反饋它們所遇到的問題。手臂操作精度不夠以至于出現(xiàn)偏差,電池管理不善以至于頻繁死機,這些都會時不時發(fā)生,但故障是機器人在工廠里進化迭代的最好起點。更重要的是,倉庫和變電站里巡邏的四足機器人,生產(chǎn)線上組裝手機的人形機器人,會收集和反饋寶貴的真實世界數(shù)據(jù),從而幫助機器人大腦的發(fā)育。
“一旦有了智能化大腦,舊場景也會有新范式。以前單純做工業(yè)巡檢、數(shù)據(jù)采集的機器人,將會變成設(shè)備診斷專家;遙控探路的機器人,就會變成應(yīng)急的尖兵。”邱恒表示。
機器人還處于非常早期的階段,整個市場的滲透率連1%都沒到。邱恒認(rèn)為,四足機器人比人形機器人更簡單一些,隨著智能提升,成本下降,它會比人形機器人更早實現(xiàn)商業(yè)閉環(huán)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.