這可能是人類最后一次戰(zhàn)勝機(jī)器人了。
近期,在 Figure AI 最近一場(chǎng) 10 小時(shí)「人類 vs 機(jī)器人」包裹分揀挑戰(zhàn)里,實(shí)習(xí)生 Aime 最終分揀 12924 件包裹,F(xiàn)igure 03 則完成 12732 件,人類以 192 件的微弱優(yōu)勢(shì)守住了勝利。雖然,人類在這場(chǎng)比賽里勝利了,但多家媒體稱這可能會(huì)是人類最后一次在于機(jī)器人的對(duì)決里獲得勝利。
![]()
(圖源:Youtube)
這話并非空穴來(lái)風(fēng),在結(jié)束比賽后,實(shí)習(xí)生 Aime 的手指和手部多個(gè)關(guān)節(jié)已經(jīng)出現(xiàn)酸脹感,無(wú)法繼續(xù)分揀工作,而 Figure 03 則還能堅(jiān)守在崗位上。也就是說(shuō),速度上人類是勝利的,但持續(xù)工作這一塊,機(jī)器人贏得更多。
從這場(chǎng)有趣的比賽,我們能看到人形機(jī)器人正在從舞臺(tái)和發(fā)布會(huì),走向工廠、倉(cāng)庫(kù)和流水線,而另一個(gè)問(wèn)題是,它們距離真正全面「上崗」,還有多遠(yuǎn)?
機(jī)器人與人類同場(chǎng)競(jìng)技,誰(shuí)贏了并不重要
在比賽之前,F(xiàn)igure 已經(jīng)把包裹分揀做成了一場(chǎng)連續(xù)直播。最初它展示的是 8 小時(shí)自主分揀,后來(lái)又把測(cè)試?yán)L(zhǎng)到 24 小時(shí)以上,至截稿前,該直播間已經(jīng)連續(xù)直播了 137 個(gè)小時(shí)。直播的內(nèi)容其實(shí)也有點(diǎn)無(wú)聊,就是幾臺(tái) Figure 03 站在傳送帶旁邊,一遍遍識(shí)別包裹、抓取包裹、翻轉(zhuǎn)包裹,再把面單或條碼朝向指定方向放回去。
直播間里的觀眾給機(jī)器人起了名字,有的叫 Bob,有的叫 Frank,有的叫 Gary,還有 Rose、Jim 這樣的名字,觀眾們給這些機(jī)器人取名字,盯著看它們會(huì)不會(huì)出錯(cuò),讓一場(chǎng)看著有些無(wú)聊的直播,變成了「真人秀」。
![]()
(圖源:Youtube)
事實(shí)上,這樣強(qiáng)烈的反差感也是讓越來(lái)越多人圍觀這場(chǎng)直播的原因。一邊是一個(gè)極其枯燥的物流動(dòng)作,另一邊是幾百萬(wàn)甚至上千萬(wàn)網(wǎng)友盯著機(jī)器人搬箱子,看它會(huì)不會(huì)卡住、會(huì)不會(huì)掉包裹、會(huì)不會(huì)突然罷工。有網(wǎng)友調(diào)侃,這些機(jī)器人不只是在搶倉(cāng)庫(kù)工人的活,連主播的活也一起搶了。還有人表示,這場(chǎng)直播太好「睡」了,已經(jīng)成為了自己的助眠神器。
對(duì)普通觀眾來(lái)說(shuō),這可能有點(diǎn)催眠,但對(duì) Figure 來(lái)說(shuō),這正是它想要的效果。人形機(jī)器人如果真的要進(jìn)入工廠和倉(cāng)庫(kù),重要的是要在幾個(gè)小時(shí)、十幾個(gè)小時(shí)甚至幾十個(gè)小時(shí)里,持續(xù)完成那些單調(diào)的動(dòng)作。越多人圍觀、越多人盯著這些機(jī)器人會(huì)不會(huì)出錯(cuò),反倒是給了Figure 更多修正的機(jī)會(huì)。
![]()
(圖源:Youtube)
Figure 選擇包裹分揀這個(gè)最無(wú)聊的任務(wù),其實(shí)考驗(yàn)的正是目前工業(yè)任務(wù)里最難的幾項(xiàng)工作。試想一下,對(duì)人來(lái)說(shuō),分揀包裹只是看一眼、拿起來(lái)、翻個(gè)面、放回去;但對(duì)機(jī)器人來(lái)說(shuō),這是視覺、抓取、力度控制、路徑規(guī)劃結(jié)合起來(lái)的綜合性能力考驗(yàn)。這些包裹也不完全都是統(tǒng)一的紙箱,還有軟袋、薄信封,有的很輕、有的很重,機(jī)器人還得先看清條碼和姿態(tài),再?zèng)Q定抓哪里、用多大力。所以,在這場(chǎng)直播里,「翻車」的機(jī)器人還真不少。
![]()
(圖源:Youtube)
按照Figure 的介紹,此次參與直播分揀物流的機(jī)器人系旗下的Figure 03,身高約 173 厘米,重量 61 公斤,最大載荷 20 公斤,續(xù)航約 5 小時(shí),全電驅(qū),并支持無(wú)線充電。它不是一臺(tái)只為某個(gè)動(dòng)作定制的機(jī)械臂,而是一個(gè)能站在人類工作環(huán)境里的通用人形平臺(tái)。
真正讓它能處理包裹分揀的,是 Figure 自研的 Helix 視覺-語(yǔ)言-動(dòng)作模型。簡(jiǎn)單來(lái)說(shuō),Helix 要解決的是三件事,分別是機(jī)器人看見了什么,機(jī)器人知道自己要做什么,以及機(jī)器人下一刻身體、手腕、手指該怎么動(dòng)。Figure 把這套系統(tǒng)分成負(fù)責(zé)理解任務(wù)和環(huán)境的「慢系統(tǒng)」,以及負(fù)責(zé)高速輸出動(dòng)作控制的「快系統(tǒng)」,后者可以以 200Hz 的頻率控制手、腕、軀干和手指的連續(xù)動(dòng)作。
比如,包裹分揀看起來(lái)只是手部動(dòng)作,實(shí)際上機(jī)器人每一次伸手之前,都要先完成一次動(dòng)態(tài)判斷,機(jī)器人不能只知道「抓箱子」,還要知道這個(gè)箱子現(xiàn)在在哪里、條碼朝哪邊、用哪只手更合適、翻轉(zhuǎn)后會(huì)不會(huì)遮住面單。Figure 還在 Figure 03 上強(qiáng)化了手部和視覺能力,比如更低延遲的視覺系統(tǒng)、手掌相機(jī)、柔順手指和指尖觸覺傳感器,這些都是為了讓機(jī)器人在抓取時(shí)更接近人類揀貨的能力。
![]()
(圖源:Youtube)
實(shí)際上,F(xiàn)igure 從 2022 年創(chuàng)立之初就幾乎是 All in 機(jī)器人工業(yè)領(lǐng)域,他要做的就是設(shè)計(jì)生產(chǎn)能直接投入到制造、物流、倉(cāng)儲(chǔ)、零售等場(chǎng)景的通用人形勞動(dòng)力。2024 年,F(xiàn)igure 02 已經(jīng)進(jìn)入 BMW 位于美國(guó)南卡羅來(lái)納州 Spartanburg 的工廠測(cè)試,用于把鈑金件放入夾具等生產(chǎn)環(huán)節(jié)。一段時(shí)間后, Figure 披露,機(jī)器人在 BMW 產(chǎn)線上進(jìn)行了更長(zhǎng)時(shí)間部署,參與實(shí)際生產(chǎn)任務(wù)。
這其實(shí)說(shuō)明,機(jī)器人進(jìn)入到產(chǎn)線,已經(jīng)不是遙不可及的事情,它已經(jīng)真實(shí)地發(fā)生在某些細(xì)分行業(yè)里。至于與人類的比賽,無(wú)論勝負(fù)結(jié)果,當(dāng)一個(gè)機(jī)器人能夠與真人在某個(gè)工作上比拼,這對(duì)于前者而言,已經(jīng)是一個(gè)進(jìn)步。
人形機(jī)器人,先去工廠打工
Figure 之外,國(guó)內(nèi)外機(jī)器人公司其實(shí)早就把目光投向了工廠和倉(cāng)庫(kù)。
國(guó)內(nèi)走得比較快的一個(gè)例子是智元機(jī)器人。它的落地重心并不只是發(fā)布會(huì)上展示人形機(jī)器人走路、互動(dòng),而是把工業(yè)智能制造、物流分揀、上下料、搬運(yùn)等作為重點(diǎn)方向。智元的遠(yuǎn)征 A2-W 面向柔性制造,已經(jīng)在周轉(zhuǎn)箱拆碼垛、車間搬運(yùn)、上下料等場(chǎng)景里推進(jìn)應(yīng)用;精靈 G1 則更偏向倉(cāng)儲(chǔ)分揀這類對(duì)泛化能力要求更高的任務(wù)。據(jù)了解,智元與富臨精工達(dá)成數(shù)千萬(wàn)元項(xiàng)目合作,近百臺(tái)遠(yuǎn)征 A2-W 將落地工廠;在物流領(lǐng)域,德馬科技也訂購(gòu)了數(shù)十臺(tái)精靈 G1,用于倉(cāng)儲(chǔ)分揀。
![]()
(圖源:智元機(jī)器人)
優(yōu)必選先扎進(jìn)汽車廠,再向 3C 和物流擴(kuò)散。Walker S 系列本身就是面向工業(yè)場(chǎng)景開發(fā)的人形機(jī)器人,過(guò)去一年多已經(jīng)多次進(jìn)入車廠實(shí)訓(xùn),包括蔚來(lái)、極氪、一汽-大眾青島、奧迪一汽、比亞迪、北汽新能源等。它做的也不是抽象的「智能制造」,而是更具體的裝配、轉(zhuǎn)運(yùn)、質(zhì)檢、維護(hù)、物料處理等工序。比如 Walker S1 在極氪工廠進(jìn)行多機(jī)協(xié)同訓(xùn)練,還與無(wú)人叉車、物流設(shè)備配合完成汽車零部件入庫(kù)等任務(wù)。更值得注意的是,優(yōu)必選還把合作范圍擴(kuò)到富士康和順豐,前者為 3C 制造,后者則是深入到物流體系。
![]()
(圖源:優(yōu)必選)
小米與其他兩家都不太一樣,它先選擇了在自家工廠「實(shí)習(xí)」。今年3 月,雷軍和小米技術(shù)官方披露,小米人形機(jī)器人已經(jīng)進(jìn)入小米汽車工廠「實(shí)習(xí)」,基于通用 VLA 基座模型 Xiaomi-Robotics-0,結(jié)合多模態(tài)感知和強(qiáng)化學(xué)習(xí),在自攻螺母上件工站、料箱搬運(yùn)等場(chǎng)景中進(jìn)行自主作業(yè)。其中,自攻螺母上件工站的數(shù)據(jù)十分亮眼,機(jī)器人連續(xù)自主運(yùn)行 3 小時(shí),雙側(cè)同時(shí)安裝成功率達(dá)到 90.2%,同時(shí)滿足最快 76 秒的產(chǎn)線生產(chǎn)節(jié)拍要求。
![]()
(圖源:小米)
最先被大眾以表演形式認(rèn)識(shí)到的魔法原子也在工業(yè)領(lǐng)域加速前進(jìn),比如 MagicBot 已經(jīng)進(jìn)入工廠產(chǎn)線進(jìn)行多項(xiàng)作業(yè)訓(xùn)練,覆蓋工業(yè)、商業(yè)、家庭等場(chǎng)景。雖然大家可能在 2026 年春晚上看到的魔法原子人形機(jī)器人和四足機(jī)器人因?yàn)槲枧_(tái)表演出圈,尤其是多機(jī)協(xié)同、動(dòng)作編排和高密度調(diào)度,但其實(shí)它在工業(yè)的布局也比大眾想象得要更加深入。
![]()
(圖源:魔法原子)
在海外,特斯拉的Optimus 更加激進(jìn)。Optimus 先是綁定自家工廠,在在特斯拉工廠中進(jìn)行過(guò)電池分揀、零部件搬運(yùn)等任務(wù)演示,另外,特斯拉也承諾 Optimus 將在完成驗(yàn)證后,對(duì)外出售。
![]()
(圖源:特斯拉)
不難看出,人形機(jī)器人行業(yè)的整體共識(shí)就是,第一批落地的崗位,可能不是表演、家庭,而是倉(cāng)庫(kù)和流水線上。這些場(chǎng)景雖然沒有要求高度情緒交互,但也并不代表沒有實(shí)用場(chǎng)景,這些搬運(yùn)、上下料、分揀、裝配等崗位,很難被自動(dòng)化完全替代,但人力去做,難免辛苦又無(wú)聊。從這個(gè)角度回到這次 Figure 看似有點(diǎn)「離奇」的分揀直播和分揀挑戰(zhàn)賽,就不是太難理解了,它只是用一種更像「表演」的形式告訴大眾,機(jī)器人或許真的要上崗了。
和人類「輪班制」,工廠機(jī)器人的下一個(gè)選擇
說(shuō)到底,人形機(jī)器人今天還不是工廠里的最優(yōu)解。
如果只看單一動(dòng)作的速度和精度,專用機(jī)械臂依然更成熟。它不需要長(zhǎng)成人的樣子,也不需要理解太復(fù)雜的環(huán)境,只要在固定位置、固定軌跡、固定節(jié)拍里重復(fù)工作,就能跑得又快又穩(wěn)。對(duì)很多已經(jīng)高度自動(dòng)化的產(chǎn)線來(lái)說(shuō),人形機(jī)器人未必有優(yōu)勢(shì),甚至可能顯得有點(diǎn)「繞遠(yuǎn)路」。
如果和熟練工人比,它也沒有便宜到哪里去。就比如一個(gè)老工人看到包裹卡住、料箱歪了、零件掉到地上,伸手就能處理,機(jī)器人還是不一樣,它要先看見異常,再判斷發(fā)生了什么,最后規(guī)劃下一步動(dòng)作,這中間還不包括識(shí)別出錯(cuò)造成的重復(fù)思考,效率大打折扣。
所以,人形機(jī)器人目前真正能解決的,可能不是那些已經(jīng)被機(jī)械臂吃透的標(biāo)準(zhǔn)化崗位,也不是立刻把熟練工人全部替掉,或許它可以成為與人類「輪班制」工作的存在,比如夜班、節(jié)假日工作等,又或者是在不改造一些老舊倉(cāng)庫(kù)的情況下,增加自動(dòng)化的崗位,讓機(jī)器人負(fù)責(zé)。
![]()
(圖源:robotmagazine)
像搬運(yùn)、分揀、質(zhì)檢、簡(jiǎn)單裝配,都屬于這樣的工作。
但更現(xiàn)實(shí)的問(wèn)題是,工廠并不總是追求某一個(gè)動(dòng)作的極限效率。很多時(shí)候,它追求的是一條產(chǎn)線、一個(gè)倉(cāng)庫(kù)、一個(gè)班次能不能穩(wěn)定運(yùn)轉(zhuǎn)。專用機(jī)械臂當(dāng)然快,但它通常需要固定工位,而熟練工人很難在這樣無(wú)聊的崗位上待上好幾年。
人形機(jī)器人的能力,正好在這兩者之間。它不一定在第一天就比機(jī)械臂快,也不一定立刻比人工便宜,但如果它能像人一樣使用現(xiàn)有通道、貨架、料箱和工具,就有機(jī)會(huì)繞開大規(guī)模改造產(chǎn)線的成本。對(duì)很多老工廠和物流倉(cāng)庫(kù)來(lái)說(shuō),他們不需要先把空間改造成「機(jī)器人友好型」,機(jī)器人本來(lái)就有能力先適應(yīng)這個(gè)環(huán)境。
所以,人形機(jī)器人真正要跨過(guò)的門檻,不只是技術(shù)演示,也不是把目標(biāo)定在「比賽中勝過(guò)人類」,要讓企業(yè)信任才是關(guān)鍵。這里的信任,更多的是指這些機(jī)器人加入到生產(chǎn)流程里,會(huì)不會(huì)打亂原有的節(jié)奏,影響產(chǎn)線效率。只有充分展示了長(zhǎng)期的穩(wěn)定性,才能真正走進(jìn)更多工廠,完成更多「無(wú)聊」的工作。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.