![]()
根據(jù) CB Insights 的數(shù)據(jù),2025 年人工智能領(lǐng)域的融資總額占風(fēng)險(xiǎn)投資總額的 48%,創(chuàng)歷史新高。投資者押注人工智能技術(shù)棧的各個(gè)層面,包括基礎(chǔ)模型,應(yīng)用開發(fā),以及 AI 數(shù)據(jù)中心等。
相比之下,機(jī)器人公司的總投資額達(dá)到 407 億美元,占所有風(fēng)險(xiǎn)投資的 9%。因此,一個(gè)價(jià)值數(shù)百億美元的問題隨之而來:AI 驅(qū)動(dòng)的機(jī)器人需要具備什么條件,才能開始產(chǎn)生重大的經(jīng)濟(jì)影響?
![]()
(來源:CB Insights)
近日,俄勒岡州立大學(xué)的機(jī)器人學(xué)教授兼Agility Robotics的聯(lián)合創(chuàng)始人 Jonathan Hurst(喬納森·赫斯特),以及曾擔(dān)任 Google X 旗下Everyday Robots“登月計(jì)劃”的首席執(zhí)行官 Hans Peter Br?ndmo(漢斯·彼得·布朗德莫)對(duì)于“機(jī)器人是否會(huì)有 ChatGPT 時(shí)刻”這一問題進(jìn)行了深入探討,并從五個(gè)方面進(jìn)行了論證。
喬納森是腿足式機(jī)器人領(lǐng)域的國際知名專家,專注于開發(fā)能在真實(shí)世界中行走、奔跑和工作的動(dòng)態(tài)機(jī)器人。其團(tuán)隊(duì)研發(fā)的 Cassie 和 Digit 人形機(jī)器人已進(jìn)入商業(yè)部署階段。
漢斯領(lǐng)導(dǎo)“Everyday Robots”登月計(jì)劃多年,致力于開發(fā)能在辦公室等真實(shí)環(huán)境中自主工作的 AI 機(jī)器人。該項(xiàng)目是谷歌早期將 AI 與機(jī)器人結(jié)合的重要嘗試,部署了上百臺(tái)移動(dòng)操作機(jī)器人,積累了大量真實(shí)世界數(shù)據(jù)和經(jīng)驗(yàn)。
在他們看來,機(jī)器人領(lǐng)域不太可能出現(xiàn)像 ChatGPT 那樣單一、爆炸式的 AI 突破,而是需要通過長期艱苦的工程實(shí)踐、多種 AI 工具的協(xié)同配合,以及大量真實(shí)世界的數(shù)據(jù)和經(jīng)驗(yàn)積累,才能逐步實(shí)現(xiàn)真正有經(jīng)濟(jì)價(jià)值的 AI 機(jī)器人。
網(wǎng)絡(luò)視頻與現(xiàn)實(shí)之間的鴻溝真實(shí)存在
多年來,網(wǎng)絡(luò)上充斥著人形機(jī)器人跳舞或跑酷的炫酷視頻,但機(jī)器人圈的常識(shí)是:“永遠(yuǎn)別信網(wǎng)絡(luò)上的機(jī)器人視頻。” 能在復(fù)雜的真實(shí)環(huán)境中干實(shí)事的機(jī)器人,與精心剪輯的“劇本式”表演之間,仍存在著巨大差距。
以近期廣為宣傳的機(jī)器人表演為例,盡管其底層控制與同步編舞極其出色,但這仍是一場經(jīng)過嚴(yán)格編排的預(yù)設(shè)表演。它所展現(xiàn)出的自主性與智能水平,其實(shí)更接近流水線上的工業(yè)機(jī)器人,離真正走進(jìn)你家客廳還差得很遠(yuǎn)。
答案很簡單:讓 AI 驅(qū)動(dòng)的機(jī)器人在復(fù)雜多變的人類環(huán)境中執(zhí)行通用任務(wù),依然極其困難。表演這類技術(shù)奇跡或許會(huì)讓人產(chǎn)生“未來已來”的錯(cuò)覺,但在這些演示中,AI 僅僅被用于底層的運(yùn)動(dòng)控制(比如防止機(jī)器人摔倒)。想要讓機(jī)器人在真實(shí)且非結(jié)構(gòu)化的人類空間中成為通用幫手,這種底層控制僅僅是龐大解決方案的冰山一角。
數(shù)據(jù)瓶頸仍是未解難題
諸如 ChatGPT、Claude這樣的大型語言模型(LLMs)之所以擁有強(qiáng)大的泛化與多模態(tài)能力,歸功于其使用了海量且由人類生成的互聯(lián)網(wǎng)數(shù)據(jù),這也構(gòu)成了 AI 訓(xùn)練的“黃金標(biāo)準(zhǔn)”。
然而,為 AI 賦予物理軀體并讓其與現(xiàn)實(shí)世界互動(dòng),至今仍是極其困難的未解之題。
通用機(jī)器人的 AI 必須在復(fù)雜多變的環(huán)境中,同時(shí)應(yīng)對(duì)物理、幾何和時(shí)間等多重相互沖突的限制。為了具備通用性,它們必須依賴海量的高質(zhì)量高維數(shù)據(jù)(涵蓋光照、力度、速度、關(guān)節(jié)極限及安全邊界等)進(jìn)行訓(xùn)練,以應(yīng)對(duì)現(xiàn)實(shí)世界中幾乎無限的突發(fā)情況。
目前這類優(yōu)質(zhì)數(shù)據(jù)極其稀缺。業(yè)界只能依靠遠(yuǎn)程操作、人類動(dòng)作捕捉以及模擬器探索等方式來收集數(shù)據(jù),這是一項(xiàng)極其浩大的工程。例如,谷歌 Everyday Robots 僅為了訓(xùn)練一個(gè)垃圾分類模型,就在模擬器中運(yùn)行了高達(dá) 2.4 億次實(shí)例。而機(jī)器人的每一項(xiàng)單點(diǎn)技能,想要達(dá)到(甚至尚未達(dá)到)人類水平,都需要耗費(fèi)同等龐大的數(shù)據(jù)量。
不存在單一的機(jī)器人 AI
依靠單一 AI 模型驅(qū)動(dòng)通用機(jī)器人與我們共存的時(shí)代還極其遙遠(yuǎn)。
機(jī)器人的形態(tài)各異(輪式、雙足、多臂、飛行或水下等),且現(xiàn)實(shí)世界極其復(fù)雜,充滿了不可預(yù)知的人和動(dòng)物。如何訓(xùn)練一個(gè)模型在所有這些場景中安全可靠地運(yùn)行?答案很簡單:做不到(至少在很長一段時(shí)間內(nèi)不行)。
他們認(rèn)為,引領(lǐng)通用機(jī)器人下一次重大突破的制勝架構(gòu)將是面向機(jī)器人的“智能體 AI(Agentic AI)”。這是一種高層協(xié)調(diào)模型,能在有限監(jiān)督下進(jìn)行推理、規(guī)劃、使用工具并從結(jié)果中學(xué)習(xí)。這些運(yùn)行在機(jī)器人上的高級(jí)模型,將作為“中樞”去調(diào)用各種執(zhí)行特定任務(wù)的專用子模型。不久的將來,我們有望看到多個(gè)機(jī)器人通過搭載的智能體 AI 實(shí)現(xiàn)相互協(xié)作。
AI 工具正在解鎖機(jī)器人強(qiáng)大的新能力并催生新市場。令人振奮的是,這些模型正變得廣泛可用,有些甚至已經(jīng)開源。正如互聯(lián)網(wǎng)的普及推動(dòng)了真正的進(jìn)步一樣,隨著人們能更廣泛地訪問這些 AI 工具和技術(shù),機(jī)器人復(fù)雜行為的“平民化”將是不可避免的必然趨勢。
硬件依然是一塊難啃的骨頭
機(jī)器人是高度復(fù)雜的系統(tǒng),其安全性與實(shí)用性依賴于從感知系統(tǒng)、控制中心到每一個(gè)底層執(zhí)行器的精準(zhǔn)協(xié)同。
以執(zhí)行器(電機(jī)和齒輪)為例,過去在工業(yè)機(jī)器人上大規(guī)模使用的硬件,根本無法勝任人類生活環(huán)境的需求。傳統(tǒng)工業(yè)機(jī)器人一旦發(fā)生意外碰撞,沖擊力極大且極具破壞性;而人類的動(dòng)作模式完全不同,我們在與世界互動(dòng)時(shí)具有極高的“柔順性(compliance)”,常常利用與環(huán)境的物理接觸來幫助完成任務(wù)。
以插鑰匙為例:人類通常不需要將鑰匙與鎖孔完美對(duì)齊,而是憑感覺順著邊緣摸索并搖晃著插入。機(jī)器人想要具備類似的能力,就必須采用一種能敏銳感知力反饋、能與環(huán)境進(jìn)行柔順交互的新型執(zhí)行器。盡管這類硬件目前已經(jīng)存在,但針對(duì)在人類周圍工作的機(jī)器人系統(tǒng)而言,它們還遠(yuǎn)未實(shí)現(xiàn)大規(guī)模的量產(chǎn)與普及。
真正的價(jià)值來自于“簡單”的任務(wù)
看起來炫酷的任務(wù)與能創(chuàng)造實(shí)際價(jià)值的任務(wù)截然不同。機(jī)器人技術(shù)完美印證了“莫拉維克悖論(Moravec’s paradox)”:對(duì)人類極其困難的事(如復(fù)雜數(shù)學(xué)計(jì)算)對(duì)機(jī)器很容易,而對(duì)人類輕而易舉的事(如幼兒般的動(dòng)作)對(duì)機(jī)器卻極其困難。
但商業(yè)落地是一塊無情的試金石,客戶只關(guān)心如何解決實(shí)際問題。AI 機(jī)器人必須在效率上超越現(xiàn)有方案,并具備絕對(duì)的可靠性與安全性。
以 Agility Robotics 為例,他們在客戶現(xiàn)場部署人形機(jī)器人 Digit 時(shí),團(tuán)隊(duì)發(fā)現(xiàn)首要障礙是安全。在人類空間中活動(dòng)的機(jī)器人帶來了新的風(fēng)險(xiǎn),最初的部署甚至不得不拉起物理屏障。為此,團(tuán)隊(duì)耗費(fèi)數(shù)年時(shí)間,深度依賴 AI 的人類檢測和行為控制技術(shù),才逐步攻克這一安全挑戰(zhàn)。
![]()
(來源:Agility Robotics)
已經(jīng)被谷歌解散的 Everyday Robots 項(xiàng)目也帶來了一些經(jīng)驗(yàn)教訓(xùn),2019 年在辦公樓內(nèi)部署自主擦桌子和垃圾分類的機(jī)器人時(shí),團(tuán)隊(duì)迅速意識(shí)到真實(shí)世界對(duì)機(jī)器人而言有多么“混亂”和艱難。但正是這些現(xiàn)實(shí)經(jīng)驗(yàn)指導(dǎo)了 AI 系統(tǒng)的架構(gòu),并收集了能與模擬數(shù)據(jù)相結(jié)合的寶貴真實(shí)數(shù)據(jù)。
只有立足于滿足特定客戶需求,并在真實(shí)場景中不斷試錯(cuò),才是打造實(shí)用 AI 工具并最終邁向通用機(jī)器人的唯一路徑。脫離了豐富的現(xiàn)實(shí)世界經(jīng)驗(yàn),根本不存在所謂的頓悟時(shí)刻,沒有一勞永逸的銀彈算法,也沒有任何海量數(shù)據(jù)能憑空捏造出一個(gè)通用機(jī)器人。
毋庸置疑,世界正通過機(jī)器人將 AI 引入現(xiàn)實(shí)的物理世界。喬納森和漢斯認(rèn)為AI 會(huì)推動(dòng)機(jī)器人進(jìn)入“寒武紀(jì)大爆發(fā)”,但這個(gè)過程是漸進(jìn)式、一步一個(gè)腳印的,而非一夜之間的奇跡。真正有價(jià)值的機(jī)器人將先在工廠、倉庫、物流、養(yǎng)老、災(zāi)害救援等場景落地,然后逐步進(jìn)入家庭。
1.https://www.cbinsights.com/research/report/venture-trends-2025/
2.https://engineering.oregonstate.edu/people/jonathan-hurst
3.https://www.linkedin.com/in/hanspeter/
4.https://spectrum.ieee.org/robotics-ai-breakthrough
運(yùn)營/排版:何晨龍
注:封面/首圖由 AI 輔助生成
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.