網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

機(jī)器人的“ChatGPT時(shí)刻”為何遲遲未來？

2026-05-25 18:08:08　來源: DeepTech深科技

北京舉報(bào)

分享至

根據(jù) CB Insights 的數(shù)據(jù)，2025 年人工智能領(lǐng)域的融資總額占風(fēng)險(xiǎn)投資總額的 48%，創(chuàng)歷史新高。投資者押注人工智能技術(shù)棧的各個(gè)層面，包括基礎(chǔ)模型，應(yīng)用開發(fā)，以及 AI 數(shù)據(jù)中心等。

相比之下，機(jī)器人公司的總投資額達(dá)到 407 億美元，占所有風(fēng)險(xiǎn)投資的 9%。因此，一個(gè)價(jià)值數(shù)百億美元的問題隨之而來：AI 驅(qū)動(dòng)的機(jī)器人需要具備什么條件，才能開始產(chǎn)生重大的經(jīng)濟(jì)影響？

（來源：CB Insights）

近日，俄勒岡州立大學(xué)的機(jī)器人學(xué)教授兼Agility Robotics的聯(lián)合創(chuàng)始人 Jonathan Hurst（喬納森·赫斯特），以及曾擔(dān)任 Google X 旗下Everyday Robots“登月計(jì)劃”的首席執(zhí)行官 Hans Peter Br?ndmo（漢斯·彼得·布朗德莫）對(duì)于“機(jī)器人是否會(huì)有 ChatGPT 時(shí)刻”這一問題進(jìn)行了深入探討，并從五個(gè)方面進(jìn)行了論證。

喬納森是腿足式機(jī)器人領(lǐng)域的國際知名專家，專注于開發(fā)能在真實(shí)世界中行走、奔跑和工作的動(dòng)態(tài)機(jī)器人。其團(tuán)隊(duì)研發(fā)的 Cassie 和 Digit 人形機(jī)器人已進(jìn)入商業(yè)部署階段。

漢斯領(lǐng)導(dǎo)“Everyday Robots”登月計(jì)劃多年，致力于開發(fā)能在辦公室等真實(shí)環(huán)境中自主工作的 AI 機(jī)器人。該項(xiàng)目是谷歌早期將 AI 與機(jī)器人結(jié)合的重要嘗試，部署了上百臺(tái)移動(dòng)操作機(jī)器人，積累了大量真實(shí)世界數(shù)據(jù)和經(jīng)驗(yàn)。

在他們看來，機(jī)器人領(lǐng)域不太可能出現(xiàn)像 ChatGPT 那樣單一、爆炸式的 AI 突破，而是需要通過長期艱苦的工程實(shí)踐、多種 AI 工具的協(xié)同配合，以及大量真實(shí)世界的數(shù)據(jù)和經(jīng)驗(yàn)積累，才能逐步實(shí)現(xiàn)真正有經(jīng)濟(jì)價(jià)值的 AI 機(jī)器人。

網(wǎng)絡(luò)視頻與現(xiàn)實(shí)之間的鴻溝真實(shí)存在

多年來，網(wǎng)絡(luò)上充斥著人形機(jī)器人跳舞或跑酷的炫酷視頻，但機(jī)器人圈的常識(shí)是：“永遠(yuǎn)別信網(wǎng)絡(luò)上的機(jī)器人視頻。” 能在復(fù)雜的真實(shí)環(huán)境中干實(shí)事的機(jī)器人，與精心剪輯的“劇本式”表演之間，仍存在著巨大差距。

以近期廣為宣傳的機(jī)器人表演為例，盡管其底層控制與同步編舞極其出色，但這仍是一場經(jīng)過嚴(yán)格編排的預(yù)設(shè)表演。它所展現(xiàn)出的自主性與智能水平，其實(shí)更接近流水線上的工業(yè)機(jī)器人，離真正走進(jìn)你家客廳還差得很遠(yuǎn)。

答案很簡單：讓 AI 驅(qū)動(dòng)的機(jī)器人在復(fù)雜多變的人類環(huán)境中執(zhí)行通用任務(wù)，依然極其困難。表演這類技術(shù)奇跡或許會(huì)讓人產(chǎn)生“未來已來”的錯(cuò)覺，但在這些演示中，AI 僅僅被用于底層的運(yùn)動(dòng)控制（比如防止機(jī)器人摔倒）。想要讓機(jī)器人在真實(shí)且非結(jié)構(gòu)化的人類空間中成為通用幫手，這種底層控制僅僅是龐大解決方案的冰山一角。

數(shù)據(jù)瓶頸仍是未解難題

諸如 ChatGPT、Claude這樣的大型語言模型（LLMs）之所以擁有強(qiáng)大的泛化與多模態(tài)能力，歸功于其使用了海量且由人類生成的互聯(lián)網(wǎng)數(shù)據(jù)，這也構(gòu)成了 AI 訓(xùn)練的“黃金標(biāo)準(zhǔn)”。

然而，為 AI 賦予物理軀體并讓其與現(xiàn)實(shí)世界互動(dòng)，至今仍是極其困難的未解之題。

通用機(jī)器人的 AI 必須在復(fù)雜多變的環(huán)境中，同時(shí)應(yīng)對(duì)物理、幾何和時(shí)間等多重相互沖突的限制。為了具備通用性，它們必須依賴海量的高質(zhì)量高維數(shù)據(jù)（涵蓋光照、力度、速度、關(guān)節(jié)極限及安全邊界等）進(jìn)行訓(xùn)練，以應(yīng)對(duì)現(xiàn)實(shí)世界中幾乎無限的突發(fā)情況。

目前這類優(yōu)質(zhì)數(shù)據(jù)極其稀缺。業(yè)界只能依靠遠(yuǎn)程操作、人類動(dòng)作捕捉以及模擬器探索等方式來收集數(shù)據(jù)，這是一項(xiàng)極其浩大的工程。例如，谷歌 Everyday Robots 僅為了訓(xùn)練一個(gè)垃圾分類模型，就在模擬器中運(yùn)行了高達(dá) 2.4 億次實(shí)例。而機(jī)器人的每一項(xiàng)單點(diǎn)技能，想要達(dá)到（甚至尚未達(dá)到）人類水平，都需要耗費(fèi)同等龐大的數(shù)據(jù)量。

不存在單一的機(jī)器人 AI

依靠單一 AI 模型驅(qū)動(dòng)通用機(jī)器人與我們共存的時(shí)代還極其遙遠(yuǎn)。

機(jī)器人的形態(tài)各異（輪式、雙足、多臂、飛行或水下等），且現(xiàn)實(shí)世界極其復(fù)雜，充滿了不可預(yù)知的人和動(dòng)物。如何訓(xùn)練一個(gè)模型在所有這些場景中安全可靠地運(yùn)行？答案很簡單：做不到（至少在很長一段時(shí)間內(nèi)不行）。

他們認(rèn)為，引領(lǐng)通用機(jī)器人下一次重大突破的制勝架構(gòu)將是面向機(jī)器人的“智能體 AI（Agentic AI）”。這是一種高層協(xié)調(diào)模型，能在有限監(jiān)督下進(jìn)行推理、規(guī)劃、使用工具并從結(jié)果中學(xué)習(xí)。這些運(yùn)行在機(jī)器人上的高級(jí)模型，將作為“中樞”去調(diào)用各種執(zhí)行特定任務(wù)的專用子模型。不久的將來，我們有望看到多個(gè)機(jī)器人通過搭載的智能體 AI 實(shí)現(xiàn)相互協(xié)作。

AI 工具正在解鎖機(jī)器人強(qiáng)大的新能力并催生新市場。令人振奮的是，這些模型正變得廣泛可用，有些甚至已經(jīng)開源。正如互聯(lián)網(wǎng)的普及推動(dòng)了真正的進(jìn)步一樣，隨著人們能更廣泛地訪問這些 AI 工具和技術(shù)，機(jī)器人復(fù)雜行為的“平民化”將是不可避免的必然趨勢。

硬件依然是一塊難啃的骨頭

機(jī)器人是高度復(fù)雜的系統(tǒng)，其安全性與實(shí)用性依賴于從感知系統(tǒng)、控制中心到每一個(gè)底層執(zhí)行器的精準(zhǔn)協(xié)同。

以執(zhí)行器（電機(jī)和齒輪）為例，過去在工業(yè)機(jī)器人上大規(guī)模使用的硬件，根本無法勝任人類生活環(huán)境的需求。傳統(tǒng)工業(yè)機(jī)器人一旦發(fā)生意外碰撞，沖擊力極大且極具破壞性；而人類的動(dòng)作模式完全不同，我們在與世界互動(dòng)時(shí)具有極高的“柔順性（compliance）”，常常利用與環(huán)境的物理接觸來幫助完成任務(wù)。

以插鑰匙為例：人類通常不需要將鑰匙與鎖孔完美對(duì)齊，而是憑感覺順著邊緣摸索并搖晃著插入。機(jī)器人想要具備類似的能力，就必須采用一種能敏銳感知力反饋、能與環(huán)境進(jìn)行柔順交互的新型執(zhí)行器。盡管這類硬件目前已經(jīng)存在，但針對(duì)在人類周圍工作的機(jī)器人系統(tǒng)而言，它們還遠(yuǎn)未實(shí)現(xiàn)大規(guī)模的量產(chǎn)與普及。

真正的價(jià)值來自于“簡單”的任務(wù)

看起來炫酷的任務(wù)與能創(chuàng)造實(shí)際價(jià)值的任務(wù)截然不同。機(jī)器人技術(shù)完美印證了“莫拉維克悖論（Moravec’s paradox）”：對(duì)人類極其困難的事（如復(fù)雜數(shù)學(xué)計(jì)算）對(duì)機(jī)器很容易，而對(duì)人類輕而易舉的事（如幼兒般的動(dòng)作）對(duì)機(jī)器卻極其困難。

但商業(yè)落地是一塊無情的試金石，客戶只關(guān)心如何解決實(shí)際問題。AI 機(jī)器人必須在效率上超越現(xiàn)有方案，并具備絕對(duì)的可靠性與安全性。

以 Agility Robotics 為例，他們在客戶現(xiàn)場部署人形機(jī)器人 Digit 時(shí)，團(tuán)隊(duì)發(fā)現(xiàn)首要障礙是安全。在人類空間中活動(dòng)的機(jī)器人帶來了新的風(fēng)險(xiǎn)，最初的部署甚至不得不拉起物理屏障。為此，團(tuán)隊(duì)耗費(fèi)數(shù)年時(shí)間，深度依賴 AI 的人類檢測和行為控制技術(shù)，才逐步攻克這一安全挑戰(zhàn)。

（來源：Agility Robotics）

已經(jīng)被谷歌解散的 Everyday Robots 項(xiàng)目也帶來了一些經(jīng)驗(yàn)教訓(xùn)，2019 年在辦公樓內(nèi)部署自主擦桌子和垃圾分類的機(jī)器人時(shí)，團(tuán)隊(duì)迅速意識(shí)到真實(shí)世界對(duì)機(jī)器人而言有多么“混亂”和艱難。但正是這些現(xiàn)實(shí)經(jīng)驗(yàn)指導(dǎo)了 AI 系統(tǒng)的架構(gòu)，并收集了能與模擬數(shù)據(jù)相結(jié)合的寶貴真實(shí)數(shù)據(jù)。

只有立足于滿足特定客戶需求，并在真實(shí)場景中不斷試錯(cuò)，才是打造實(shí)用 AI 工具并最終邁向通用機(jī)器人的唯一路徑。脫離了豐富的現(xiàn)實(shí)世界經(jīng)驗(yàn)，根本不存在所謂的頓悟時(shí)刻，沒有一勞永逸的銀彈算法，也沒有任何海量數(shù)據(jù)能憑空捏造出一個(gè)通用機(jī)器人。

毋庸置疑，世界正通過機(jī)器人將 AI 引入現(xiàn)實(shí)的物理世界。喬納森和漢斯認(rèn)為AI 會(huì)推動(dòng)機(jī)器人進(jìn)入“寒武紀(jì)大爆發(fā)”，但這個(gè)過程是漸進(jìn)式、一步一個(gè)腳印的，而非一夜之間的奇跡。真正有價(jià)值的機(jī)器人將先在工廠、倉庫、物流、養(yǎng)老、災(zāi)害救援等場景落地，然后逐步進(jìn)入家庭。

1.https://www.cbinsights.com/research/report/venture-trends-2025/

2.https://engineering.oregonstate.edu/people/jonathan-hurst

3.https://www.linkedin.com/in/hanspeter/

4.https://spectrum.ieee.org/robotics-ai-breakthrough

運(yùn)營/排版：何晨龍

注：封面/首圖由 AI 輔助生成

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.