亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌最強(qiáng)具身大腦發(fā)布!波士頓機(jī)器狗瞬間人模人樣

0
分享至

henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

剛剛,Google DeepMind發(fā)布了最新的機(jī)器人推理模型——

Gemini Robotics-ER 1.6

搭載它的波士頓動力機(jī)器狗Spot,現(xiàn)在能走到工廠里的壓力表前,停下來,讀出數(shù)字。精確到刻度以下。

機(jī)械臂面對操作任務(wù)時,也能判斷什么時候開始,什么時候算完成。

說起來,這已經(jīng)是Gemini Robotics主打空間推理的第三代模型。

九年前谷歌把波士頓動力賣掉,今年CES剛宣布重新合作,ER 1.6就是這次新開始的第一個正式成果。

掌門人哈薩比斯也是第一時間轉(zhuǎn)發(fā)了。



ER 1.6的定位是機(jī)器人的高層大腦,不直接控制機(jī)械動作,而是負(fù)責(zé)理解環(huán)境、制定計劃、調(diào)用工具——

谷歌搜索、VLA、或者開發(fā)者自己定義的任何函數(shù),都可以直接調(diào)用。

相比上一代ER 1.5和Gemini 3.0 Flash,新模型在空間推理、物體計數(shù)、任務(wù)成功檢測上均有顯著提升。

還多了一個全新能力,讀儀表。



Gemini Robotics-ER 1.6

在技術(shù)博客中,Laura Graesser和Peng Xu兩位作者開篇寫道:

機(jī)器人要真正有用,就必須不只是執(zhí)行指令,而是要對物理世界進(jìn)行推理。

ER 1.6的核心升級圍繞一件事,讓機(jī)器人真正「看懂」它所處的環(huán)境。

儀表識別

先看Spot在工廠里做的那件事。

工業(yè)設(shè)施里有大量儀器需要持續(xù)監(jiān)控,溫度計、壓力表、化學(xué)視鏡。以前Spot能走過去拍一張照片,但看不懂上面的數(shù)字。

ER 1.6讓這件事變了。

模型讀儀表分三步。先放大,把小刻度看清楚;再用Pointing定位指針和刻度,結(jié)合代碼計算比例;最后調(diào)用世界知識,把數(shù)字解釋成有意義的讀數(shù)。

這套組合的效果,ER 1.5的儀表識別成功率是23%,加上Agentic Vision之后,ER 1.6達(dá)到了93%



波士頓動力Spot副總裁Marco da Silva表示:

儀表識別等能力和更可靠的任務(wù)推理,將使Spot能夠完全自主地觀察、理解并應(yīng)對現(xiàn)實(shí)世界的挑戰(zhàn)。

Pointing,空間推理的基石

儀表識別能做到這一步,背后是Pointing能力的支撐。

Pointing是ER模型從初代就在練的基本功。簡單說,就是讓模型用「點(diǎn)」來表達(dá)它對空間的理解,哪里有什么,有幾個,怎么移動,抓哪里最合適。

ER 1.5在這一任務(wù)上表現(xiàn)不佳:給它一張工具圖,它數(shù)錯了錘子數(shù)量,漏掉了剪刀,還把圖里根本不存在的手推車給「指」了出來。

ER 1.6則能把這些全部答對,錘子2把、剪刀1把、畫筆1支、鉗子6把,一個不差。更關(guān)鍵的是,對于圖里沒有的東西,它知道不去指。

成功檢測,知道什么時候停

ER 1.6還有一個升級,成功檢測。

知道任務(wù)何時結(jié)束,和知道如何開始,同樣是自主性的核心。

以前的系統(tǒng),做完一個動作就算完了。但真實(shí)場景里有遮擋、有光線變化、有模糊指令,「做完了」這件事本身就需要判斷。

ER 1.6強(qiáng)化了多視角推理,機(jī)器人通常有多個攝像頭,頭頂一個、手腕一個,系統(tǒng)需要把這些視角合并成一個連貫的判斷。

比如開頭的那個demo:把藍(lán)色筆放進(jìn)黑色筆筒,任務(wù)完成了嗎?

ER 1.6能從多個角度的畫面里,給出一個可靠的答案。

順帶一提,這也是谷歌迄今最安全的機(jī)器人模型。

在對抗性空間推理任務(wù)里,ER 1.6對安全指令的遵循程度優(yōu)于所有前代版本。

不處理液體、不搬運(yùn)超過20公斤的物體,這類物理安全約束,ER 1.6能通過Pointing等空間輸出做出更準(zhǔn)確的判斷。



在基于真實(shí)傷害報告的安全隱患識別測試?yán)铮珽R系列比Gemini 3.0 Flash高出6%(文字場景)和10%(視頻場景)。

谷歌與波士頓動力

看到Spot,你可能會好奇,為啥谷歌要用波士頓動力的狗?

事情是這樣的:

谷歌2013年收購波士頓動力,2017年賣給軟銀,理由是看不到商業(yè)閉環(huán)。

2020年現(xiàn)代汽車以8.8億美元接盤。然后2025年11月,波士頓動力的前CTOAaron Saunders離職,加入了谷歌DeepMind。

2026年1月CES,兩家在現(xiàn)代汽車的發(fā)布會上宣布正式合作,目標(biāo)是把Gemini Robotics部署到Atlas人形機(jī)器人上。



賣出去九年,又回來了。

哈薩比斯的說法是,谷歌不做硬件,要成為「機(jī)器人領(lǐng)域的Android」,給所有機(jī)器人廠商提供大腦。

這次ER 1.6發(fā)布,署名了兩位作者,Laura GraesserPeng Xu

Laura Graesser是牛津本科、NYU碩士出身,2018年加入Google,2023年至今在DeepMind做機(jī)器人研究,還合著過一本強(qiáng)化學(xué)習(xí)教科書《Foundations of Deep Reinforcement Learning》。



她早期的研究方向之一,是讓機(jī)器人打乒乓球,系統(tǒng)需要在100毫秒內(nèi)完成感知、計算和擊球動作。



Peng Xu是DeepMind機(jī)器人基礎(chǔ)模型方向的研究員,專注機(jī)器人學(xué)習(xí)與大模型的結(jié)合,不僅參與過上面的機(jī)器人打乒乓球,也是RT-1、RT-2、Cap(Code as policy)、Gemini robotics等一系列著名工作的作者之一。




[1]https://deepmind.google/blog/gemini-robotics-er-1-6/
[2]https://deepmind.google/models/gemini-robotics/gemini-robotics/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特朗普:伊朗將中止核計劃且無法獲得被凍結(jié)資金

特朗普:伊朗將中止核計劃且無法獲得被凍結(jié)資金

財聯(lián)社
2026-04-18 03:36:05
正式敲定!5月1日全面嚴(yán)查,多種灰色操作要坐牢

正式敲定!5月1日全面嚴(yán)查,多種灰色操作要坐牢

笑熬漿糊111
2026-04-18 00:05:21
國行 eSIM 推出重要新功能,終于能在線查詢辦理了!

國行 eSIM 推出重要新功能,終于能在線查詢辦理了!

XCiOS俱樂部
2026-04-18 09:44:15
伊朗陸軍司令:伊斯法罕省行動失敗是敵方停火主因

伊朗陸軍司令:伊斯法罕省行動失敗是敵方停火主因

界面新聞
2026-04-18 09:00:17
饅頭立大功!研究發(fā)現(xiàn):糖尿病患者常吃饅頭,或能降低4類并發(fā)癥

饅頭立大功!研究發(fā)現(xiàn):糖尿病患者常吃饅頭,或能降低4類并發(fā)癥

荊醫(yī)生科普
2026-04-18 13:14:25
谷維素是治療失眠、高血脂的良藥,醫(yī)生提醒:服藥時注意兩個問題

谷維素是治療失眠、高血脂的良藥,醫(yī)生提醒:服藥時注意兩個問題

醫(yī)學(xué)原創(chuàng)故事會
2026-04-17 23:56:05
增重7公斤、油門限了15%!張雪機(jī)車仍在荷蘭站練習(xí)賽上跑了第三名

增重7公斤、油門限了15%!張雪機(jī)車仍在荷蘭站練習(xí)賽上跑了第三名

不似少年游
2026-04-18 11:46:55
專機(jī)剛回國,俄高層在莫斯科開會,普京罕見發(fā)火,特朗普送助攻

專機(jī)剛回國,俄高層在莫斯科開會,普京罕見發(fā)火,特朗普送助攻

小樾說歷史
2026-04-17 12:10:49
快遞員失手摔壞價值2.4萬元藍(lán)寶石!快遞公司:全額賠付,已打款

快遞員失手摔壞價值2.4萬元藍(lán)寶石!快遞公司:全額賠付,已打款

封面新聞
2026-04-18 12:38:06
證監(jiān)會:對余某罰沒10億余元

證監(jiān)會:對余某罰沒10億余元

環(huán)球網(wǎng)資訊
2026-04-18 07:56:17
遺物焚燒收費(fèi)50元一包引爭議,天津一殯儀館回應(yīng):使用環(huán)保焚燒爐,遵循自愿,會開具正式票據(jù)

遺物焚燒收費(fèi)50元一包引爭議,天津一殯儀館回應(yīng):使用環(huán)保焚燒爐,遵循自愿,會開具正式票據(jù)

瀟湘晨報
2026-04-18 12:07:39
東風(fēng)導(dǎo)彈嚴(yán)重泄密案:追查6年無果,卻意外被一賣菜老漢揪出真兇

東風(fēng)導(dǎo)彈嚴(yán)重泄密案:追查6年無果,卻意外被一賣菜老漢揪出真兇

華人星光
2026-04-16 11:44:43
女子模仿李小冉唱《心愿便利貼》,網(wǎng)友:不但模仿的像,長的也像

女子模仿李小冉唱《心愿便利貼》,網(wǎng)友:不但模仿的像,長的也像

韓小娛
2026-04-18 09:08:36
美媒評論東風(fēng)5C:恐怖;如果丟一枚到美國,會導(dǎo)致怎樣的景象

美媒評論東風(fēng)5C:恐怖;如果丟一枚到美國,會導(dǎo)致怎樣的景象

大香蕉最好吃
2026-04-16 21:15:12
新疆多地遭遇強(qiáng)沙塵暴,數(shù)十米高沙墻撲面而來,“天瞬間就黑了”,多趟列車受影響晚點(diǎn)或停運(yùn)

新疆多地遭遇強(qiáng)沙塵暴,數(shù)十米高沙墻撲面而來,“天瞬間就黑了”,多趟列車受影響晚點(diǎn)或停運(yùn)

極目新聞
2026-04-18 11:59:30
舒淇為好劇本“毛遂自薦”:愿為角色素顏出鏡,“我卸了妝,還是挺像50歲的女人的”

舒淇為好劇本“毛遂自薦”:愿為角色素顏出鏡,“我卸了妝,還是挺像50歲的女人的”

揚(yáng)子晚報
2026-04-18 11:30:03
港獨(dú)、罵中國人,如今卻還想來內(nèi)地?fù)平穑@3位香港明星令人作嘔

港獨(dú)、罵中國人,如今卻還想來內(nèi)地?fù)平穑@3位香港明星令人作嘔

橙星文娛
2026-04-17 16:04:52
64歲里弗斯宣布退休!曾獲NBA總冠軍+杯賽冠軍 27年教練生涯結(jié)束

64歲里弗斯宣布退休!曾獲NBA總冠軍+杯賽冠軍 27年教練生涯結(jié)束

羅說NBA
2026-04-18 06:20:19
日子沒法過了!澳洲科學(xué)家發(fā)現(xiàn):經(jīng)常聞女性味道,男性或少活30%

日子沒法過了!澳洲科學(xué)家發(fā)現(xiàn):經(jīng)常聞女性味道,男性或少活30%

思思夜話
2026-04-18 13:42:25
永別了,背公式時代!波蘭物理學(xué)家用一個算子統(tǒng)一數(shù)學(xué)

永別了,背公式時代!波蘭物理學(xué)家用一個算子統(tǒng)一數(shù)學(xué)

新智元
2026-04-16 12:06:41
2026-04-18 16:03:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12488文章數(shù) 176454關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

巴方出動20多架戰(zhàn)機(jī)護(hù)送伊朗談判代表 包括殲-10戰(zhàn)機(jī)

頭條要聞

巴方出動20多架戰(zhàn)機(jī)護(hù)送伊朗談判代表 包括殲-10戰(zhàn)機(jī)

體育要聞

時隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

《穿普拉達(dá)的女王2》疑似辱華?

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

家居
時尚
教育
藝術(shù)
本地

家居要聞

法式線條 時光靜淌

有些衣服,是穿給自己看的

教育要聞

春招進(jìn)行時!今晚19:35,《教育縱深》帶您直面春招變局

藝術(shù)要聞

何多苓油畫新作(2026-2025)

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

無障礙瀏覽 進(jìn)入關(guān)懷版