亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網易首頁 > 網易號 > 正文 申請入駐

一文速通「機器人3D場景表示」發(fā)展史

0
分享至



隨著機器人領域的飛速發(fā)展,我們有一個問題不斷需要思考,究竟如何讓機器人像人類一樣理解世界,學習周圍環(huán)境的表示。對于機器人來說,究竟是需要精確的坐標,還是語義的物體概念,還是隱式的空間認識推理模型?

在本文中,上海交通大學、波恩大學等院校的研究團隊全面總結了當前機器人技術中常用的場景表示方法。這些方法包括傳統(tǒng)的點云、體素柵格、符號距離函數以及場景圖等傳統(tǒng)幾何表示方式,同時也涵蓋了最新的神經網絡表示技術,如神經輻射場、3D 高斯散布模型以及新興的 3D 基礎模型。

雖然目前的 SLAM 與定位系統(tǒng)主要依賴點云、體素這類稀疏表示方式,但密集型場景表示方法在導航、避障等后續(xù)任務中無疑會發(fā)揮關鍵作用。此外,神經輻射場、3D 高斯散布模型以及基礎模型這類神經網絡表示技術,非常適合整合高層次的語義信息與基于語言的先驗知識,從而實現更全面的 3D 場景理解與智能體行為控制。本文的目標是為新手和資深研究人員提供一份有價值的參考資料,幫助他們探索 3D 場景表示技術的未來發(fā)展方向及其在機器人技術中的應用。



  • 標題:What Is The Best 3D Scene Representation for Robotics? From Geometric to Foundation Models
  • 作者:Tianchen Deng, Yue Pan, Shenghai Yuan, Dong Li, Chen Wang, Mingrui Li, Long Chen, Lihua Xie, Danwei Wang, Jingchuan Wang, Javier Civera, Hesheng Wang, Weidong Chen
  • 機構:Shanghai Jiao Tong University、University of Bonn、Chinese Academy of Sciences、University of Zaragoza、Nanyang Technological University
  • 原文鏈接:https://arxiv.org/abs/2512.03422
  • 代碼鏈接:https://github.com/dtc111111/awesomerepresentation-for-robotics

一、機器人 3D 場景發(fā)展史



機器人 3D 場景表示發(fā)展史和代表性工作

幾何場景表示:

  • Point Cloud 點云場景表示:通過離散的三維點來表示場景,通過雷達或者相機傳感器獲得。
  • Voxel 體素場景表示:通過將三維空間離散化,轉變成規(guī)則的立方體柵格,通過在柵格內存儲不同的信息,比如密度,占用率等實現場景建模
  • Mesh 網格場景表示:通過三角化面片構建連續(xù)的場景幾何場景表示,精細度更高。
  • SDF 符號距離場:通過表示空間點到物體表面的距離,實現連續(xù)的場景幾何表示。

近年來,深度學習、計算機圖形學與機器人技術的融合推動了顯著進展。在眾多推動這一進展的技術中,神經輻射場(NeRF)、三維高斯濺射和基礎模型(Foundation Model,FM)作為極具前景的創(chuàng)新脫穎而出,從而實現真正的通用具身智能。



機器人 3D 三維表征研究熱度變化

3D 神經場景表示

  • NeRF 神經輻射場:通過連續(xù)的場景表示讓機器人理解世界,基于神經網絡 MLP 構建,可以進行地圖預測,但是速度較慢。
  • 3DGS 高斯?jié)姙R:將場景表示為 3D 高斯橢球,從而實現高速的渲染,適合實時建圖。
  • Foundation Model 基礎模型: 通過現有的 transformer 等編碼器,將三維世界壓縮成類似于語言的 token,將三維世界的理解變成可推理的人類語言。從而實現空間感知推理,成為「3D 版本的 GPT」。



三維場景表征在機器人不同模塊的應用:感知,建圖,定位,操作,導航

在建圖和定位模塊(第 V 節(jié))中,現有方法在 SLAM 和定位領域取得了令人矚目的成果。神經場景表示能夠實現對環(huán)境的更精確、更密集的建模,這對避障特別有益。這一能力對于機器人的導航和操作至關重要。

該模塊分為三部分:(i)場景重建:場景表示的地圖重建能力包括幾何精度和渲染質量,以及在靜態(tài)場景、大規(guī)模戶外場景和動態(tài)場景中的重建能力。(iii)SLAM:SLAM 部分主要包括不同場景表示方法在 SLAM 過程中的地圖精度、位姿精度和實時性能。(iv)全局定位:全局定位主要涉及使用現有地圖進行定位時的精度和實時性能。

在操作模塊(第 VI-A 節(jié))中,本文主要比較了基于不同場景表示方法的抓取框架。傳統(tǒng)方法在抓取方面具有更高的實時性能和計算效率,但在泛化能力和處理復雜目標操作任務方面存在局限。相比之下,基于神經網絡的場景表示在生成新視角和跨多個場景泛化方面具有一定能力,使其更能適應復雜任務。基于基礎模型的方法能夠實現零樣本抓取任務,具備強大的泛化能力。此外,語言信息的集成使這些模型能夠支持交互式抓取,并增強了它們理解和規(guī)劃高級認知任務的能力。

在導航模塊(第 VI 節(jié))中,與傳統(tǒng)的場景表示方法相比,神經場景表示能夠提供高度準確的環(huán)境重建。此外,它們還有助于更好地融合語義和語言信息,從而能夠執(zhí)行更復雜的導航任務。我們將導航模塊分為兩個部分:(i)規(guī)劃:從當前位置到目標目的地生成最優(yōu)或可行路徑,同時避開障礙物。(ii)探索:主動導航并繪制先前未知區(qū)域的地圖。



不同 3D 場景表示的特點對比,包含連續(xù)性,存儲效率,真實性,靈活性,幾何表示精度。

二、現有方法的問題與未來發(fā)展方向

1、端到端通用網絡還是模塊化?

目前,大多數機器人系統(tǒng)都建立在模塊化智能(Modular Intelligence)的基礎上。為了完成復雜任務,系統(tǒng)會將導航或操作等功能分解為獨立的模塊,例如感知、建圖、定位、操作和導航。這種設計雖然有助于實現各種機器人功能,但其模塊化特性在本質上可能會限制機器人智能的進一步發(fā)展。

盡管模塊化解決方案引入了有用的歸納偏置(Inductive Biases)并支持有效的特定任務性能,但它們通常面臨泛化能力有限和遷移性差的問題。在實際應用中,這些系統(tǒng)往往需要在不同場景下進行重復的傳感器校準、特定環(huán)境建模以及參數重新調優(yōu)。此外,在高度復雜的環(huán)境中,構建精確的模型仍然極具挑戰(zhàn)性。基礎模型的最新進展提供了一條替代路徑,即實現端到端智能。

2、數據瓶頸

盡管神經場景表示(Neural Scene Representations)在準確性和泛化性方面具有顯著優(yōu)勢,但一個主要的挑戰(zhàn)在于,與訓練大語言模型(LLM)和視覺語言模型(VLM)所使用的互聯(lián)網規(guī)模的文本與圖像語料庫相比,機器人特有的數據非常匱乏。這種局限性顯著阻礙了機器人領域神經場景表示和基礎模型的發(fā)展。

為了解決這一問題,研究重點已轉向增強神經場景表示在有限數據情況下的泛化能力。另一個方向則是利用世界模型(World Models)來預測以動作為條件的(Conditioned on actions)狀態(tài)轉移,從而生成額外的訓練數據集。

3、實時性瓶頸

與傳統(tǒng)的場景表示相比,在機器人領域部署神經場景表示的另一個關鍵瓶頸在于其推理時間(Inference Time),這仍是制約可靠實時應用的一個限制因素。目前神經網絡的部署策略通常分為兩大類:

第一類是基于云端的部署。通常托管在遠程數據中心,并通過 API 進行訪問。在這種模式下,響應延遲和服務時間很大程度上取決于底層的網絡路由、帶寬以及數據中心的計算能力。因此,在將此類模型集成到自主機器人技術棧之前,必須仔細權衡網絡的可靠性和延遲問題。

第二類是邊緣計算平臺上的車載 / 機載部署(Onboard Deployment)。此類方案通常采用模型蒸餾(Model Distillation)和量化(Quantization)等技術來減小模型體積,從而實現實時推理。然而,這往往以犧牲泛化能力為代價。一個極具前景的未來方向在于硬件 - 算法協(xié)同設計(Hardware–Algorithm Co-design),旨在同時提高推理效率并保持模型的泛化性能,以滿足機器人實時部署的需求。

本文探討了機器人不同模塊最適合的三維場景表示方法,研究了相關方法、并討論了挑戰(zhàn)和未來方向。本文的主要貢獻如下:

  • 全面、最新的綜述與基準測試:本文對機器人領域的不同場景表示方法進行了廣泛且最新的綜述,涵蓋了經典方法和前沿方法。對于每個模塊,團隊都提供了詳細介紹,并突出了該模塊中不同場景表示的優(yōu)勢。
  • 三維場景表示的未來方向:在機器人領域的每個模塊中,團隊指出了當前研究的技術局限性,并提出了幾個有前景的未來研究方向,旨在激勵這一快速發(fā)展領域的進一步進步。
  • 開源項目:團隊在 GitHub 上發(fā)布了一個開源項目,整理了機器人領域不同場景表示的相關文章,并將繼續(xù)向該項目添加新的研究成果和技術,網址為https://github.com/dtc111111/awesome-representation-for-robotics。團隊希望更多研究人員能夠利用它獲取最新的研究信息。

對更多實驗結果和文章細節(jié)感興趣的讀者,可以閱讀一下論文原文~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
向油輪開火!伊朗一聲令下,特朗普又輸了

向油輪開火!伊朗一聲令下,特朗普又輸了

小馬姨
2026-04-20 10:34:22
60歲武大中南醫(yī)院王行環(huán)被抓!女醫(yī)生曝其惡心勾當,簡直太憤怒

60歲武大中南醫(yī)院王行環(huán)被抓!女醫(yī)生曝其惡心勾當,簡直太憤怒

椰青美食分享
2026-04-20 11:23:47
聰明又招財!2026年這3個生肖人緣好到爆,財富接不完

聰明又招財!2026年這3個生肖人緣好到爆,財富接不完

毅談生肖
2026-04-20 10:49:51
恒大集團許家印坑的最慘的9位大佬

恒大集團許家印坑的最慘的9位大佬

地產微資訊
2026-03-29 19:08:15
零跑D19銷售反饋:客戶多對比銀河M9與樂道L90

零跑D19銷售反饋:客戶多對比銀河M9與樂道L90

CNMO科技
2026-04-20 09:36:24
梁靖崑:可能因傷退出世乒賽!那就帶著明星老婆和兒子現場觀賽

梁靖崑:可能因傷退出世乒賽!那就帶著明星老婆和兒子現場觀賽

丹妮觀
2026-04-20 11:08:06
新西蘭軍機多次抵近中國周邊空域,嚴重干擾民航!中方:已作出堅決有力應對,并向新方提出嚴正交涉

新西蘭軍機多次抵近中國周邊空域,嚴重干擾民航!中方:已作出堅決有力應對,并向新方提出嚴正交涉

每日經濟新聞
2026-04-17 18:37:58
采訪了100個娶了小三的男人,他們幾乎都說了同一句話,讓人恍然

采訪了100個娶了小三的男人,他們幾乎都說了同一句話,讓人恍然

千秋文化
2026-04-15 20:18:32
蕭旭岑官宣:國民黨鄭麗文路線正式定調!

蕭旭岑官宣:國民黨鄭麗文路線正式定調!

奇思妙想生活家
2026-04-19 12:09:43
阿聯(lián)酋被曝向美國尋求戰(zhàn)時金融支持 否則恐以其他貨幣結算石油

阿聯(lián)酋被曝向美國尋求戰(zhàn)時金融支持 否則恐以其他貨幣結算石油

財聯(lián)社
2026-04-20 10:04:07
停火期限即將到來,美伊都做兩手準備,霍爾木茲海峽“開了又關”

停火期限即將到來,美伊都做兩手準備,霍爾木茲海峽“開了又關”

環(huán)球網資訊
2026-04-20 06:40:55
中紀委放了話:寧可掉層皮,也要抓出群眾滿意成效!

中紀委放了話:寧可掉層皮,也要抓出群眾滿意成效!

林子說事
2026-04-19 02:00:33
20分鐘全華班!剛丟1球!中超問誰能做到!申花司機也敢玩大的

20分鐘全華班!剛丟1球!中超問誰能做到!申花司機也敢玩大的

80后體育大蜀黍
2026-04-19 16:31:53
為什么說印度的海岸線,遠看是老天爺賞飯,近看是逗你玩兒?

為什么說印度的海岸線,遠看是老天爺賞飯,近看是逗你玩兒?

半解智士
2026-04-16 17:10:39
張康陽現狀證明,不怕富二代躺平就怕有野心,僅5年千億身價歸零

張康陽現狀證明,不怕富二代躺平就怕有野心,僅5年千億身價歸零

青杉依舊啊啊
2026-03-19 22:10:26
美國要被笑死,停火后才發(fā)現,伊朗空軍大部分飛機都好好的

美國要被笑死,停火后才發(fā)現,伊朗空軍大部分飛機都好好的

古史青云啊
2026-04-20 09:52:07
默茨和盧拉盛贊歐盟與南共市自貿協(xié)定

默茨和盧拉盛贊歐盟與南共市自貿協(xié)定

參考消息
2026-04-20 12:06:46
37歲福原愛官宣生下三胎,現任丈夫居然是此前出軌門男主,母子平安

37歲福原愛官宣生下三胎,現任丈夫居然是此前出軌門男主,母子平安

好乒乓
2026-04-20 11:14:45
“抱歉,我們只看第一學歷”,985碩士面試被拒,考研還有必要嗎

“抱歉,我們只看第一學歷”,985碩士面試被拒,考研還有必要嗎

蝴蝶花雨話教育
2026-04-19 00:25:03
亞歷山大17罰砍25分!雷霆窒息防守打崩太陽,布克風雪哥33投40分

亞歷山大17罰砍25分!雷霆窒息防守打崩太陽,布克風雪哥33投40分

你的籃球頻道
2026-04-20 06:09:13
2026-04-20 12:40:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12805文章數 142632關注度
往期回顧 全部

科技要聞

藍色起源一級火箭完美回收 客戶衛(wèi)星未入軌

頭條要聞

媒體:伊朗剛說不談 美國立即開打

頭條要聞

媒體:伊朗剛說不談 美國立即開打

體育要聞

七大獎項候選官宣!文班或全票DPOY

娛樂要聞

鹿晗生日上熱搜,被關曉彤撕下體面

財經要聞

月之暗面IPO迷局

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

旅游
本地
時尚
數碼
公開課

旅游要聞

800年紫藤花開如瀑 最美寧陽四月天

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

今年最流行的衣服竟然是它?高級又氣質!

數碼要聞

華為全新鴻蒙電腦搭載云晰柔光屏,硬件級低藍光,今日下午發(fā)布

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版