[首發于智駕最前沿微信公眾號]占據感知網絡(Occupancy Network,簡稱OCC)作為自動駕駛現階段比較火熱的一項技術,一直被很多人討論。由于自動駕駛應用場景的特殊性,感知的物體大多是動態的,因此,對于占據感知網絡的討論,一定要基于感知動態物體的前提下。
在討論這個話題時,我們需要將視野從單純的三維重建擴展到四維時空感知。動態物體的難點在于,它們在空間中的位置隨時間變化,且形狀、速度各異。OCC并不是通過簡單的逐幀對比來處理這些變化的,而是通過一套嚴密的時序特征融合與運動矢量預測機制,實現了對物理世界動態屬性的深度建模。
時序特征是如何在格點中對齊的?
處理動態物體的第一步是需要建立一個統一的時間參考系。自動駕駛車輛在行駛過程中,自身的坐標系一直在變動,這意味著不同時間點觀測到的同一個格點,其在圖像空間或特征空間中的位置是不一致的。為了讓占據感知網絡能理解物體的運動,必須先進行自車運動補償。
圖片源自:網絡
系統會利用自車的慣性導航數據和里程計信息,將歷史時刻的特征圖投影到當前幀的坐標系下。這個過程會涉及特征對齊技術,即將過去多幀的特征在三維空間中進行平移和旋轉轉換,使得靜止的背景在時序維度上能夠重合。當背景對齊之后,那些在空間中發生位移的特征點就會顯著地浮現出來,網絡由此獲得了感知變化的基礎。
在特征融合階段,OCC架構會采用三維卷積或時序注意力機制。網絡不僅提取當前的幾何特征,還會回顧過去幾百毫秒甚至更長時間的特征序列。這種多幀融合的方式,讓網絡能夠跨越單幀圖像的局限,捕捉到物體運動的連續性。即便在某一幀中物體因為光照或遮擋而變得模糊,歷史幀積累的特征也能提供有效的補充,從而保證了感知結果的平滑和穩定。
占據流如何量化物體的運動狀態?
僅僅知道某個格點正在移動是不夠的,系統需要精確地知道它的速度方向和大小。在OCC技術框架內,可通過輸出占據流來實現。每個被標記為占據的小方塊,不僅存儲了該位置是否有障礙物的概率,還攜帶了一個三維的運動矢量。
圖片源自:網絡
這個運動矢量的生成依賴于專門的預測分支。在網絡的后端,算法會計算當前格點與歷史對應格點之間的關聯性,推導出該格點在三維空間中的瞬時位移。這意味著,對于路上的每一輛車、每一個行人,OCC輸出的不是一個整體的運動數值,而是構成這些物體的成千上萬個微小格點各自的運動矢量。這種格點級的速度表達,能夠描述如車輛轉彎時不同部位的速度差異,或者行人在擺臂時的局部動態等非常細膩的物體動態行為。
這種處理方式避開了傳統感知中復雜的目標跟蹤環節。在傳統方案里,如果跟蹤丟了,速度也就沒了;而在OCC中,只要空間依然被占據,速度矢量就能通過時序特征持續輸出。這種從底層像素特征直接映射到物理運動屬性的邏輯,使得系統對異形物體和復雜運動的適應性大幅提升,因為網絡不再試圖理解誰在動,而是在計算這里的空間如何變動。
遮擋下的動態預測靠什么維持?
動態物體感知中最具挑戰性的場景是物體從視線中消失或被部分遮擋。OCC處理這類問題的核心在于其時空一致性的建模能力。當一個動態物體進入遮擋區域時,當前的傳感器數據無法提供其位置信息,但網絡內部的時序編碼器會保留該物體的狀態特征。
圖片源自:網絡
通過引入時空注意力機制,網絡可以學習到物理運動的慣性規律。在處理時序特征序列時,注意力機制會分配權重給那些具有強運動趨勢的特征點。即使當前幀的輸入是空的,網絡依然可以根據前幾幀的占據狀態和速度矢量,在潛在的占據位置生成預測。這就像是給感知系統裝上了一個預判大腦,讓它能夠根據物體消失前的軌跡,推測其在接下來一兩秒內的空間分布。
這種預測并非盲目猜測,而是基于概率分布的推理。系統會輸出一個隨時間推移而逐漸擴散的占據概率圖,表示物體可能出現的區域。這種處理方式能夠極大地優化自動駕駛的安全性,因為規控系統可以提前避開這些高概率被占據的空間,而不需要等到物體再次完全暴露在視野中才做出反應。這種對時空連續性的深度挖掘,正是OCC相比傳統檢測方案更具安全潛力的關鍵所在。
這種全場景動態感知帶來了哪些改變?
這種基于格點的動態處理方案,徹底改變了自動駕駛處理復雜路況的效率。在傳統的任務流中,感知、跟蹤、預測是三個獨立的環節,每個環節的誤差都會累積。而OCC將這些功能整合在一個端到端的框架內,直接輸出帶有運動屬性的三維空間地圖。這種高度集成的方式,不僅減少了計算延遲,還消除了由于目標匹配錯誤導致的感知中斷。
圖片源自:網絡
對于下游的決策規劃來說,這種感知結果非常友好。規控算法不再需要處理成百上千個目標的列表,而是面對一張實時更新的、帶有速度信息的動態三維柵格圖。這張圖清晰地標注了哪些空間是絕對安全的,哪些空間在未來一段時間內會被動態物體占據。
這種感知邏輯的進步,使得自動駕駛系統在應對突發狀況時更加從容。無論是路邊突然竄出的外賣車,還是前方散落并滑動的貨物,OCC都能以統一的邏輯進行捕捉和處理。這種對物理世界最原始、最本質的建模方式,正在成為實現高階自動駕駛能力的重要技術支撐,讓車輛能夠在瞬息萬變的城市交通中,獲得更加精準和穩定的空間掌控感。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.