網易首頁 > 網易號 > 正文 申請入駐

AI算法加碼純視覺方案,自動駕駛會否迎來新轉折?

0
分享至

本文來源:智車科技

/ 導讀 /

作為全球資本市場的風口,自動駕駛從來都不曾離開舞臺的中央

自動駕駛主要包括感知、決策和執行三個環節。其中,周邊態勢的感知,作為自動駕駛控制系統的輸入,重要性不言而喻。更早以及更加精準的信息輸入,將幫助自動駕駛控制器盡快做出一個準確的決策,調整車輛姿態來實現自動駕駛功能。

但在汽車自動駕駛領域,周邊態勢感知的技術路線選擇之爭從來就沒有停歇過。以特斯拉為最知名的代表是純視覺方案的堅定擁護者,至于國內很多企業則是視覺加雷達融合方案的擁躉。在線控底盤方案已經非常成熟且自動駕駛軟件平臺日趨完善的大背景下,對于周邊態勢的感知正在成為自動駕駛領域中的一個受到越來越多關注的分支。

得到全球公認的NuScenes數據集

NuScenes數據集是由現代汽車集團和Aptiv資成立的一家無人駕駛公司Motional開發,該數據集在2019年3月開源,填補了彼時自動駕駛汽車行業尚無大規模多模態數據集的空白。目前,NuScenes是被全球各大自動駕駛領域相關公司引用最多的數據集,其權威性得到各方的認同。

基于NuScenes數據集的NuScenes挑戰賽,也已經成為檢驗感知算法在自動駕駛相關任務性能的試金石。我們所熟知的全球范圍內多家自動駕駛領域的知名企業及知名高校在NuScenes挑戰賽中進行了相關測試結果的提交,諸如卡內基梅隆大學、加利福尼亞大學伯克利分校、MIT等。作為自動駕駛AI感知算法的一個重要的比拼舞臺,大家通過NuScenes挑戰賽這樣一個“試金石”平臺,同場競技,來了解自己所處的位置以及競爭對手的狀態,進而達到共同促進自動駕駛感知技術發展的目標。

3D目標檢測任務是自動駕駛感知性能的關鍵指標

在NuScenes數據集中,相關評測任務包括了3D 目標檢測、3D 目標跟蹤、預測軌跡 、激光雷達分割、全景分割和跟蹤。其中, 3D目標檢測任務是最為重要的一個評測指標。

和普通的對于周邊物體感知不同,自動駕駛所面臨的是一個包含時間軸在內的4維坐標空間。所以自動駕駛感知系統不僅需要判斷周邊物體的遠近和大小,同時也還需要判斷這些物體是靜止的還是運動的,以及他們的運動方向和速度。這對于自動駕駛軟件算法進行下一步路徑的預判至關重要。

NuScenes數據集的3D目標檢測任務,覆蓋了包括汽車、卡車、公交車、行人等10種我們在日常出行中會遇到的絕大部分檢測對象。通過為它們標出3D目標框,并估計出相應類別的屬性信息和當前的速度信息等,NuScenes提出了一個綜合指標NDS (NuScenes Detection Score, NDS)。這個指標由平均精度(mAP)、平均平移誤差(ATE)、平均尺度誤差(ASE)、平均方向誤差(AOE)、平均速度誤差(AVE)和平均屬性誤差(AAE)綜合計算得到,成為衡量自動駕駛對于周邊物體識別的一個比較客觀公正的評價指標。

純視覺方案的優勢在哪里?

在自動駕駛系統中,感知系統的硬件是由一系列的傳感器組成,主要包括攝像頭、超聲波雷達、毫米波雷達和激光雷達等。它們作為自動駕駛系統的“眼睛”,構成了整個自動駕駛系統的輸入,其中最核心的就是攝像頭和激光雷達

當前,在自動駕駛領域,感知系統的技術路線選擇的爭議從來沒有平息過。作為全球知名的車企,特斯拉一直是純視覺方案堅定的支持者。而國內不少整車企業,目前都采用了采用雷達加攝像頭的融合方案來實現3D目標任務檢測。

兩種技術路線各有優劣

視覺+雷達方案的最大優勢來源于激光雷達。激光雷達采集的點云信息與生俱來就存儲了三維空間信息,因此基于激光點云信息的3D目標檢測任務實現出來相對就簡單了許多。但是這套方案也有自己比較明顯的劣勢:

1.較高的成本:激光雷達較高的成本,始終是阻礙其在車型上商業化部署的最大制約因素。最早的Velodyne的激光雷達高達8萬美元一個,讓其始終停留在測試車上。而如今雖然固態激光雷達成本大幅下降,但依然是整車不可忽視的一個零部件成本支出。

2.數據融合難度不小:攝像頭和雷達的數據結構并不相同,將兩者采集的數據進行融合,給到自動駕駛控制器最為準確的黃靜信號輸入,對數據融合算法也是不小的考驗。

至于純視覺解決方案,其最大的優勢在于較低的成本。特斯拉所使用的單目攝像頭單件成本不過25美元,全車搭載8個的話,費用也只有200美元。對于需要大規模商業化部署的整車,成本從來就不是一個可以忽略的難題。過高的成本,必然會阻礙消費者的購買意愿,讓相關的技術方案只能停留在實驗室階段。另外,純視覺解決方案依托技術可帶來比較客觀的迭代提升及較大的上升空間。隨著AI技術的提升,純視覺3D目標檢測算法能夠得以優化提升。

但視覺方案也有自己的不足,這個來源于攝像頭自身的缺陷:無論是對于靜態的物體還是對于識別紋理或者色彩信息較為豐富的物體時,都會顯得力不從心。但攝像頭的天生缺陷也可以用來彌補。通過更為強大的AI算法以及更多的實際道路場景數據的積累,能夠幫助純視覺方案在辨識周邊道路情況時能夠更加游刃有余。所以當AI算法達到一定的成熟度可以滿足自動駕駛對于周邊環境態勢感知的要求之后,純視覺方案就可以被部署在高等級自動駕駛系統上,來為整車企業提供一個可以同時兼顧商業化部署和周邊態勢感知要求的技術方案。

浪潮信息AI算法實現監測精度大幅度提升

今年10月,在最新一期NuScenes所公布的競賽測評榜單中,浪潮信息憑借DABNeT4D登頂自動駕駛數據集NuScenes 純視覺3D目標檢測任務榜單,引發了極大的關注。

在這次3D目標檢測任務中,浪潮信息的DABNet4D算法的NDS檢測精度達到了0.624,相比于年初的NDS精度是0.474的BEV3D算法提升了15%。在同一時期,激光雷達的NDS精度從年初的0.685提升到0.728,提升約4個點。通過簡單的數據比對就可以發現,浪潮信息AI的純視覺檢測精度在數值上正在大幅迫近激光雷達,而這背后都是AI算法的功勞。

浪潮信息此次所提交的算法DABNet4D是Depth-awared BEVNet 4D的縮寫,即深度感知的四維鳥瞰圖(bird’s eye view, BEV)神經網絡,其核心本質就是鳥瞰圖。

傳統的純視覺方案,是依靠布置在車身的攝像頭來采集信息。然后通過對于每個攝像頭數據的融合,來實現對車輛周邊態勢的感知。但這種策略最大的一個弊端在于一旦遇到比較體積較大的卡車時,會導致每個攝像頭只能捕捉到卡車的一部分的情況,以致出現錯判和漏檢的情況發生。這種情況下,浪潮信息AI團隊引入了鳥瞰圖,即通過上帝視角,來把不同水平視角的圖像融合成一個統一的以自動駕駛車輛為中心的俯視視角的特征圖。這樣就可以最清晰和完整地為自動駕駛控制器提供車輛周邊的情況。在遇到體積較大的物體時,3D目標檢測以及其他的檢測、分類、分割等視覺感知任務就能夠非常輕松地完成。

但要獲得上帝視角的鳥瞰圖的構建并非一蹴而就。浪潮信息AI團隊早在今年年初就構建了一個基于Transformer架構的多視角特征融合模型CBTR、MASTER(Multi-camerA Spatial and Temporal feature ExtractoR,多相機時空特征提取器)算法、并在MASTER算法的基礎上進一步引入了深度估計網絡等等,最終實現了更為高效穩定的BEV(鳥瞰圖)輸出。此外,通過圖像數據增強、BEV特征增強和樣本貼圖增強等多尺度的數據增強技術等,提升模型的檢測效果,進而持續助力DABNet4D算法在NuScenes數據集中的優異表現。

總結

浪潮此次打榜成功的DABNet4D算法,讓我們看到了感知層的另一個解決思路方案:通過對于態勢感知算法的持續優化,來不斷提升純視覺方案的辨識精度,為純視覺方案在自動駕駛領域的部署蹚出了一條新的道路。

在滾滾向前的自動駕駛浪潮中,作為全球領先級AI算力基礎設施提供商,浪潮不僅在于利用自己過往在服務器這樣的硬件領域的優勢,持續強化自己硬件平臺協同優勢,同時也正在大力提升自己在AI算法方面的競爭力,通過算法優化來提升相關的效率,雙向賦能,提升橫跨軟硬件的集群優勢。從NuScenes榜單技術的快速迭代來看,我們有理由相信,隨著算力、算法的持續型突破,自動駕駛產業化落地進程也將多一層“騰飛動力之源”。而這些,也都是車企所關注的方向,也是未來車企發展智能駕駛能力的關鍵。

- End -

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國最安全的省份:兩千年來沒打過大仗,抗日戰爭時期都非常太平

中國最安全的省份:兩千年來沒打過大仗,抗日戰爭時期都非常太平

抽象派大師
2026-05-05 15:05:15
約合人民幣22.1萬元起,2026款豐田埃爾法入門車型發布,織物座椅

約合人民幣22.1萬元起,2026款豐田埃爾法入門車型發布,織物座椅

沙雕小琳琳
2026-05-05 21:01:14
新加坡航空可以高速上網了!飛機將接入馬斯克的星鏈,能看視頻打游戲傳大型文件

新加坡航空可以高速上網了!飛機將接入馬斯克的星鏈,能看視頻打游戲傳大型文件

風向觀察
2026-05-04 16:25:41
越南少將的坦白:中國軍隊在諒山再停留五天,越軍將無一幸免

越南少將的坦白:中國軍隊在諒山再停留五天,越軍將無一幸免

別人都叫我阿腈
2026-05-03 03:21:11
002731,無法按期披露年報、一季報!明天停牌!

002731,無法按期披露年報、一季報!明天停牌!

證券時報e公司
2026-05-05 19:37:13
人老了確實沒太大意思,我媽今年72歲,獨自在家每天就做這兩件事

人老了確實沒太大意思,我媽今年72歲,獨自在家每天就做這兩件事

心理觀察局
2026-05-04 11:19:11
一場1-0上演神劇情:補時絕殺,中超領頭羊狂飆:10場9勝太犀利

一場1-0上演神劇情:補時絕殺,中超領頭羊狂飆:10場9勝太犀利

足球狗說
2026-05-05 21:38:01
俄羅斯游客回國后,特意跟親戚說:中國根本不是我們想象的那樣

俄羅斯游客回國后,特意跟親戚說:中國根本不是我們想象的那樣

阿柒的訊
2026-05-04 21:22:05
嵩山標語牌上寫“爬不動了吧哈哈哈”,因有人質疑其“嘲諷游客”被換下,網友惋惜:原標語生動有梗

嵩山標語牌上寫“爬不動了吧哈哈哈”,因有人質疑其“嘲諷游客”被換下,網友惋惜:原標語生動有梗

天津人
2026-05-05 18:57:00
剛剛!東契奇恢復取得重大進展!臥槽!湖人0票,雷霆全票

剛剛!東契奇恢復取得重大進展!臥槽!湖人0票,雷霆全票

體育新角度
2026-05-05 21:54:14
尷尬!央視拍人物短劇被張雪本人吐槽,“我沒有這么老吧”引爭議

尷尬!央視拍人物短劇被張雪本人吐槽,“我沒有這么老吧”引爭議

火山詩話
2026-05-05 05:39:56
澤連斯基宣布5月6日零時起?;穑瑸蹩颂m探測莫斯科防空系統

澤連斯基宣布5月6日零時起?;?,烏克蘭探測莫斯科防空系統

山河路口
2026-05-05 12:18:36
我家樓下有個少婦,離婚有一年了,長得非常漂亮,我想把她追到手

我家樓下有個少婦,離婚有一年了,長得非常漂亮,我想把她追到手

那年秋天
2026-05-05 18:00:07
徐正源看臺觀戰鐵人vs成都,國足U23主帥安東尼奧也在現場

徐正源看臺觀戰鐵人vs成都,國足U23主帥安東尼奧也在現場

懂球帝
2026-05-05 20:53:36
送完物資,美國軍機飛離北京,特朗普一錘定音,臺當局淪為犧牲品

送完物資,美國軍機飛離北京,特朗普一錘定音,臺當局淪為犧牲品

影孖看世界
2026-05-04 23:08:39
8.84億的美國工廠說關就關?曹德旺:美國不講理,我就不陪玩了

8.84億的美國工廠說關就關?曹德旺:美國不講理,我就不陪玩了

小莜讀史
2026-05-04 20:33:26
第一批擠爆廣東的韓國人,優越感被徹底擊碎

第一批擠爆廣東的韓國人,優越感被徹底擊碎

金錯刀
2026-05-05 11:55:49
大疆做充電寶:1度電塞進午餐盒,戶外電源開始卷便攜了

大疆做充電寶:1度電塞進午餐盒,戶外電源開始卷便攜了

閃存獵手
2026-05-05 15:39:06
蘋果宣布 iOS 26.5 重磅新功能,此地區全面開放使用!

蘋果宣布 iOS 26.5 重磅新功能,此地區全面開放使用!

XCiOS俱樂部
2026-05-05 19:46:25
國內油價將迎調整

國內油價將迎調整

魯中晨報
2026-05-05 15:06:12
2026-05-05 22:52:51
智車科技
智車科技
智能車領域媒體平臺!聚無人駕駛動態,領智能車創新
159文章數 18關注度
往期回顧 全部

科技要聞

傳蘋果考慮讓英特爾、三星代工設備處理器

頭條要聞

美軍稱“布什”號航母正穿越阿拉伯海 搭載60多架戰機

頭條要聞

美軍稱“布什”號航母正穿越阿拉伯海 搭載60多架戰機

體育要聞

全世界都等著看他笑話,他帶國米拿下冠軍

娛樂要聞

內娛真情誼!楊紫為謝娜演唱會送花籃

財經要聞

瀏陽煙花往事

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

健康
數碼
房產
本地
公開課

干細胞治燒燙傷面臨這些“瓶頸”

數碼要聞

亞馬遜押注“諾獎材料”除濕技術 可大幅削減建筑能耗

房產要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

本地新聞

用青花瓷的方式,打開西溪濕地

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版