无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

12篇重磅論文入選CVPR 2026,理想引領具身智能技術系統性創新

0
分享至

近日,CVPR 2026(國際計算機視覺與模式識別會議)召開,理想汽車共有12篇論文入選。CVPR是計算機視覺與模式識別領域的頂級學術會議,與ICCV(國際計算機視覺大會)、ECCV(歐洲計算機視覺國際會議)并稱為計算機視覺領域三大頂級會議,具有極高的學術影響力。理想汽車此次入選12篇論文,涵蓋多模態感知、端到端規劃、世界模型、強化學習、認知模型及語言智能等多個核心領域,系統性展現了理想汽車持續深耕具身智能技術領域的研究實力。

從感知到決策,帶來全新技術范式

感知能力是具身智能的認知起點。在多模態感知領域,理想汽車SparseWorld-TC論文被收錄為Oral(大會口頭報告),SparseWorld-TC全新架構突破了傳統方法依賴鳥瞰圖投影和離散化token表示的雙重瓶頸,直接從原始圖像特征端到端預測多幀未來三維場景占據情況。該方法采用稀疏占據表示,使Transformer能夠更高效地建模時空依賴關系,在nuScenes基準上的1至3秒占據預測任務中達到當前最優性能,并在任意未來軌跡條件下保持較高精度,為智能輔助駕駛提供更精準的環境預判能力。


SparseWorld-TC

在端到端規劃領域,理想汽車提出SGDrive框架,將駕駛理解分解為“場景-交通參與體-目標”的層級結構,這一設計與人類駕駛認知方式高度對應:駕駛員首先感知整體環境,繼而識別關鍵交通參與體及其行為,最后形成短期目標并執行動作。SGDrive通過結構化的時空表示彌補了通用視覺語言模型在駕駛場景中的認知空缺,在NAVSIM基準上的純視覺方案中取得當前最優性能,驗證了層級化知識結構對于提升智能輔助駕駛規劃能力的有效性。


SGDrive

在強化學習領域,理想汽車提出PlannerRFT框架,解決了基于擴散模型的規劃器在強化微調過程中難以生成多模態、場景自適應軌跡的核心難題。PlannerRFT采用雙分支優化策略,在不改變原始推理流程的前提下,同時優化軌跡分布并自適應引導去噪過程。為支持大規模并行學習,理想汽車同步開發了nuMax仿真器,其軌跡推演速度較原生nuPlan提升10倍,為強化學習在智能輔助駕駛中的高效應用提供了基礎設施支撐。


PlannerRFT

世界模型四項突破,夯實智能輔助駕駛仿真與安全基座

世界模型是此次理想汽車論文入選最為集中的領域,共有4篇論文入選,覆蓋深度估計、三維重建、認知評估與安全預判四大方向。InfiniDepth論文針對傳統深度估計中離散網格表示分辨率受限、難以恢復精細幾何細節的行業痛點,創新性地將深度建模為神經隱式場,支持任意分辨率的連續稠密深度查詢,在精細細節區域和度量深度估計上均表現優異,為新視角合成提供了更為精確的幾何先驗,有效提升大基線場景下的渲染質量。


InfiniDepth

Unposed-to-3D論文聚焦于智能輔助駕駛仿真對高質量三維車輛資產的迫切需求。針對現有方法依賴合成數據訓練且需要精確相機位姿標注、與真實場景存在域差距的問題,該研究提出兩階段框架,通過相機預測頭結合可微渲染實現無位姿圖像的自監督學習,最終從真實駕駛圖像中直接重建出尺度準確、外觀和諧的仿真就緒三維車輛,顯著降低了仿真資產的生產門檻。


Unposed-to-3D

DriveCombo論文揭示了當前多模態大語言模型在復雜交通規則理解上的真實能力邊界。現有基準僅覆蓋單一規則場景,無法反映真實駕駛中多規則并發與沖突的推理難度。該研究構建了文本與視覺雙模態基準,提出五級認知階梯,覆蓋從單規則理解到沖突消解的全認知鏈路,對14個主流模型的評估揭示了任務復雜度與性能下降之間的系統性規律,并驗證了該基準對提升下游規劃能力的實際價值。


DriveCombo

AD-R1入選CVPR Findings,該論文致力于解決將強化學習應用于端到端智能輔助駕駛時的核心障礙——世界模型因僅在安全專家數據上訓練而存在系統性樂觀偏差,面對危險軌跡時傾向于預測虛假的安全結果。該研究提出反事實合成流水線,將世界模型訓練為公正的因果預測器,并將其整合進閉環強化學習框架作為危險感知評論器,有效降低了仿真場景中的安全違規率,為智能輔助駕駛的安全可靠性提供了新的技術路徑。


AD-R1

認知對齊與語言、視覺智能,讓推理更準更快

在認知模型領域,當前基于視覺語言模型的方法逐幀處理獨立圖像的方案,缺乏對歷史狀態的顯式建模,導致決策抖動頻繁。CogDriver論文研究提出認知慣性機制,通過構建大規模敘事式視覺—語言—動作數據集提供時序監督信號,并設計帶有稀疏時序記憶模塊的智能體架構,結合時空知識蒸餾顯式訓練決策一致性,在Bench2Drive和nuScenes基準上分別實現22%的駕駛得分提升和21%的軌跡誤差降低,進一步解決了智能輔助駕駛規劃中的時序一致性難題。


CogDriver

LinkVLA論文則聚焦于視覺語言動作模型中語言指令與動作輸出不匹配、自回歸動作生成效率低下兩大痛點。該研究通過結構連接將語言和動作特征統一編入共享離散碼本,從底層強制實現跨模態一致性;同時引入“動作理解”輔助任務促進語言與動作的雙向映射,并采用粗到細的兩步法替代傳統逐步解碼。閉環自動駕駛基準測試表明,LinkVLA在顯著提升指令遵循準確性和駕駛性能的同時,節省了86%的推理延遲。


LinkVLA

在語言智能領域,FastMMoE入選CVPR Findings,該論文提出一套面向基于MoE(混合專家)架構的多模態大模型、無需重新訓練的加速優化框架,為多模態大模型的高效部署提供了新的技術路徑。針對多模態大模型計算開銷大、部署效率受限的行業痛點,FastMMoE從路由行為分析切入,融合視覺Token專家激活精簡與路由感知式Token剪枝兩套互補方案,在不犧牲核心能力的前提下大幅削減冗余計算。基于DeepSeek-VL2、InternVL3.5等主流模型的驗證實驗表明,FastMMoE最高可削減55%的浮點運算量,同時保留95.5%的原始性能,整體效果持續優于現有剪枝基線方法。


FastMMoE

CoV-Align論文提出一種高效細粒度對齊框架,解決了多模態模型中圖像區域與語言描述精準匹配時計算效率低、特征噪聲大的雙重難題。該研究創新性地提出“內聚視覺語義優先”策略,在不依賴文本引導的前提下,預先通過視覺信息自主聚合語義一致的圖像區域,從而實現高效精準的區域—單詞對齊。在Flickr30K和MS-COCO經典圖文評測基準上,CoV-Align取得當前最優性能,推理速度較前沿基線方法提升3至5倍,在大規模多模態任務中展現出突出的實用優勢。


CoV-Align

在視覺智能領域,Switch-KD入選CVPR Findings,用一套跨模態知識新蒸餾范式以小博大,讓0.5B的小模型擁有了逼近1.5B模型的多模態理解力。該方法突破了傳統蒸餾“模態分離監督”的瓶頸,徹底重構了跨模態知識蒸餾的底層邏輯——從“各管一段”的模態分離監督,轉向統一概率空間蒸餾,為車端邊緣計算、智能座艙等輕量化部署場景提供了關鍵技術支撐。


Switch-KD

理想汽車始終將基礎研究視為支撐長期發展的核心動力。截至2026年一季度末,理想汽車已連續5個季度保持30億元左右的高強度研發投入,并連續6年持續加碼研發投入。2025年全年研發費用達到113億元,為歷史新高。近5年,理想汽車圍繞多模態感知、端到端、認知模型、世界模型、強化學習和基座模型等核心技術方向,在CVPR、ICCV、ECCV、NeurIPS、SIGGRAPH、IROS、ICRA等頂級學術會議和期刊上發表近百篇論文,持續印證理想汽車技術研究的前沿性和影響力。

在基礎研究過程中,理想汽車積極與國內外高校展開合作,踐行“產學研結合”的創新模式,將自身在實際應用中積累的數據和工程經驗反饋學術研究,推動產學研互利共贏。理想汽車的每一項研究成果和技術突破都指向同一個目標:以更強的技術積累兌現“給車和家賦予生命”的品牌使命,讓每個家庭都能享受到智能科技帶來的便利。未來,理想汽車將持續加大基礎研究與應用創新的投入,以扎實的技術積累和開放的生態理念,邁向全球領先的具身智能企業。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
內塔尼亞胡:以色列已準備好拋棄美國獨自攻擊伊朗

內塔尼亞胡:以色列已準備好拋棄美國獨自攻擊伊朗

一種觀點
2026-06-10 15:53:34
張雪350雙缸ADV踏板曝光 預售3萬 是真香還是噱頭

張雪350雙缸ADV踏板曝光 預售3萬 是真香還是噱頭

生活魔術專家
2026-06-12 15:51:33
任天堂Switch 2在日本推出防黃牛新規:50小時門檻

任天堂Switch 2在日本推出防黃牛新規:50小時門檻

霧野尋蹤2
2026-06-12 01:05:58
杜越華兼任上海外國語大學附屬徐匯實驗中學校長

杜越華兼任上海外國語大學附屬徐匯實驗中學校長

澎湃新聞
2026-06-11 12:16:30
上海金橋有輛車直接“飛”到了雕塑頂上 官方:不是意外!是當地鎮標“飛車”雕塑

上海金橋有輛車直接“飛”到了雕塑頂上 官方:不是意外!是當地鎮標“飛車”雕塑

閃電新聞
2026-06-12 21:52:57
臨陣被換+世界杯夢碎 33歲日本隊長宣布退出國家隊:希望球隊奪冠

臨陣被換+世界杯夢碎 33歲日本隊長宣布退出國家隊:希望球隊奪冠

我愛英超
2026-06-12 07:11:45
夜夜求歡!50歲妻子苦不堪言: 本分妻設局灌醉保姆助丈夫性侵

夜夜求歡!50歲妻子苦不堪言: 本分妻設局灌醉保姆助丈夫性侵

深夜探案館
2026-06-11 01:48:36
揭幕戰活久見,被足球耽誤的拳擊手!菜又臟的南非給擴軍一記重拳

揭幕戰活久見,被足球耽誤的拳擊手!菜又臟的南非給擴軍一記重拳

中國足球的那些事兒
2026-06-12 05:57:49
Lisa的世界杯開幕式舞臺,是靠瘋馬秀換來的,她的脫衣舞沒有白跳

Lisa的世界杯開幕式舞臺,是靠瘋馬秀換來的,她的脫衣舞沒有白跳

芊手若
2026-06-11 07:15:41
從36跌到3.5,跌了整整8年,好不容易等到一個漲停,結果炸板了!

從36跌到3.5,跌了整整8年,好不容易等到一個漲停,結果炸板了!

丁丁鯉史紀
2026-05-30 17:08:34
伊媒公布伊美諒解備忘錄新細節

伊媒公布伊美諒解備忘錄新細節

財聯社
2026-06-12 16:07:28
賈靜雯自以為豪的體面,被大女兒撕得稀碎,上億遺產也難掩家丑

賈靜雯自以為豪的體面,被大女兒撕得稀碎,上億遺產也難掩家丑

好賢觀史記
2026-06-12 11:48:37
“滴滴出行”突然改名

“滴滴出行”突然改名

浙江之聲
2026-06-12 14:35:12
女子開LCC輔助駕駛自駕331國道,撞上土堆車輛騰空飛起,安全氣囊彈出,當事人:交警告知該路段尚未正式交付,但現場無警示牌和圍擋

女子開LCC輔助駕駛自駕331國道,撞上土堆車輛騰空飛起,安全氣囊彈出,當事人:交警告知該路段尚未正式交付,但現場無警示牌和圍擋

瀟湘晨報
2026-06-12 18:28:14
盧卡庫被標“白菜價”1000萬歐甩賣

盧卡庫被標“白菜價”1000萬歐甩賣

日常碎碎念啊
2026-06-12 00:06:26
美媒痛批特朗普:最愚蠢的錯誤,就是將中國定義為"同等級"對手

美媒痛批特朗普:最愚蠢的錯誤,就是將中國定義為"同等級"對手

蜉蝣說
2026-06-12 11:39:39
德國炸鍋!選擇黨魏德爾喊話烏:炸了我們的管道,該賠錢了

德國炸鍋!選擇黨魏德爾喊話烏:炸了我們的管道,該賠錢了

共工之錨
2026-06-12 00:15:26
從"籃球之神"到歷史締造者:唐斯距紐約之巔僅差一勝

從"籃球之神"到歷史締造者:唐斯距紐約之巔僅差一勝

林間小溫柔
2026-06-12 00:31:01
每年70萬人因肺癌而死!再次勸告:天熱寧可吹吹風扇,也別做4事

每年70萬人因肺癌而死!再次勸告:天熱寧可吹吹風扇,也別做4事

健康之光
2026-06-08 21:35:04
米薩諾練習賽張雪機車成績:卡里卡蘇洛第11名,德比斯14

米薩諾練習賽張雪機車成績:卡里卡蘇洛第11名,德比斯14

代古龍侃球
2026-06-12 20:50:09
2026-06-13 01:44:49
燃擎頻道 incentive-icons
燃擎頻道
中國汽車自媒體前30強!
8834文章數 231288關注度
往期回顧 全部

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

頭條要聞

美加墨世界杯第二場比賽就現空座 英媒:尷尬

頭條要聞

美加墨世界杯第二場比賽就現空座 英媒:尷尬

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

態度原創

本地
手機
時尚
公開課
軍事航空

本地新聞

AK劉彰邂逅河北南大港濕地

手機要聞

vivo X Fold6再預熱:天璣9500超能版+OriginOS 6 Fold

夏天別總穿一身白或一身黑!試試一半彩色、一半基礎色,高級亮眼

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗媒體:已故最高領袖葬禮推遲舉行

無障礙瀏覽 進入關懷版