无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

理想汽車12篇重磅論文入選CVPR 2026,具身智能再創(chuàng)新

0
分享至

近日,CVPR 2026(國際計算機視覺與模式識別會議)召開,理想汽車共有12篇論文入選。CVPR是計算機視覺與模式識別領(lǐng)域的頂級學術(shù)會議,與ICCV(國際計算機視覺大會)、ECCV(歐洲計算機視覺國際會議)并稱為計算機視覺領(lǐng)域三大頂級會議,具有極高的學術(shù)影響力。理想汽車此次入選12篇論文,涵蓋多模態(tài)感知、端到端規(guī)劃、世界模型、強化學習、認知模型及語言智能等多個核心領(lǐng)域,系統(tǒng)性展現(xiàn)了理想汽車持續(xù)深耕具身智能技術(shù)領(lǐng)域的研究實力。

從感知到?jīng)Q策,帶來全新技術(shù)范式

感知能力是具身智能的認知起點。在多模態(tài)感知領(lǐng)域,理想汽車SparseWorld-TC論文被收錄為Oral(大會口頭報告),SparseWorld-TC全新架構(gòu)突破了傳統(tǒng)方法依賴鳥瞰圖投影和離散化token表示的雙重瓶頸,直接從原始圖像特征端到端預(yù)測多幀未來三維場景占據(jù)情況。該方法采用稀疏占據(jù)表示,使Transformer能夠更高效地建模時空依賴關(guān)系,在nuScenes基準上的1至3秒占據(jù)預(yù)測任務(wù)中達到當前最優(yōu)性能,并在任意未來軌跡條件下保持較高精度,為智能輔助駕駛提供更精準的環(huán)境預(yù)判能力。


SparseWorld-TC

在端到端規(guī)劃領(lǐng)域,理想汽車提出SGDrive框架,將駕駛理解分解為“場景-交通參與體-目標”的層級結(jié)構(gòu),這一設(shè)計與人類駕駛認知方式高度對應(yīng):駕駛員首先感知整體環(huán)境,繼而識別關(guān)鍵交通參與體及其行為,最后形成短期目標并執(zhí)行動作。SGDrive通過結(jié)構(gòu)化的時空表示彌補了通用視覺語言模型在駕駛場景中的認知空缺,在NAVSIM基準上的純視覺方案中取得當前最優(yōu)性能,驗證了層級化知識結(jié)構(gòu)對于提升智能輔助駕駛規(guī)劃能力的有效性。


SGDrive

在強化學習領(lǐng)域,理想汽車提出PlannerRFT框架,解決了基于擴散模型的規(guī)劃器在強化微調(diào)過程中難以生成多模態(tài)、場景自適應(yīng)軌跡的核心難題。PlannerRFT采用雙分支優(yōu)化策略,在不改變原始推理流程的前提下,同時優(yōu)化軌跡分布并自適應(yīng)引導去噪過程。為支持大規(guī)模并行學習,理想汽車同步開發(fā)了nuMax仿真器,其軌跡推演速度較原生nuPlan提升10倍,為強化學習在智能輔助駕駛中的高效應(yīng)用提供了基礎(chǔ)設(shè)施支撐。


PlannerRFT

世界模型四項突破,夯實智能輔助駕駛仿真與安全基座

世界模型是此次理想汽車論文入選最為集中的領(lǐng)域,共有4篇論文入選,覆蓋深度估計、三維重建、認知評估與安全預(yù)判四大方向。InfiniDepth論文針對傳統(tǒng)深度估計中離散網(wǎng)格表示分辨率受限、難以恢復精細幾何細節(jié)的行業(yè)痛點,創(chuàng)新性地將深度建模為神經(jīng)隱式場,支持任意分辨率的連續(xù)稠密深度查詢,在精細細節(jié)區(qū)域和度量深度估計上均表現(xiàn)優(yōu)異,為新視角合成提供了更為精確的幾何先驗,有效提升大基線場景下的渲染質(zhì)量。


InfiniDepth

Unposed-to-3D論文聚焦于智能輔助駕駛仿真對高質(zhì)量三維車輛資產(chǎn)的迫切需求。針對現(xiàn)有方法依賴合成數(shù)據(jù)訓練且需要精確相機位姿標注、與真實場景存在域差距的問題,該研究提出兩階段框架,通過相機預(yù)測頭結(jié)合可微渲染實現(xiàn)無位姿圖像的自監(jiān)督學習,最終從真實駕駛圖像中直接重建出尺度準確、外觀和諧的仿真就緒三維車輛,顯著降低了仿真資產(chǎn)的生產(chǎn)門檻。


Unposed-to-3D

DriveCombo論文揭示了當前多模態(tài)大語言模型在復雜交通規(guī)則理解上的真實能力邊界。現(xiàn)有基準僅覆蓋單一規(guī)則場景,無法反映真實駕駛中多規(guī)則并發(fā)與沖突的推理難度。該研究構(gòu)建了文本與視覺雙模態(tài)基準,提出五級認知階梯,覆蓋從單規(guī)則理解到?jīng)_突消解的全認知鏈路,對14個主流模型的評估揭示了任務(wù)復雜度與性能下降之間的系統(tǒng)性規(guī)律,并驗證了該基準對提升下游規(guī)劃能力的實際價值。


DriveCombo

AD-R1入選CVPR Findings,該論文致力于解決將強化學習應(yīng)用于端到端智能輔助駕駛時的核心障礙——世界模型因僅在安全專家數(shù)據(jù)上訓練而存在系統(tǒng)性樂觀偏差,面對危險軌跡時傾向于預(yù)測虛假的安全結(jié)果。該研究提出反事實合成流水線,將世界模型訓練為公正的因果預(yù)測器,并將其整合進閉環(huán)強化學習框架作為危險感知評論器,有效降低了仿真場景中的安全違規(guī)率,為智能輔助駕駛的安全可靠性提供了新的技術(shù)路徑。


AD-R1

認知對齊與語言、視覺智能,讓推理更準更快

在認知模型領(lǐng)域,當前基于視覺語言模型的方法逐幀處理獨立圖像的方案,缺乏對歷史狀態(tài)的顯式建模,導致決策抖動頻繁。CogDriver論文研究提出認知慣性機制,通過構(gòu)建大規(guī)模敘事式視覺—語言—動作數(shù)據(jù)集提供時序監(jiān)督信號,并設(shè)計帶有稀疏時序記憶模塊的智能體架構(gòu),結(jié)合時空知識蒸餾顯式訓練決策一致性,在Bench2Drive和nuScenes基準上分別實現(xiàn)22%的駕駛得分提升和21%的軌跡誤差降低,進一步解決了智能輔助駕駛規(guī)劃中的時序一致性難題。


CogDriver

LinkVLA論文則聚焦于視覺語言動作模型中語言指令與動作輸出不匹配、自回歸動作生成效率低下兩大痛點。該研究通過結(jié)構(gòu)連接將語言和動作特征統(tǒng)一編入共享離散碼本,從底層強制實現(xiàn)跨模態(tài)一致性;同時引入“動作理解”輔助任務(wù)促進語言與動作的雙向映射,并采用粗到細的兩步法替代傳統(tǒng)逐步解碼。閉環(huán)自動駕駛基準測試表明,LinkVLA在顯著提升指令遵循準確性和駕駛性能的同時,節(jié)省了86%的推理延遲。


LinkVLA

在語言智能領(lǐng)域,F(xiàn)astMMoE入選CVPR Findings,該論文提出一套面向基于MoE(混合專家)架構(gòu)的多模態(tài)大模型、無需重新訓練的加速優(yōu)化框架,為多模態(tài)大模型的高效部署提供了新的技術(shù)路徑。針對多模態(tài)大模型計算開銷大、部署效率受限的行業(yè)痛點,F(xiàn)astMMoE從路由行為分析切入,融合視覺Token專家激活精簡與路由感知式Token剪枝兩套互補方案,在不犧牲核心能力的前提下大幅削減冗余計算。基于DeepSeek-VL2、InternVL3.5等主流模型的驗證實驗表明,F(xiàn)astMMoE最高可削減55%的浮點運算量,同時保留95.5%的原始性能,整體效果持續(xù)優(yōu)于現(xiàn)有剪枝基線方法。


FastMMoE

CoV-Align論文提出一種高效細粒度對齊框架,解決了多模態(tài)模型中圖像區(qū)域與語言描述精準匹配時計算效率低、特征噪聲大的雙重難題。該研究創(chuàng)新性地提出“內(nèi)聚視覺語義優(yōu)先”策略,在不依賴文本引導的前提下,預(yù)先通過視覺信息自主聚合語義一致的圖像區(qū)域,從而實現(xiàn)高效精準的區(qū)域—單詞對齊。在Flickr30K和MS-COCO經(jīng)典圖文評測基準上,CoV-Align取得當前最優(yōu)性能,推理速度較前沿基線方法提升3至5倍,在大規(guī)模多模態(tài)任務(wù)中展現(xiàn)出突出的實用優(yōu)勢。


CoV-Align

在視覺智能領(lǐng)域,Switch-KD入選CVPR Findings,用一套跨模態(tài)知識新蒸餾范式以小博大,讓0.5B的小模型擁有了逼近1.5B模型的多模態(tài)理解力。該方法突破了傳統(tǒng)蒸餾“模態(tài)分離監(jiān)督”的瓶頸,徹底重構(gòu)了跨模態(tài)知識蒸餾的底層邏輯——從“各管一段”的模態(tài)分離監(jiān)督,轉(zhuǎn)向統(tǒng)一概率空間蒸餾,為車端邊緣計算、智能座艙等輕量化部署場景提供了關(guān)鍵技術(shù)支撐。


Switch-KD

理想汽車始終將基礎(chǔ)研究視為支撐長期發(fā)展的核心動力。截至2026年一季度末,理想汽車已連續(xù)5個季度保持30億元左右的高強度研發(fā)投入,并連續(xù)6年持續(xù)加碼研發(fā)投入。2025年全年研發(fā)費用達到113億元,為歷史新高。近5年,理想汽車圍繞多模態(tài)感知、端到端、認知模型、世界模型、強化學習和基座模型等核心技術(shù)方向,在CVPR、ICCV、ECCV、NeurIPS、SIGGRAPH、IROS、ICRA等頂級學術(shù)會議和期刊上發(fā)表近百篇論文,持續(xù)印證理想汽車技術(shù)研究的前沿性和影響力。

在基礎(chǔ)研究過程中,理想汽車積極與國內(nèi)外高校展開合作,踐行“產(chǎn)學研結(jié)合”的創(chuàng)新模式,將自身在實際應(yīng)用中積累的數(shù)據(jù)和工程經(jīng)驗反饋學術(shù)研究,推動產(chǎn)學研互利共贏。理想汽車的每一項研究成果和技術(shù)突破都指向同一個目標:以更強的技術(shù)積累兌現(xiàn)“給車和家賦予生命”的品牌使命,讓每個家庭都能享受到智能科技帶來的便利。未來,理想汽車將持續(xù)加大基礎(chǔ)研究與應(yīng)用創(chuàng)新的投入,以扎實的技術(shù)積累和開放的生態(tài)理念,邁向全球領(lǐng)先的具身智能企業(yè)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
和爵士鬧僵,即將自由身的凱斯勒,對湖人是機會還是陷阱

和爵士鬧僵,即將自由身的凱斯勒,對湖人是機會還是陷阱

小禾的體育
2026-06-16 20:49:04
看了世界杯,中國球迷釋然了,中國足球確實還達不到世界杯的水平

看了世界杯,中國球迷釋然了,中國足球確實還達不到世界杯的水平

風雨與陽光
2026-06-16 11:23:56
宋美齡用能買1300架飛機的經(jīng)費,最終買了300架,剩余的錢在哪?

宋美齡用能買1300架飛機的經(jīng)費,最終買了300架,剩余的錢在哪?

云霄紀史觀
2026-06-09 00:44:29
中國靈活就業(yè)者突破3.2億大關(guān),占就業(yè)人口比例高達44%。

中國靈活就業(yè)者突破3.2億大關(guān),占就業(yè)人口比例高達44%。

流蘇晚晴
2026-06-13 18:21:18
王心凌胸圍真太有料了,隔著衣服都不能抵擋住誘惑

王心凌胸圍真太有料了,隔著衣服都不能抵擋住誘惑

動物奇奇怪怪
2026-06-16 20:21:13
采訪了100位當代女性,她們都認為女人最快活的時候,就是被人撩

采訪了100位當代女性,她們都認為女人最快活的時候,就是被人撩

千秋文化
2026-06-11 17:50:56
日媒極度不滿!中方或?qū)⑷婧瞬槿毡居洼喖案黝愡^境船只!

日媒極度不滿!中方或?qū)⑷婧瞬槿毡居洼喖案黝愡^境船只!

福建睿平
2026-06-16 06:23:18
11月1日實施,稅務(wù)總局下達鐵令:加油站加完油,必須當場開發(fā)票

11月1日實施,稅務(wù)總局下達鐵令:加油站加完油,必須當場開發(fā)票

有范又有料
2026-06-16 18:50:35
存款要變天了?若不出意外,2026年下半年存款市場或迎來4大轉(zhuǎn)變

存款要變天了?若不出意外,2026年下半年存款市場或迎來4大轉(zhuǎn)變

貓叔東山再起
2026-06-16 09:00:07
那位差點改寫泰國歷史的長公主走了,小孩都能扛過去的病終結(jié)了她

那位差點改寫泰國歷史的長公主走了,小孩都能扛過去的病終結(jié)了她

普陀動物世界
2026-06-12 18:32:23
100%癌細胞被清除!2026年ASCO發(fā)布,這款神仙療法讓癌癥患者沸騰

100%癌細胞被清除!2026年ASCO發(fā)布,這款神仙療法讓癌癥患者沸騰

無癌家園i
2026-06-16 16:06:34
網(wǎng)友建議落后領(lǐng)域都交給余承東:反正他來了就是第一

網(wǎng)友建議落后領(lǐng)域都交給余承東:反正他來了就是第一

熱搜摘要官
2026-06-14 00:16:24
副省部級“老虎”為何二次被查

副省部級“老虎”為何二次被查

中國新聞周刊
2026-06-16 20:05:02
注意!中老年男性有性生活和沒性生活,差別居然這么大?

注意!中老年男性有性生活和沒性生活,差別居然這么大?

皓皓情感說
2026-04-22 08:20:32
大陸選好墓地,靈柩放在臺灣,蔣介石如果落葉歸根,大家會同意嗎

大陸選好墓地,靈柩放在臺灣,蔣介石如果落葉歸根,大家會同意嗎

浩渺青史
2026-06-16 06:10:00
RIP!哈利伯頓未婚妻閨蜜意外離世,年僅26歲

RIP!哈利伯頓未婚妻閨蜜意外離世,年僅26歲

世界體育圈
2026-06-16 13:15:43
泰國公主移靈現(xiàn)場“國王車內(nèi)落淚照”系A(chǔ)I合成?現(xiàn)場攝影師:國王堅韌自持,僅呈現(xiàn)悲傷情緒

泰國公主移靈現(xiàn)場“國王車內(nèi)落淚照”系A(chǔ)I合成?現(xiàn)場攝影師:國王堅韌自持,僅呈現(xiàn)悲傷情緒

大象新聞
2026-06-16 19:57:02
美媒:中國臺灣第一架F-16V Block70即將交付,具備發(fā)現(xiàn)殲-20能力

美媒:中國臺灣第一架F-16V Block70即將交付,具備發(fā)現(xiàn)殲-20能力

藍星雜談
2026-06-15 18:37:18
歐足聯(lián)嘲諷擴軍!西班牙比利時皆不勝 10隊亮相3勝 4戰(zhàn)亞洲2平2負

歐足聯(lián)嘲諷擴軍!西班牙比利時皆不勝 10隊亮相3勝 4戰(zhàn)亞洲2平2負

狍子歪解體壇
2026-06-16 05:05:56
提幫功在葬禮上冒失出問題,蘇提達冷眼旁觀,多虧詩妮娜跪地救場

提幫功在葬禮上冒失出問題,蘇提達冷眼旁觀,多虧詩妮娜跪地救場

翰飛觀事
2026-06-16 09:26:49
2026-06-16 21:52:49
旭車評 incentive-icons
旭車評
網(wǎng)絡(luò)飛速 放慢腳步做車評
842文章數(shù) 63關(guān)注度
往期回顧 全部

汽車要聞

smart #6上市后 竟然很少被討論參數(shù)

頭條要聞

歐盟稱已核實"中方訓練俄軍人員在烏作戰(zhàn)" 外交部回應(yīng)

頭條要聞

歐盟稱已核實"中方訓練俄軍人員在烏作戰(zhàn)" 外交部回應(yīng)

體育要聞

身價5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個女兒在靈堂內(nèi)茫然失措

財經(jīng)要聞

2萬億存款去哪兒了?

科技要聞

DeepSeek融資500億,梁文鋒牢牢握住控制權(quán)

態(tài)度原創(chuàng)

本地
房產(chǎn)
手機
時尚
公開課

本地新聞

這屆年輕人為什么都在找心流時刻?

房產(chǎn)要聞

最新房價:海口、三亞;新房、二手房全線下跌!

手機要聞

iOS 27將Siri動畫設(shè)計為藥丸狀以掩蓋靈動島 iPhone 18或改用圓形圖標

專訪丨重排版《青蛇》:“戀愛腦”還是“完美主義”?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版