无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

小米智駕兩年三跳?2026年有啥技術新突破?

0
分享至

[首發于智駕最前沿微信公眾號]從小米開始造車到現在,它似乎一直在話題的中央,無論是在剛發布新車時的高調期,到后來被眾多網友口誅筆伐的質疑期,再到現在回歸本源的沉穩期,小米的一舉一動似乎都被全網關注。

作為一個專注于智駕的平臺,我們也一直關注著小米智駕的發展,其實從2024年的規則驅動,到2025年的端到端神經網絡,再到2026年以認知驅動為核心的XLA大模型和OneVL模型,小米用兩年時間完成了三次底層技術架構的躍遷。今天智駕最前沿就帶大家來盤一盤小米智駕!

從模仿到理解,技術路線經歷了怎樣的轉變?

2024年3月,小米輔助駕駛系統在第一代SU7上首次量產,當時行業的主流方案是無圖城市領航,小米也采用了類似的路線,其系統依賴大量人工編寫的規則,分別處理感知、規劃和控制等子任務。這種方案在規則有限的場景下可以工作,但隨著道路場景越來越復雜,規則數量急劇膨脹,最終陷入了維護困難的處境,人工規則不可能窮舉真實世界里所有可能發生的情況,系統的上限很快被觸及。

2025年,智駕行業的整體思路發生了變化,開始從規則驅動轉向端到端架構。所謂端到端,就是不再把自動駕駛拆成感知、預測、規劃、控制等多個獨立模塊,而是直接將傳感器的原始數據輸入一個統一的深度神經網絡,由模型自己學習從輸入到駕駛動作的映射關系。



圖片源自:網絡

小米在2025年2月推出了第一版端到端輔助駕駛系統,同年7月又迭代到了1000 Clips版本,將真實駕駛場景的訓練數據規模提升到了百萬量級。端到端方案讓加減速更加平順,變道決策更加果斷,因為這些行為不再需要人工用規則去定義,而是由模型從海量駕駛數據中自動提取。

不過,端到端方案本質上仍然屬于模仿學習的范疇,模型通過觀看大量的人類駕駛數據來模仿駕駛行為,但并不會真正理解為什么要這樣開。它的工作方式更接近背誦題庫,也就是遇到訓練數據中見過的場景,就表現不錯;一旦遇到訓練數據中從未出現過的長尾場景,模型就會因為缺乏理解能力而做出不合理的決策。也就是說,僅靠堆數據和擴大模型規模,并不能從根本上解決泛化問題。

從2025年下半年開始,小米的技術方向開始從數據驅動向認知驅動轉型,也就是嘗試讓模型理解環境的物理規律和因果關系,而不是模仿人類的表面行為。這個思路最終在2026年3月,隨著新一代SU7的發布,以XLA認知大模型的形式落地。

XLA認知大模型,認知驅動意味著什么?

XLA是小米輔助駕駛的第三代軟件架構,2026年3月正式發布,XLA中的X代表多模態輸入(Multi-modal Inputs),即系統不只接收攝像頭拍攝的圖像,還融合了激光雷達點云、4D毫米波雷達信號、導航信息、車內麥克風音頻,甚至包括來自小米機器人研發過程中產生的物理交互數據。

這種多模態輸入的設計出發點很明確,不同傳感器在物理特性上是互補的,攝像頭提供密集的語義信息但受光照影響大,激光雷達能給出精確的三維幾何結構但在雨霧中衰減嚴重,4D毫米波雷達則在惡劣天氣下依然穩定,且能測量目標的高度信息。把這些不同來源的信號在模型輸入端統一處理,系統對環境的理解就會比單一依賴視覺的方案更加完整。L代表融入智能語言,A代表執行過程,將他們合在一起構成了一個以多模態認知為核心的技術框架。



圖片源自:網絡

支撐XLA架構的底層模型,是小米自研的Xiaomi MiMo-Embodied具身基座大模型,這個基座模型能同時在輔助駕駛場景數據和室內機器人物理交互數據上進行訓練。工廠里機器人抓取零件、擰螺絲、放置物料這些精細操作所涉及的空間感知與推理能力,通過混合訓練的方式遷移到了車輛對道路場景的理解中。

這種跨域訓練策略不是簡單的多任務學習,而是利用不同任務背后的公共物理規律,即無論是機器人在工位上操作螺絲,還是車輛在路口判斷行人運動軌跡,本質上都需要對三維空間的幾何關系、物體的運動趨勢、接觸與碰撞的物理約束進行建模。用一個統一的基座模型來承載這些能力,可以在更底層、更通用的層面提升模型的推理質量。

基于MiMo-Embodied基座,XLA架構帶來了幾個實質性的能力提升。在行車場景中,系統對復雜路口的通行策略更加合理,縱向速度控制更加平滑,不再出現急加速急減速的情況。在安全方面,全系標配包括緊急轉向輔助、盲區監測與干預、前向碰撞預警等25項安全輔助功能。在功能創新方面,XLA首次支持語音控車,駕駛員可以直接用自然語言指令控制輔助駕駛的相關功能,還推出了商場地庫的車位級領航功能,可以在沒有GPS信號的地下停車場內完成從入口到目標車位的全程引導。



圖片源自:網絡

值得一提的是,XLA還打通了輔助駕駛和具身機器人兩大技術任務,這意味著同一個模型架構可以同時支撐車輛的自動駕駛規劃和機器人的操作學習。從長期研發效率的角度看,這種統一架構可以避免維護兩套獨立技術棧的重復投入,同時讓兩個方向的數據和算法形成互相促進的效應。



Xiaomi OneVL開源發布,憑什么把兩條技術路線統一了?

2026年5月13日,小米正式發布并全面開源了自動駕駛模型Xiaomi OneVL,全稱是一步式潛空間語言視覺推理框架,這是在XLA技術方向上的一次深度推進,也是最值得關注的一項技術進展。

在理解OneVL解決了什么問題之前,先給大家介紹兩條獨立的技術路線。第一條是VLA,即視覺-語言-動作模型(Vision-Language-Action)。VLA的思路是讓模型以思維鏈的方式逐步推理,即先理解當前場景中有哪些對象,再用自然語言描述場景狀態,最后基于這個描述輸出駕駛動作。它的優勢在于可解釋性強,你能看到模型在每一步想了什么。但VLA的問題也很明顯,其推理過程需要生成大量自然語言文本,自回歸解碼速度慢,難以滿足車載場景對實時性的要求。



圖片源自:網絡

第二條是世界模型(World Model)路線,它讓模型學習環境中的物理因果規律,在內部腦補未來可能發生的情況,再據此規劃行為。世界模型擅長預測和預判,但不像VLA那樣具備清晰的可解釋性,也就是你不知道模型為什么做出了某個預測。這兩條路線各有側重,但此前一直處在相對獨立的發展路徑上。

OneVL的核心創新,是找到了一種方式將這兩條路線統一起來,這個方式叫做潛空間推理。通俗地解釋這個方式,也就是傳統的思維鏈推理是把推理過程展開成人類可讀的自然語言文本,逐步生成、逐步判斷。潛空間推理則是把推理過程壓縮到一個高維的、向量化的潛空間中直接完成邏輯推演,不再展開為自然語言。這個潛空間中承載了VLA的場景理解能力和世界模型的環境預測能力,但所有運算都發生在向量層面而非文本層面,因此推理速度可以大幅提升。

OneVL提出了三項關鍵技術來支撐這個方案。第一,讓模型用自己的內部語言進行思考,而不是受限于自然語言的表達效率;第二,讓模型學會預測未來的視覺畫面,這對應世界模型的預測能力;第三,把整個推理過程壓縮到一步完成,即一步式推理,避免多步自回歸帶來的延遲累積。



圖片源自:網絡

從實測性能來看,這套方案的效果相當可觀。Xiaomi OneVL的推理延遲最低僅0.24秒,僅為傳統VLA自回歸推理時間的5.4%。在精度方面,它超越了顯式思維鏈方法,同時在ROADWork、Impromptu、Alpamayo-R1等多個主流基準測試上刷新了潛在推理方法的性能上限。它還能為模型決策提供語言和視覺雙維度的可解釋性,既可以用文字說明為什么這樣開,也可以用預測畫面展示接下來會發生什么。這意味著OneVL在精度、速度和可解釋性三個維度上找到了一個平衡點。

小米已將OneVL的模型權重、訓練代碼和推理代碼全部開源,對于行業來說,開源一個同時具備VLA推理能力和世界模型預測能力的自動駕駛基礎模型,不僅降低了大模型研發的門檻,也為學術研究和工程探索提供了一套可以復現和對比的基準方案。

硬件層面,傳感器和計算平臺如何支撐這些算法?

軟件算法的進步必須以匹配的硬件平臺為前提,新一代SU7全系標配了由1顆激光雷達、1顆4D毫米波雷達、11個高清攝像頭和12個超聲波雷達組成的多傳感器融合方案。

每個傳感器承擔著不同的角色,激光雷達位于車頂最突出的位置,是系統最重要的前向感知硬件,最遠探測距離約200米。它的核心能力是精確測量前方空間的三維形態,包括道路邊界、車道結構、前方障礙物的輪廓等。而且激光雷達不依賴環境光,在夜間或暗光條件下依然能穩定工作。

4D毫米波雷達集成在前保險杠中央,這是新一代車型新增的核心感知硬件。傳統的3D毫米波雷達只能測量距離、水平方位和速度三個維度的信息,無法感知高度,因此容易出現誤判。4D毫米波雷達在3D基礎上增加了俯仰角的測量能力,也就是能夠檢測障礙物的高度信息,從而有效區分路牌、高架橋、地面井蓋與真正需要避讓的障礙物。



圖片源自:網絡

此外,毫米波雷達在雨、雪、霧等惡劣天氣下依然保持較好的穿透和感知能力,這是攝像頭和激光雷達都難以比擬的優勢。它可以準確判斷前方側方動態目標的距離、速度和運動趨勢,為系統提供“風險是否在快速靠近”這類關鍵的動態信息。

11個高清攝像頭分為7顆周視攝像頭和4顆環視攝像頭,分別負責遠距離的行駛路況感知和近距離的車身盲區監控,12個超聲波雷達則分布在車身周圍的關鍵盲區位置,負責泊車和低速挪車時對近距離障礙物的精確探測。四種傳感器各司其職又互為冗余,確保系統在不同場景、不同天氣、不同光照條件下都能獲得可靠的感知輸入。

新一代SU7還全系搭載NVIDIA DRIVE AGX Thor芯片,算力為700 TOPS,較前代雙Orin方案提升約37.8%。Thor是NVIDIA面向L2至L4級別自動駕駛設計的新一代集中式計算平臺,在芯片層面就支持激光雷達融合感知、復雜路徑規劃算法和多路傳感器數據的并行處理。700TOPS的算力為XLA認知大模型和OneVL這類重度計算任務在車端的實時推理提供了充裕的計算資源。



圖片源自:網絡

配套的電子電氣架構也做了相應升級。新一代SU7采用了四合一域控制模塊設計,將輔助駕駛、智能座艙、通信和整車控制整合到統一的架構中,核心搭載高通第三代驍龍8移動平臺和NVIDIA DRIVE AGX Thor芯片,支持雙5G雙卡雙通、三藍牙、雙Wi-Fi和5個UWB定位錨點。這種高集成度的電子電氣架構有助于降低各域之間的通信延遲,提高數據傳輸效率,為多傳感器數據的實時融合和模型的快速推理提供底層支撐。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
孫浩最紅的時候,把在北京漂著的張嘉益接家里住,一住就是十年。

孫浩最紅的時候,把在北京漂著的張嘉益接家里住,一住就是十年。

草莓解說體育
2026-05-22 07:25:56
“武大郎”再現?36歲妻子投喂鼠藥!丈夫沒死就再投一次

“武大郎”再現?36歲妻子投喂鼠藥!丈夫沒死就再投一次

墨策史
2026-05-22 07:54:35
武漢孕婦江邊失聯6天,丈夫說了一句離婚吧,嫌她和前男友去旅游

武漢孕婦江邊失聯6天,丈夫說了一句離婚吧,嫌她和前男友去旅游

江山揮筆
2026-05-22 09:46:16
一起灼燙事故,3人死亡!掛牌督辦!

一起灼燙事故,3人死亡!掛牌督辦!

環球網資訊
2026-05-22 07:53:56
醫生發現:只需改變下早餐,不僅膽固醇下降了,各個指標都穩定了

醫生發現:只需改變下早餐,不僅膽固醇下降了,各個指標都穩定了

讀懂世界歷史
2026-05-21 22:28:50
“中產運動新寵”HYROX走紅:花600塊“做苦力”、觀眾票溢價六七倍,內地合作健身房已達500家

“中產運動新寵”HYROX走紅:花600塊“做苦力”、觀眾票溢價六七倍,內地合作健身房已達500家

藍鯨新聞
2026-05-21 17:21:15
罕見病明星藥因死亡病例或遭美國撤市,安進中國回應:國內尚未商業化,未有患者接受治療

罕見病明星藥因死亡病例或遭美國撤市,安進中國回應:國內尚未商業化,未有患者接受治療

澎湃新聞
2026-05-22 13:24:28
上海申花高層考慮與利雅得勝利互換主教練,熱蘇斯有望赴申花任職

上海申花高層考慮與利雅得勝利互換主教練,熱蘇斯有望赴申花任職

天光破云來
2026-05-22 13:47:31
5月22日早評:市場放量普跌,牛市要結束了么?

5月22日早評:市場放量普跌,牛市要結束了么?

小白鴿財經
2026-05-22 09:25:41
90年代電視臺播過的“大尺度”動畫片,很好奇當年怎么過的審

90年代電視臺播過的“大尺度”動畫片,很好奇當年怎么過的審

街機時代
2026-05-21 21:26:26
哈登怒了!米切爾沮喪放棄比賽,0失誤帶不動騎士全隊

哈登怒了!米切爾沮喪放棄比賽,0失誤帶不動騎士全隊

湖人侃球師
2026-05-22 10:11:59
36歲西班牙后衛阿斯皮利奎塔退役!曾效力于切爾西、馬競等隊

36歲西班牙后衛阿斯皮利奎塔退役!曾效力于切爾西、馬競等隊

懂球帝
2026-05-22 16:03:06
何九華官宣當爸僅1周,王鷗出手“反擊”,這下里子面子全丟了

何九華官宣當爸僅1周,王鷗出手“反擊”,這下里子面子全丟了

星星沒有你亮
2026-05-22 06:54:17
核彈頭運抵白俄羅斯:25名俄軍精銳只剩倆殘疾,23歲前政治犯犧牲

核彈頭運抵白俄羅斯:25名俄軍精銳只剩倆殘疾,23歲前政治犯犧牲

鷹眼Defence
2026-05-22 17:00:40
震驚!上海高校課堂狂吼“殺殺殺”大四學生,老師請吃麥當勞和解

震驚!上海高校課堂狂吼“殺殺殺”大四學生,老師請吃麥當勞和解

火山詩話
2026-05-21 06:15:09
花200架波音訂單的錢,其實是給C919的發動機自由買了個倒計時!

花200架波音訂單的錢,其實是給C919的發動機自由買了個倒計時!

達文西看世界
2026-05-20 15:04:34
訂婚宴上被岳母潑紅酒,我一言不發離席,十五分鐘后岳母全家慌了

訂婚宴上被岳母潑紅酒,我一言不發離席,十五分鐘后岳母全家慌了

千秋文化
2026-05-20 20:25:36
最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
上?!八山墶痹兴?,為何全國都在觀望?

上?!八山墶痹兴帲瑸楹稳珖荚谟^望?

白宸侃片
2026-05-22 13:30:28
太尷尬!一戴眼鏡小伙身著絲襪,坐在中年男腿上玩手機,舉止親密

太尷尬!一戴眼鏡小伙身著絲襪,坐在中年男腿上玩手機,舉止親密

火山詩話
2026-05-22 07:35:57
2026-05-22 18:28:49
智駕最前沿
智駕最前沿
自動駕駛領域專業的技術、資訊分享平臺。我們的slogan是:聚焦智能駕駛 ,緊盯行業前沿。
455文章數 11關注度
往期回顧 全部

汽車要聞

舒適智能配置滿 昊鉑S600開著沒那么運動也挺好

頭條要聞

80后地產女王自殺倒在樓市黎明前 曾稱或面臨刑事責任

頭條要聞

80后地產女王自殺倒在樓市黎明前 曾稱或面臨刑事責任

體育要聞

最糟糕裁判?他想要退役當市長

娛樂要聞

周也戀情曝光!對象身份不簡單

財經要聞

證監會擬對老虎、富途、長橋依法嚴厲處罰

科技要聞

雷軍:輸給特斯拉不丟人

態度原創

游戲
數碼
家居
公開課
軍事航空

《紅色沙漠》又更新!玩家呼聲最大的要來了

數碼要聞

AOC新款27寸OLED顯示器首發3499元:4K 165Hz屏 五層堆棧結構設計

家居要聞

低調傳承 溫潤沉靜

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄羅斯試射具備核打擊能力的高超音速導彈

無障礙瀏覽 進入關懷版