對于有能力研發駕駛輔助大模型的車企來說,智駕相關的技術一直都是壓箱底的“寶貝”,默認以閉源模式構筑護城河。然而就在近期,小米汽車正式開源了OneVL一步式潛空間語言視覺推理框架。這背后,是怎樣的戰略布局?
![]()
編輯:黃忻惟
0.24秒決策,OneVL的表現快又準
根據小米官方數據,OneVL的成績確實硬核:推理延遲最低0.24秒,僅為傳統方案的5.4%,快了18.5倍;在三個主流權威基準測試中全部取得 "潛空間推理模型" 類別中的 SOTA(全球最佳性能) 表現;在NAVSIM規劃基準上得分88.84,首次超越顯式思維鏈方案。這個反應延遲意味著,當車輛以120km/h行駛時,僅前進8 米即可對路況進行反應,大幅提升了容錯率與安全性。
OneVL的核心思路,是讓 AI 將所有思考一次性并行完成,從而在極短時間內完成高質量的駕駛決策。這款大模型,把"看到的"和"想說的"壓縮成兩種token一起處理,視覺的負責物理因果感知,語言的負責駕駛語義理解,形成完整的"內心獨白"。其訓練 - 推理解耦設計,能夠在訓練時用兩個解碼器分別預測未來畫面和重建思維鏈,但在推理時全部移除,實現零額外開銷、能力內化。
![]()
![]()
極低延遲為量產車端實時部署提供了可行路徑。過去的端到端模型存在兩難:跑在云端則延遲高、依賴網絡;部署在端側則需大幅閹割,導致精度下降。OneVL 的技術路線融合兩者優勢,使架構效率大幅提升,以極低延遲完成端到端高質量自動駕駛決策。更重要的是,開源讓它不是小米獨占的推理框架,而是變成了整個行業可以共同迭代的技術底座。
小米汽車為何打出開源牌?
小米為什么要把核心技術開源?開源不是放棄優勢,而是把比賽拉到了自己更擅長的賽道上。
![]()
首先需要指出,OneVL仍處于學術驗證階段,距離真正開車上路還有很長的路要走。它并非完整的智駕系統,目前僅在“視覺理解—隱式推理—軌跡預測”這一核心環節實現技術突破。
一個真正能量產的智駕系統,是一套龐大精密的工程體系。從傳感器的物理安裝與多源標定,到多傳感器數據的深度融合,再到完整的BEV感知棧構建、路徑規劃與車輛控制執行、極端場景下的安全冗余設計,以及海量數據挖掘與車隊OTA閉環——這些環節,OneVL都尚未覆蓋。它目前輸出的只是未來軌跡點,要將這些軌跡點變成車輛方向盤和剎車的安全指令,還需要規劃控制、安全冗余等多個模塊協同工作,以及與車規級芯片的深度適配優化。
看清這一點,反而更能理解小米開源背后的戰略考量——拼生態和迭代速度,不僅通過開源撬動整個行業的智慧,還能夠搶先爭奪標準制定權。
而從行業受益的角度來講,開源OneVL,相當于降低了完成智駕研發的門檻。過去,一個車企要自研端到端大模型,至少需要幾百人的算法團隊、上億的算力投入、兩到三年的研發周期。現在,任何車企都可以基于OneVL做二次開發,研發周期與成本都可大幅縮短。
![]()
智駕能力被加速研發普及,削弱了頭部車企的護城河,變成了所有玩家都能擁有的基礎能力。當技術不再是壁壘,真正的競爭就轉向了數據、工程化能力和用戶體驗。而這些領域,恰恰是小米的優勢所在。
決定開源最終走向的關鍵變量
技術層面的突破已經足夠清晰。但OneVL開源最終能產生多大影響,取決于兩個關鍵變量。
第一,社區生態能否真正建立起來。開源不等于生態。舉例來說,Linux之所以成功,不是因為代碼免費,而是因為全世界的開發者都在為它貢獻代碼。小米能否吸引到足夠多的車企、Tier1,甚至高校和獨立開發者參與到OneVL的迭代中,是最重要的變量。
第二,車企是否愿意采用。自動駕駛涉及安全,任何一個決策失誤都可能造成嚴重后果。對于其他車企來說,用開源的智駕模型意味著把最核心的行駛安全交由別人掌控——而且這個"別人"還是直接的競爭對手。車企的信任度和接受程度,將決定OneVL的普及速度。
![]()
小米開源OneVL ,打破了自動駕駛領域 “閉門造車” 的傳統格局。這是一次將行業競爭從“技術壁壘”引向“生態共建”的嘗試。生態與接受度的綜合結果,將在很大程度上決定OneVL能否真正成為改變行業的里程碑。
![]()
牟經理
82194940/15801346927
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.