撰文| 胥 植
編輯| 吳先之
“每18-24個月,集成電路晶體管數量翻一番,對應性能提升一倍、成本下降一半”,經歷半個世紀驗證的摩爾定律,在十年前開始放緩。背后的核心原因在于3nm/2nm工藝下晶體管尺寸逼近物理極限,經濟成本、功耗與散熱也同步形成制約。
早早意識到這一點的英偉達,通過并行架構和全棧協同優化實現了加速計算的范式革命,從通用到專用,成功創造“黃氏定律”,達成AI算力10年1000倍的增長。
經歷幾年狂奔后,如今智能輔助駕駛行業也站到了相同的關口:過去靠堆算力、堆傳感器、堆數據的“線性增長”模式已接近天花板,邊際效應急劇遞減。
其中最為典型,也最類似摩爾定律的是算力效能瓶頸,同樣對應物理、經濟、功耗的三重極限,即在多重約束下,算力往往很難發揮對應的有效能力。
2月底,理想汽車MindVLA團隊與國創決策智能技術研究所聯合提出的端側大語言模型“軟硬協同定律”,核心是用數學方法讓AI模型與硬件從一開始就深度匹配,從而讓產品更強更快更省。
![]()
對于理想汽車自身而言,定律進一步完善了“芯片-算法-模型-應用”的全棧自研閉環,是其構建智能輔助駕駛的基石,也為具身智能夯實了地基。對于行業而言,理想汽車的此次探索提供了可復制、可量化的軟硬協同設計框架,或將帶來成本控制與效率表現的一次躍遷,推動行業從“拼算力”轉向“拼能效”。
打通芯片與算法的“任督二脈”
突飛猛進的智駕市場,算力正在進入兩難“悖論”,一面是全面邁向百億甚至千億級參數的模型,對于算力的需求呈爆發式增長,一面是受成本和功耗等剛性約束,實際有效算力利用率極低,尤其是通用芯片,往往高算力并不等同于高性能。
這主要源自軟硬件兩側的“割裂”,例如基于通用芯片去寫算法,或是寫好算法后再去找能跑的芯片。以過去幾年中高端汽車產品主流采用的英偉達Orin-X為例,由于不適配原生Transformer,根據行業經驗來看,其有效算力常常遠低于峰值,算力浪費嚴重。
這也讓眾多玩家開始逐步陷入“堆算力不劃算,不堆算力又做不出好的智能體驗”惡性循環——如何讓有限的芯片資源發揮出最大的效能,開始成為行業競爭的勝負手之一。包括英偉達、谷歌等國際巨頭,都在關注并研究“協同設計”下的研發方案。
“軟硬協同定律”的誕生,來自于理想汽車在實踐中發現的問題。在上一代基于英偉達Orin或Thor車載計算平臺部署大語言模型時,理想汽車踩到了無法物盡其用的坑,模型架構往往無法充分利用硬件特性,而為了硬件適配做出的妥協又可能損害模型智能。
需要指出的是,理想汽車的協同設計并非一項技術,而是一種研發范式,或者說是一套數學框架理論。這項工作提出了一種面向車載與邊緣場景的大語言模型硬件協同設計方法,通過結合損失函數擴展法則和Roofline性能建模,實現模型精度與推理延遲的聯合優化。
![]()
定律將算力、內存、帶寬、功耗等物理約束,與精度、速度等模型智能需求放入同一個數學公式里,通過帕累托最優LLM架構搜索框架,自動得出模型架構方案的“最優解”,例如在不超功耗的前提下,模型設計成多少層才最合適。
簡單來說,定律既不讓軟件遷就硬件,也不讓硬件遷就軟件,而是用數學方法讓兩者“天生匹配”,這等于打通了芯片與算法的“任督二脈”,能夠最大化挖掘出芯片的實際能效,不堆算力也能獲得優秀的智駕體驗。
這對團隊組織架構提出了更高要求,需要打破過去軟硬件隔離研發的“組織壁壘”,讓芯片和算法從一開始就緊密協同合作,以可控的成本最大化硬件效能,并在這一基礎上實現模型性能的越級提升。
基于定律的研究和工程實踐,理想汽車還進一步提出多個“反共識”的發現:MoE稀疏架構將取代密集架構成為車載AI標配、內存帶寬和緩存效率比理論算力更重要、芯片需要動態變化以支持不同階段截然不同的需求、傳統Transformer的4倍FFN擴展比已被證明低效、INT8量化加速提升實際遠低于理論預期。
匯總的結論是,芯片與模型架構都不能一成不變,沒有通用萬能芯片,只有軟硬合一定義出的場景最優芯片。
從經驗調優到工程方法論
基礎理論的研究突破,最終需要落到實打實的產品體驗和競爭力提升上。
“軟硬協同定律”的顯性價值是加強模型性能,隱性價值則是經濟成本、研發周期、應用迭代效率三個方面的全面提升,這在“與時間賽跑”的智駕競爭格局中顯得尤為重要。
首先是硬件成本的降低。盡管國產芯片正在逐步拉低均價,但芯片仍是智駕硬件成本的“大頭”之一,在算力需求持續上行的趨勢下,高端通用芯片的成本占比還在進一步提升,例如英偉達Thor芯片價格就超過1萬元。
![]()
在定律的指導下,模型可以更好地適配芯片的物理,從而避免模型固化下芯片無法充分釋放性能的浪費。換句話說,如今無需盲目采用高端芯片,也能提供同等級的智能體驗,“降成本不降效能”。
其次是時間周期上的縮短。在傳統模式下,芯片升級和模型更新是一項復雜的工程,需要研發團隊進行設計和選型,同時還要反復試錯、調參,周期往往花費數月。定律通過數學公式快速得到最優架構,理論上最快只需一周即可完成設計和驗證,大幅提升研發效率。
而在應用場景中,定律也能根據場景的輸入出處參數,快速選出最適配的模型配置,減少了后期反復調優的麻煩,大幅縮短應用開發周期。
![]()
定律的價值并不局限于理想汽車自身,基于長期的開源生態,目前理想汽車已經公開了定律的框架與核心公式,有效填補了車載AI領域的理論空白,為行業帶來了一份工程指南,也探索出一條AI時代降本增效的新路徑,進而推動中國產業從技術跟隨者向規則定義者轉變。
一場范式革命正在到來,芯片-算法-整車的協作關系正在重構,行業將從“拼芯片、拼算力”的初級階段,逐步進化到“拼協同、拼能效”的良性循環,更加符合車規,也更加可持續。
最核心的一點在于定律從理論層面提供了一套可量化、可預測、可復制的端側大模型軟硬協同設計框架,以端側工程方法論體系,改變以往靠經驗、靠堆料的“大力出奇跡”模式——全棧自研有了可計算、可驗證、可迭代的科學依據,而非經驗試錯。
同時定律也為具身智能、邊緣計算等更多延伸場景,提供了通用的AI部署方法論,從生態開放角度推動整個端側AI產業的升級。
奔向下一階段的階梯
在深度內卷的國內汽車賽道,科研工作往往是容易被忽視的一點,但卻是理想汽車長期堅持的重心,旨在以更快的技術迭代速度,滿足用戶和市場需求的變化。
在核心技術自研戰略之下,理想汽車近年來持續加大研發投入,近8年研發總費用預計超近500億元,居新勢力車企領先水平。其中2025年預計研發投入達到120億元。
李想在AI Talk第二季中提到,改變和提升的第一步一定是搞研究,第二步是研發,第三步是把能力表達出來,第四步變成業務價值。簡單來說,理想汽車并不追求“絕對速度”,而是注重基礎的夯實,從2021年到去年11月,理想汽車圍繞BEV、端到端、VLM、VLA、世界模型等領域已經發表近50篇論文,被引用超過2500次。
“軟硬協同設計定律”正是理想汽車的一次技術躍遷,意味著其正在熬過漫長的投入期,開始加速步入收獲期:直接的成果是研發效率的提升、成本的降低、性能的增強;間接的成果是業務價值和競爭力的提升,進一步強化了自身壁壘。
理想汽車自研的馬赫100芯片,將是定律的一次可視化成果展示,或將助力其在功耗、成本、智能上全面領先,更好支撐起高級別智能輔助駕駛和具身智能。
李想在近期表示,全新一代L9 Livis版本采用馬赫100雙芯片,有效算力達2560TOPS,單顆有效算力約為英偉達Thor-U的3倍,在相同場景下,全新一代L9的輔助駕駛系統能夠實現更高幀率處理,顯著縮短系統響應時間。
![]()
全新一代L9是理想汽車的關鍵一戰,也是錨定“汽車=機器人”戰略的載體,李想在年前悄然將微信名后綴由“理想汽車”改成“Livis”,便足以證明其重要性和內部的重視程度。
從這個角度來看,定律不僅是理想汽車智能輔助駕駛的理論基石,在智駕全面奔向L3/L4時代時充當理想汽車的“加速引擎”;更是支撐理想汽車升級為AI公司的階梯,為“汽車機器人”這一終極形態打下了底層技術根基。
總體來看,理想汽車用數學定律實現了從“經驗”到“科學”的進化,其長遠意義遠不止于智能輔助駕駛,而是從自研芯片定義、智能座艙、全棧研發體系、具身智能戰略、成本與生態五大維度,一步步構建起理想汽車的技術護城河。
微信號|TMTweb
公眾號|光子星球
別忘了掃碼關注我們!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.