周三,ISCA 2026會場,一群來自Google、Meta的計算架構研究者中間,站著一個來自中國車企的演講者。他展示的是一顆已經跑在量產車上的芯片。臺下有人低聲問旁邊:“他們不是在造車嗎?”
這份困惑,李想四年前就有預料。2021年理想開始論證自研芯片可行性時,外界反應差不多。2022年項目正式立項,團隊從第一天就定下規矩:不碰改良路線,不做克隆方案。“從第一性原理出發”成為一個200人專項團隊四年工作的起點。
![]()
他們的成果叫馬赫M100。這顆芯片在ISCA 2026上以《面向通用AI計算的編排式數據流架構》為題亮相。ISCA與MICRO、HPCA、ASPLOS并稱全球計算體系結構四大頂會。自2020年設立工業分區以來,沒有一家中國車企站上過這個講臺。
馬赫M100的核心參數:5nm車規工藝,單芯片算力1280TOPS,算力利用率做到82%。內存側搭載8通道LPDDR5X,峰值帶寬273GB/s。CPU配備24核ARM Cortex-A78AE處理器集群。這些數字背后是一套完全不同于傳統GPU的架構邏輯。
傳統GPGPU靠指令驅動。計算單元要的數據,得先從全局內存搬過來,算完再搬回去。模型規模越大,搬運瓶頸越突出。李想此前解釋過:數據流架構把邏輯顛倒過來,讓數據驅動計算,計算單元之間直接傳輸數據,搬運環節被大幅壓縮。這意味著更高的有效算力,而且架構完全可編程,不是把算法焊死在ASIC里。
架構重構圍繞五項原則展開:數據流執行模型、無Cache內存層次、張量粒度ISA、軟硬件復雜度均衡、分層Tile互聯。安全冗余設計采用雙SoC、雙MCU、雙供電架構,滿足ASIL-D最高功能安全等級,任意單點故障不影響系統運行。
理想在ISCA現場傳遞的信號很明確:這不是一份前瞻報告。馬赫M100已經隨全新理想L9和L8量產上路。從架構設計到整車前裝交付,全鏈路自主完成。這條路徑,李想和他的團隊走了四年。四年前開始論證,三年前正式立項,如今芯片跑在車上,論文登上頂會。
回看那個會場里的疑問,答案或許藏在他們的一開始的選擇里。當大部分車企在采購和適配之間做選擇時,有人決定從頭定義AI進入物理世界的方式。不過李想本人的表述更務實:這顆芯片的誕生,是一個正常的研發周期走完了全程。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.