![]()
作者丨青風
編輯丨六子
“過去一年鼓吹大模型吹了很多,但實際上沒有解決任何問題。”
“今天手機端交互效率能做到85分到90分,座艙車機交互卻長期停在四五十分。”
騰訊智慧出行副總裁鐘學丹和火山引擎副總裁楊立偉,在最近舉行的北京車展上發表了類似的觀點。如果說上一屆車展的關鍵詞是“大模型上車”,那么本屆車展潮流的主角,則變成了AI Agent(智能體)。
從地平線的“KaKaClaw咖咖蝦”,到斑馬智能的AutoClaw;從中科創達的AquaClaw,到火山引擎的“汽車大腦”——往屆占據展板最醒目位置的續航里程、激光雷達、百公里加速等參數,如今已被Agent、龍蝦、智能體、艙駕融合等字樣全面取代。
過去的智能座艙追求“讓車聽懂人話”,現在則是“讓車把事辦完”。這場從被動響應,到主動代理的范式轉換,遠比換一塊更大的屏幕、加一顆更強的芯片來得深遠。
01
「從功能供應商,到系統定義者」
過去十多年,互聯網公司進入汽車產業,大多只能提供地圖、音樂、語音引擎等某一項能力。但智能體上車,正在打破這一格局——科技公司有望從邊緣的功能供應商,向更核心的系統定義者躍遷。
火山引擎的核心打法,就是做一個“統一的汽車大腦”。不同于行業普遍采用的“大模型+傳統語音架構”的拼接方案,火山引擎基于Agentic AI架構重構了整個座艙系統。
“能提供情緒價值很好,但首先要把事辦好,把基礎、高頻的功能做到足夠絲滑。”楊立偉在車展上表示,過去兩年大模型上車走了彎路,很多車企把精力放在了讓車機講笑話、背古詩上,卻忽略了用戶最核心的需求。
火山引擎的數據印證了這一點:在日均3000萬次交互中,車控占比53%、導航占比29%、媒體占比10%,閑聊類需求不足5%。
![]()
*圖源2026年北京車展現場
為此,火山引擎推出了兩種合作模式:輕量化的“AI座艙套件”供車企靈活選配,而投入資源最多的是完整產品形態的“豆包座艙助手”——它能與手機端豆包無縫打通,用戶在手機上訓練的所有偏好,上車就能直接繼承。
如果說火山引擎是“大腦派”的代表,那么地平線就是“整車派”的旗手。4月22日,地平線搶先發布了中國首個整車智能體操作系統“KaKaClaw咖咖蝦”,以及中國首款艙駕融合整車智能體芯片“星空6P”。
“星空6P”采用5nm車規級工藝,BPU算力達650 TOPS,通過統一內存架構與統一底軟,實現了“一芯雙用”。據地平線透露,這組方案能讓整車空間占用縮小50%、單車綜合成本降低1500至4000元、研發周期從18個月縮短至8個月。目前該方案已獲得大眾、奇瑞、比亞迪等十余家車企的意向量產合作。
商湯絕影走的則是純端側部署的路線。其首發的Sage Box千機智盒,內置了7B參數的Sage端側大模型,不需要連接云端就能完成所有智能體功能。端側部署不僅帶來了0.5秒級的響應速度,更重要的是,它能更好地解決云端成本問題。
商湯絕影負責人王曉剛算了一筆賬:一輛采用云端方案的車,每天的Token費用約30元,萬車規模下一年就是1.095億元。而端側方案一次性投入硬件成本后,后續幾乎沒有運營費用。
騰訊的優勢從來都不是模型,而是生態。本屆車展,騰訊發布了“出行全場景智能體開放平臺”,一口氣推出了7個場景化智能體;此外,斑馬智能(據天眼查,原斑馬智行)與阿里千問聯合推出了AutoClaw方案,主打多智能體協同;中科創達發布了基于OpenClaw架構的滴水AIOS 2.1;面壁智能則依靠輕量化的MiniCPM模型,在中低端車型市場快速落地。
02
「從“陪聊”,到“辦事”」
當所有廠商都在喊“智能體”的時候,一個核心的問題隨之浮現:智能體到底和傳統的語音助手有什么區別?為什么偏偏是2026年,智能體突然成了行業共識?
過去兩年,超過10家車企密集接入大模型,但用戶體驗并沒有本質提升。你說“打開空調24度”,它能聽懂;但你說“我有點冷”,它可能只會機械地問你“要不要打開空調”;你說“導航去公司”,它能執行;但你說“先去接我老婆,再去公司,順便買杯咖啡”,它就徹底懵了。
傳統車載大模型本質上是用一個更聰明的引擎替換舊的語音引擎:用戶問,它答,對話更自然了,知識更豐富了,但底層邏輯仍是回合制問答。而Agent是由目標驅動的:用戶說出需求,它能理解意圖、拆解任務、調用工具、執行閉環。
“KaKaClaw不只是長了一張嘴跟你對話,還長出了兩個鉗子幫你完成任務。”地平線創始人余凱這句話,概括了智能體與傳統語音助手的本質區別。
他表示,用戶不需要告訴車“先開導航、再開空調、最后放音樂”,只需要說“我要舒服地回家”,系統就會自動拆解目標、調度資源。它會結合當前的溫度、車速、你的歷史偏好、后排有沒有人在睡覺,自動做出一套組合決策——可能是開一條縫的車窗,加上調低兩度空調,再打開座椅通風。
![]()
*圖源地平線發布會
除此之外,智能體還完成了一個關鍵升級:從功能孤島,變成了系統中樞,它能跨域調度眾多車載功能和外部服務,不用再讓用戶在十幾個App之間來回切換。
而車內智能體之所以在2026年成為業內共識,源于幾個因素的交匯。
首先,大模型在意圖理解、任務規劃和多模態感知方面的能力,已能夠支撐復雜的車載場景;5nm車規芯片的發布使得端側高算力具備了部署條件。
特別是近期爆火的開源AI智能體框架OpenClaw(龍蝦),以其獨特的任務拆解和工具調用能力,為整個行業提供了一個可參考的技術底座。OpenClaw能夠讀取本地文件、操作瀏覽器、運行腳本、調用API,甚至拆解復雜任務并自主完成多步驟流程。這一技術特征決定了它不僅僅是“會思考的大腦”,而是具備操作能力的“數字執行體”。
其次,座艙競爭成為行業最大公約數。當新能源汽車滲透率逼近50%,三電技術的差異化紅利逐漸消退,2026年輔助駕駛技術路線也已趨于收斂、同類配置的駕駛體驗逐漸趨同,座艙體驗就成為了車企打造差異化競爭力的核心戰場。
智能座艙宣傳了很多年,但隨著AI技術的快速迭代,消費者當前對“智能”的認知和要求越來越高,人們已不再滿足于能聊天的車機,而是期待一個能辦事的智能助手。
03
「智能體上車的“最后一公里”」
智能體的出現,不僅將徹底重構人車關系,更給了互聯網公司一個千載難逢的機會——第一次,他們有機會從汽車產業的邊緣,走到舞臺的中央。
比如,當用戶習慣了豆包座艙助手,它就會像Windows之于PC、iOS之于手機一樣,成為一個不可替代的入口。這也是為什么火山引擎愿意“現階段不追求利潤”,投入上百人團隊去做標桿項目。
據行業研究報告數據,2025年全球汽車AI市場的規模已達188.3億美元,預計到2030年將增長至384.5億美元。另有數據顯示,全球汽車AI智能體市場從2025年的15.12億美元有望以42%的年復合增長率擴大至2032年的130.9億美元。
然而機遇有多大,挑戰就有多刺手。當目光從展臺炫酷的演示移向真實的商業落地,三道難以逾越的坎橫在所有玩家面前。
第一道坎是從能說到能干的工程鴻溝。打通底層車控接口的開放與安全架構,是Agent量產必須跨越的“最后一公里”。楊立偉將其工程難度概括為“只能硬啃”——他們用了三年時間,才把大模型可調用的車控接口從100多個擴展到1000多個,并讓模型能感知環境狀態、積累用戶偏好,最終獲得能主動識別、規劃和處理任務的能力。
第二道坎是仍在迷霧中的商業模式。算力和Token的持續消耗意味著真金白銀的成本。楊立偉在車展上明確表態“不追求現階段有多少利潤”,但當模式走向規模化,商業化是繞不開的重要一環。斑馬智能提出的“訂閱分潤”路徑提供了一種選擇,但用戶的長期付費意愿尚未經市場驗證。
![]()
*圖源北京車展斑馬智能展區
第三道坎是隱私與安全的緊箍咒。Agent之所以“懂你”,需要有記憶能力,能獲取并記住用戶的個人偏好和行為數據。但如果一位朋友上了車,車機AI會不會當眾提醒你上一次的就醫記錄?
此外,當Agent的能力從聊天,延伸至控車,任何一個“幻覺”導致的錯誤操作都可能是無法承受的生命代價。Agent的能力越強,安全邊界的劃定就必須越清晰。
火山引擎與榮威共同建立的彩色、灰色、黑色三級權限體系提供了一個參考:空調、座椅等舒適功能AI可直接調控,行駛中座椅調節等功能AI僅能提建議,剎車、轉向等核心駕駛功能則是絕對禁區。
更大的挑戰,是車企與科技公司之間的控制權之爭。一輛車有幾千個底層接口,這些接口是車企的命門。如果把它們全部開放給AI廠商,就等于把自己的產品定義權交了出去。這也是為什么很多車企嘴上喊著擁抱AI,實際上只愿意開放最表層的接口。
但無論挑戰多么艱巨,趨勢已經不可逆轉。2026-2027年,將是智能體上車的關鍵窗口期。汽車智能化的上半場,比的是誰的屏幕更大、芯片更強、激光雷達更多。而下半場,比的是誰的AI更能懂你、更能辦事。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.