“龍蝦”時代,大模型上車,只會聊天已經不夠了。
這是騰訊云智慧出行,在北京車展前夕給出的最新判斷。大模型真正的價值,是替用戶把事辦了,比如點餐、停車繳費、路線導覽、場景陪伴、生態服務調用……它更像服務員、導游、助理和陪伴者,負責理解你的歷史、偏好、場景和需求。
要實現這一系列功能,離不開車載Agent,但Agent上車,不是把手機App搬進車機,也不是把Chatbot塞進座艙,而是讓車從“能聽懂人話”,進一步變成“能替人辦事”。
受訪嘉賓:
- 鐘學丹 騰訊智慧出行副總裁、騰訊智慧出行負責人
- 李博 騰訊智慧出行副總裁
![]()
提問:學丹總,我們看到今年以來艙駕一體是一個趨勢,昨天有輔助駕駛的供應商發布了艙駕一體的方案,我們看到很多趨勢很多主機廠智駕部門把座艙業務并入到了智駕部門,騰訊會不會感受到這些來自友商的危機感,會不會擔憂被智駕的供應商搶走市場,如何應對?
鐘學丹:昨天大家應該也看到了,在芯片有艙駕一體,今天講的時候,我也講到地圖也是艙駕一體的地圖,在導航地圖里面把智駕融入進去。今天大家看到很多車還是兩塊屏,智駕屏一塊、導航屏一塊,通過融合可以讓用戶更好地去理解在智駕場景或者周邊環境和圖的理解上有更好的認知,從技術的角度來講有一定的融合點。這個融合更多體現在導航、跟圖和智駕有強相關的業務場景下,有很多場景其實還是會更多是底層的數據和感知能力上,是不是可以有更好的復用機會。主機廠直接操作的,我理解應該還是少數,這是第一。
第二,艙和智駕有很大的不一樣,今天講了很多場景化的智能體,每個智能體對應成現實中的人,比如點單可能就是一個服務員,想到就是一個導游,智駕像一個司機一樣,幫助我們去完成開車的場景。對于開車的服務,我們更像托管式把它交給了它。回到座艙角度來講,用戶跟座艙和車的互動個性化可能更多,用戶需要的記憶點更多,它更多需要去理解用戶的歷史和場景、性格和不同的方式。從發展的角度來講,座艙結合AI之后會有更多的個性化呈現,更好地體現每個車的特性以及每個車和用戶之間跟個性化的關系。
《證券時報》:學丹總您好,有兩個問題。
第一,從過去的軟件定義汽車到現在的AI定義汽車,在這種趨勢下能分享一下騰訊的智慧出行在組織架構、技術底座和生態合作上做出哪些調整?
第二,現在推進智能體上車的過程中,大家對安全和用戶的隱私問題比較關注,請教一下這方面騰訊是怎么考慮的?
鐘學丹:確實在每種技術變化的時候,對主機廠的沖擊很大,我們作為一個助力者來講,我們在技術和底層實現上做一定的調整和增強。比如我們去加強在算法模型或者AI Infra人才的引進和能力的增強。更大的變化來自于生態的合作形態,我今天也講到,之前我們以應用為中心的時候,各個應用相對來說比較獨立,去解決特定領域的用戶需求。實際上我們通過AI的方式,用戶的需求可能是跨領域,更多服務于場景化的需求,這時候需要更開放的生態合作機制,我們今天發布這樣一個平臺,希望能把底層的平臺能力、生態能力以及第三方的生態能力如何更開放地接入和融入,給用戶創造一種更極致和融入的體驗方式。
涉及到剛才提到的智能體的安全性,這個是非常重要的核心,車的安全駕駛本身就是很重要的點。一方面智能體會使我們駕車本身的安全性有一定的提升,它更多與自然的交互方式,省掉原來交互方式帶來駕車場景下的安全性風險。智能體是不是更可控?我剛才講到為什么現在的智能體跟半年前有很大的不一樣,更多是工程范式的演進,比如Harness Engineering這樣的工程范式對智能體的約束和管控,使得它可以有更好的穩定性輸出,不會有很大的波動點。第二,安全性通過一些沙箱機制,把數據、用戶的操控掌握在合理的范圍內去做處理,這個也是在智能體上車中要去加強的點。
《南方日報》:學丹總,今天我們看到智能體座艙的展示,里面有很多功能,其中有一點在停車場自動繳費的功能,我在商場消費的時候可能有停車優惠,但是繳費是用微信支付的,這里面有一個問題,這些智能體之間的生態有沒有連通?在車里面的智能體生態連接到微信或者騰訊更多的生態,讓它更聰明地知道停車的時候用了微信支付在商場消費,可能停車費不用給了,或者在其他方面像點外賣或者點飲料的時候會有一些微信優惠,這個智能體是不是有更多打通微信生態的鏈接在里面?這是第一個問題。
鐘學丹:首先,這種生態確實會,包括剛才演示的停車場也是跟生態合作伙伴合作的基礎上,并不完全只是微信支付做這件事情,停車看起來是簡單的事情,但是如果打開來看,背后的商業邏輯也好,服務鏈路也好,服務的復雜性也好,不同的停車場停車服務實現的方式也好,都有非常大的差異,它不太可能是完全所謂的標準化就可以去解決問題。今天發布開放平臺,希望更多的合作伙伴或者生態合作伙伴能以更輕量級的方式進到這個平臺上,可以更好地讓服務的體驗更閉環。我們做自己擅長的能力,但是很多生態合作伙伴有他們特別的專長深入領域,我們更多跟合作伙伴去合作,再給用戶帶來便捷性的時候,不傷害他們的商業價值,甚至通過流量的方式給他們帶來更多的商業收益,這是我們希望平臺能夠給大家創造的條件和空間。
![]()
《南方都市報》:今天我們發布了好幾個Agent上車的場景,包括麥當勞痛車非常有意思。最近行業有很多Agent上車的發布,包括接下來車展也有一些重點發布,您認為當前座艙Agent到了規模化落地的階段嗎?這個階段據你觀察行業里面有什么特點?大家重點布局的場景有哪些?
鐘學丹:至少我看到的行業大家都在往這個方向上去演進,車企從系統層跟模型的結合,大家去了解的話,會看到在這個維度上其實跟原來的座艙系統是很不一樣的,這個是很大的變化,這也是一個很重要的趨勢。
智能體上車是不是可以規模化?它的規模化取決于幾方面:
一方面來自于車企本身的系統平臺形成,如果這個平臺不形成的話,那它的規模化可能就會受制或者說有一些弱化,不是完整體,可能只是一個點。
第二,怎么讓用戶在使用場景當中形成用戶體驗上的改善,這個也是智能體長期致力于的事情,不是照搬某些應用,把它變成對話就叫智能體了,智能體是結合場景的需求去重塑體驗。
為什么最開始我們也會做一些智能體覆蓋這個場景,需要去開發出更多的樣本讓大家看到這個東西怎么去發展,相信這個也會引導智能體更好地去推廣,大規模成長很重要的基礎。
蓋世汽車:我們今天發現智能體平臺核心的亮點就是完成從對話向執行AI決策轉變,為什么會在當前這個時間節點推出這樣一個產品?今年北京車展有很多車企和供應商都發布了類似的產品,包括榮威、大眾、火山引擎不斷在講AI升級或者AI智能體,相比它們,騰訊出行的優勢是什么?今年AI上車有哪些趨勢?是不是都是對話向執行轉型普遍的趨勢?
鐘學丹:這是一個大的特點,從對話到執行依賴兩件事情,第一件事情是技術底座的能力,車載語音對話已經很多年了,我前面講到,大模型上車第一件事情是在解決對話的優化和體驗的改善,但是它要變成可知性的話,需要對模型的能力,本身Agent能力的進化,這個也是最近半年模型能力進化的點。最近半年像Harness Engineering工程化的能力幫助我們可以做穩定執行的輸出,這個不僅依賴于模型,還依賴于工程化的能力。Agent底層的工程能力對這個要求也非常高,工程能力的進化和模型能力的進化是基礎的技術條件。第二個條件,要有好的生態連接能力,如果我們具備能力了,但是想執行的時候發現什么都用不了,可能也會很難。
在模型工程上面騰訊最近做了很多升級,春節后大家看到龍蝦養蝦,體現騰訊在工程的響應能力和工程實現能力的優勢,這個優勢使得我們在模型穩定輸出的基礎上變成穩定輸出上。第二,生態連接上我們有廣泛的生態合作和基礎,打通生態的能力比其它更有優勢。
李博:我再補充一點,過去一年大家看到這么多大模型上車,其實很多時候有很多概念,究竟解決了哪些場景問題,這也是騰訊有別于其它思考的問題。本質上大模型很多時候是解決不了問題的,要依賴于Agent的場景化解決對應的問題,我們把很多精力放在對應的Agent和連接到我在微信小程序場景能夠去落地解決客戶什么樣的問題上,我認為發展到今天這個階段,單純的大模型其實已經沒有意義了,過去一年鼓吹大模型很多,實際沒有解決任何問題,不如手機上可能直接問一下元寶會解決問題更多,沒有區別,也不需要這個東西遷移到上車。在車上肯定是基于車的傳感器信息、車對應的功能,以及對應跟車結合相關場景的Agent落地,才有更多的意義。
提問:現在國內的車企有兩大趨勢,一個現在很多中國車企正在為進軍海外市場做布局,包括引入國內的產業鏈和智能開發優勢。同時很多國外車企反向利用中國的智能化開發的優勢反向輸出到國外,在這個大的趨勢之下,騰訊智慧出行如何把握這個機會,如何開展這項行動?
李博:剛從出海論壇過來,我來回答這個問題。騰訊原來在國內的時候正在承接一個平臺或者連接性的作用,在出海我剛才講了,我們構建了一系列的海外研發平臺和生態接入平臺,也是為這一點。今天中國車企出海可以看到利用的是極致的性價比,以及原來在新能源領域所積攢的能力,要走得更遠,要發揮出原來在國內智艙、智駕兩個核心的優勢。在智艙領域把本體化的內容融入到車企的海外座艙域里面,需要聯合更多的像解決海外的地圖問題,也需要聯合類似于TomTom、HERE解決問題。
從智駕域來講,2025年60%已經支持L2以上的輔助駕駛,出海的能力還沒有。我們原來在國內的智駕地圖優勢以及我們跟這么多智駕公司的合作優勢,輔助到車企出海的鏈路上面,年初多家已經在合作,包括車企海外的智駕訓練、海外的智駕圖接入訓練中。
![]()
電場:我有兩個問題請教。
第一,現在駕艙融合是大勢所趨,對下一代的交互設計會產生什么影響?
第二個問題,一些合資車型在智能化上略慢于自主品牌,騰訊在這個生態里面有沒有感受到合資車型在智能座艙上有沒有什么激進的需求?
鐘學丹:展開來說比較漫長,大家會看到,對于智駕到座艙,不管是VLA還是世界模型,怎么讓用戶和智駕更好地相互理解,交互本身就是在變化的點。
一方面通過語言的溝通交流,像人與人之間的溝通交流去理解,可能更直觀的一些是來自于通過圖的形式。這次我們會有駕艙一體的圖,想幫助大家更好地去理解自動駕駛的車在路上怎么開,用戶可以直觀感受到,他的意圖可以通過圖更好地傳遞給智駕,對于交互的改善會很有幫助。這是第一點。
第二,座艙向多模態演進的時候,也會使得原來基于大屏觸控的交互和語音加觸屏交互轉向多模態的交互形態,這個還會有比較長一段時間,不一定是我們理解用戶去主動發起,雖然我們看到很早以前有一些手勢的交互,其實很多交互像模型去理解上下文一樣,通過動態感知之后把上下文直接給到了模型,并不是一定要用戶去做輸入,才有輸出的過程。這種交互處于比較早期,還很難說它一定會是什么樣,但是會看到很多改變模型的變化,使得所謂的交互就是上下文的不一樣,這個是很大的點。
第二個問題,對于合資也好,自主也好,大家去看他們的時候可能覺得他們有很多不一樣,有燃油車的時代所存在的一些印象,特別在新能源他們可能會相對滯后一些。大家去看他們的速度也在持續加快,技術和演進以及產品力的演進逐漸也會往大家共同發展的路徑上去走,很難說他會是怎么樣一種選擇。
提問:兩個問題。
第一,我理解的Agent能力其實更多是我給你一個任務,你要自主判斷、自主規劃、自主執行、交付成果,現在在車上很多時候是我來發任務,智能座艙理解理性,這個角度來看,用的是AI的能力而不是Agent。我理解以后一個Agent如果給我很好的體驗,我可能坐上車之后,孩子坐在后排,我告訴它幫我哄他睡覺,剩下的事情都歸它做,它解決白噪音,同時避免我能聽到,要不然他沒睡著我先睡著,更多時候發揮Agent而不是AI的能力。這種自主規劃、自主判斷、自主執行要有清晰的邊界,否則一出了圈,別說幫我的忙,可能嚇我一跳。這種情況下,騰訊如何考慮在Agent自主規劃、自主執行、交互成果方面的邊界到底在哪兒?
騰訊的生態非常豐富,我們現在看到都是想辦法把各種各樣的生態放到智能座艙的平臺里面,在一開始做頂層設計的時候,我們有沒有考慮過有什么樣的生態板塊絕對不會放進去?以后Agent干嗎需要我們探索,現在有沒有劃一條紅線,它到底不能干嗎?比如永遠不讓它去碰車控,打個比方,設想很美好,用微信給車載微信發一個信息,要操作車外燈光做一個什么歡迎儀式,它就需要去碰照明系統。這個以后考慮就是不能觸碰的紅線,這只是我的一個假設。我們現在有沒有紅線,什么功能不能碰,什么功能不能上車?有什么不能隨便擴展?
李博:首先行車安全一定是紅線,實際上我們跟車企合作過程之中,也把模型這個事情做切分,有一部分放在端側,端側一個是及時響應,第二個要滿足基礎的行車安全,凡是涉及到安全性的一定要慎重,你的語音控制、誤操作等等,如果判離已經涉及安全底線就是無效反饋或者去做double check怎么去做,這個東西不應該是交給更復雜的Agent來去做,應該有一些端側底線性的判斷邏輯在這里面,或者物理層級的模型在控制,這個是騰訊最紅線的。騰訊很多時候做對應的Agent,更多是滿足用戶的應用需求,車控的東西還是基于TSP體系,安全這個東西不是我們互聯網公司過度去涉足的,那個由車企(去做),我們把AI的能力、Agent的能力提供給車企,在行車安全領域里面車企的經驗足夠,不應該是我們來指導他,反而我們在輔助他怎么樣做好,利用AI的能力做好更多的安全和防護。
第一個問題,為什么我依賴于Agent的能力而不是AI?Agent本身就是AI的能力,現在很多東西做不了的原因,我們所有的AI是基于數據的,哪怕龍蝦,還是要有記憶,有上下文,才能理解知道你的喜好是什么,知道我該去做什么樣的執行,否則冷啟動的時候很難做到我們想象當中符合我的點。包括它感知到了,它也不能你最喜好的是什么。這是一個過程。數據為AI的基礎,首先要有準確的數據,能夠把握用戶的喜好,然后才有對應的生態,能夠執行它的喜好,是這樣一個過程。
鐘學丹:我補充一下,今天可能有些演示上大家看到很多是用戶主動發起,有些并不是主動發起,包括做向導,本質上就是在你開車的過程中陪伴式的,不需要你去問它,它會更多根據場景去觸發這個地方我發現有好玩的地方要不要考慮?
另外,今天的Agent還是受限于上下文,如果看時長,說一些長時長或者長上下文的應用在車上肯定是短時間不可能實現,它的成本和代價都會非常高,而且體驗也不會好。我們在選擇的時候,更多以相對短鏈路的服務體驗去看,比如訂餐,相當于短鏈路,可以快速完成快速形成服務的方式。
提問:Agent上車之后會對座艙芯片和之前有什么不一樣?為什么Agent還是在應用層去做,而不是在系統層,有一些Agent廠商認為Agent上車之后會是車載OS的操作系統,整車智能體的操作系統,你們怎么看?
李博:為什么我們認為是偏應用的?整車系統就像上一位提到的,以安全為底線,這個事情把一個車的最底層系統級的東西交給互聯網公司或者交給一個Agent,在未來階段可能性更強一點,但是在現在這個階段,我認為還是由車企或者車規級的芯片廠商做對應的主導。所謂Agent OS也好或者什么也好,到底最終實現的功能是什么?還是回到應用場景,我們可以有很多概念,但究竟給用戶給車主,給乘客帶來什么,還是回到應用。騰訊基于這一點,我擅長做什么,騰訊最擅長于做對應的比較好的用戶交互、對應的應用、給用戶鏈接生態,騰訊定位很清晰有所為有所不為,我們幫助用戶解決場景問題,解決他的問題,而不是做多么宏大宏觀的東西。
提問:Agent上車會對車載芯片提出什么樣的需求?
李博:分兩種,一種肯定是算力的要求,現在Agent上車,有一部分需要端側有一定的算力能力、推理能力。現在來講最基礎的布2B、3B的模型,到后面7B、8B、14B,逐步需求提升,所有對應的模型都要消耗tokens,如果端側有更強的能力,一個是及時響應的東西,另外對車企節省對應的消耗,這里面模型的參數相對更多,能力更強一點,會有這個要求,趨勢一定是這樣的。端側算力越來越強,對應端側模型的能力越來越強。我們認為更復雜的場景一定還是云端的,無論是云端的200B、300B、700B等等,復雜場景一定依賴于云端,端側是沒有能力的。
提問:我有兩個小問題。雖然最近大家都在講Agent上車,無論是這兩天的發布會還有整個車展,是一個大的趨勢。從大家講Agent上車到真正的Agent上車落地能給用戶提供很大便利的周期需要多長時間?怎么避免大家談起來很繁榮,但是到用戶側永遠沒有辦法感知到這個事情?這是第一個問題。
鐘學丹:這個周期還是取決于車的平臺和它的上市會有一個周期,一些新技術的落地跟這個強相關,主要看車的平臺和這個點。
第二,任何一種新的技術和發展可能需要一個持續的進化過程,如果一開始就很驚艷把所有的都做好,可能還是會有比較大的挑戰。我們看到一個好的地方,用戶包括今天很多普通用戶AI的普及速度為什么這么快?跟用戶的交互體驗門檻比較低,今天Agent跟用戶交互互動的門檻相對也比較低,這點其實有利于Agent持續變好獲得用戶更好的認可和體驗,或者說服務和體驗變好很重要的因素。
提問:第二個問題是關于艙駕融合,無論車企還是一些供應商主動打破艙駕的區隔。對于騰訊來說,后續會不會車廠對于艙駕融合要求越來越高,出現被迫把業務越做越厚,在艙和駕駛方面投入更多,把這個東西做得更龐雜?
李博:車企的艙駕融合我們看到現在分兩塊,一塊是芯片廠商把艙駕芯片做融入,第二車企原來的組織形式,越來越多的車企原來座艙和智駕是兩個部門,現在進行合并。對于騰訊來講反而是好事,騰訊原來在智艙和智駕都有對應的投入,原來做的反而是割裂的,這邊做一點,那邊做一點,包括智駕圖和導航圖原來的選定不是同一個,還要做異源匹配等等。合并到一起,從需求定義角度來講,從更好的用戶體驗角度應該是什么樣的體驗,把兩種特性結合起來做出更好的用戶需要,反而不是我們做得更厚,而是把這塊拉通得更好,能夠做得更順,更符合用戶的交互場景和需求。
提問:我有一個小問題,今年從養龍蝦到后面卸載掉小龍蝦,因為Agent門檻很低,很容易成為紅海,今年車展可能也會成為這個紅海的一部分。我們怎么避免卸載掉小龍蝦這種情況也在車里面出現,我們好不容易才把它搬進來,怎么避免又回去了?
李博:這里有一個共識,我并不認為養龍蝦是門檻很低的,我自己從無到有訓練龍蝦,從很傻的龍蝦到慢慢幫我去做事,我講一個案例。最開始去訓的時候,我的龍蝦在辦公電腦上,有一些證件照等等,我說“把我兒子的小白條發給我”。它說“好的,我找到了,在XXX位置”。我說“你發給我”“不好意思,我忘了發給你了”。養龍蝦是相對門檻不是那么低的,你需要不斷給它需要的Skill,對于權限的控制蠻高,比如給它RM權限,它把你的C盤給你格了,把一些文件給你刪了。我并不認為它是門檻相對低的,但是它有一個好處,它真正能夠幫你去把一些繁瑣的事情,有邏輯性的事情給你簡化,幫你去執行,并且它有很強的點,跨端你在手機端作為管道,通過企微或者微信可以本地端部署到龍蝦,或者云端龍蝦進行協助。這個事情一定是正向的,但它具有一定的門檻,對于龍蝦有一定的理解,甚至你有很多個龍蝦進行協作,其實有門檻,怎么用好它,用好你自己的數字分身,要去訓練它,并且在這個過程之中要有足夠的耐心,有可能開始的時候很傻,最后變成幫助你。
我們沒有講龍蝦上車,而是Agent,Agent解決一個場景化的問題去做的,龍蝦上車就回到一個很核心的問題,它的能力在于啥?你賦予它的權限在哪兒?在電腦上來講,我們給它幾個權限,比如瀏覽器的User,可以操作瀏覽器,可能有一些文件查找的權限,在車上到底放到什么權限?這是一個底層安全思考的問題。短期之內沒有解決好核心的安全問題和權限區隔問題,它不是一個特別好的狀態,把龍蝦直接搬到車上,可能有不同的形式,未來有特別好的形式能夠上車。比如它可以跟微信手機集合,通過微信蝦的管道到云端,有一個云端的蝦,云端的蝦經過安全處理等等可以把一些指令下發到車,形成一定的Agent應用,而不是涉及到遠控車能力等等,可能跟我們設想中比較靠譜落到實處,并且沒有安全隱患的狀態。
要糾正一下,下載蝦這個事情,可能很多人第一沒理解,第一可能有些人沒有用,只是嘗鮮的居多。我也看到有很多人安完蝦之后落灰在那里也不用,沒有跟你實際的工作產生關聯度,用得好的,從郵件、會議編排上等等還是給予我提高了非常大的效率,對于業務的管理、人員的管理上我切實感受到這里面給我帶來大量工作效率的提升。
提問:今天車內外的數據車企已經開放給我們了嗎?我們看到Agent更多是對話的方式。
李博:這些是傳感器數據,核心掌控一定是車企,車企要掌控這些數據,至于用這些數據做哪些應用,騰訊可以提供能力幫助他們做這些事情。那么多攝像頭,在中國會有隱私保護法,在海外也有隱私保護法,第一要做的就是脫敏脫密,這個事情到底有哪些應用,每項應用攝像頭采集數據的應用都應該是在合規、隱私保護的前提下做應用,并不能濫用。我們原來有很多車企做了守衛模式等等,守衛模式對于人臉、車牌都做模糊化處理,就是因為隱私保護和合規的情況下再去做應用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.