![]()
作者 | 王秋鳳
3月2日,“THE FUTURE”為主題的小鵬汽車第二代VLA媒體體驗(yàn)日上,董事長CEO何小鵬宣布,第二代VLA將在本月開始全量推送。與其說是“第二代”,更像是另起爐灶。與第一代VLA的L2思路不同,這一次的VLA路徑,直通L4。
簡單說,第二代VLA拋棄了語言轉(zhuǎn)譯,V-L-A鏈變成更直接的V-A鏈。
解決L2痛點(diǎn),才能安心
傳統(tǒng)VLA模型遵循“視覺輸入—語言轉(zhuǎn)譯—動作輸出”的三段式邏輯。先將圖像等多種傳感器信息,都翻譯成文本,然后用語言模型去理解,生成指令,交給系統(tǒng)去執(zhí)行。一來一回,經(jīng)歷兩次語言轉(zhuǎn)譯,不但信息不可避免地耗散,而且會有比較大的延遲,通常在幾百毫秒的級別。如果處于時(shí)敏型場景,比如達(dá)到80公里時(shí)速,500毫秒就是10多米的距離,實(shí)施處置很可能來不及。
第二代VLA,解雇了“語言翻譯官”,從視覺及其他信息融合,到動作指令直接輸出。系統(tǒng)依靠“下意識”決策,這和人類面對時(shí)敏型場景下意識動作,如出一轍。其背后是專家模型,即建立在多年駕駛經(jīng)驗(yàn)之下的“優(yōu)解”。這么一來,肯定是快了。
![]()
至于小鵬的“下意識動作”準(zhǔn)不準(zhǔn),這就要回到當(dāng)前L2的痛點(diǎn)。
現(xiàn)在的L2級別的輔助駕駛,高速一套邏輯、城區(qū)一套邏輯、小路停車場又一套邏輯,實(shí)際上是個(gè)縫合怪,每次場景切換都可能頓挫、猶豫或退出,用戶體驗(yàn)不佳。
真正讓人頭疼的,是反人類操作:前方明明擁堵,車子卻不減速,快到跟前一腳重剎;窄路會車,車子既不避讓也不減速;與大車并行,不知道拉開距離,全程貼著走。
而小鵬的第二代VLA(準(zhǔn)確地說應(yīng)該是V-A),掌握了人類舒服的“分寸感”。在夜間沒有照明的小路上,系統(tǒng)能提前識別坑洼和障礙,主動減速繞行,全程無接管。和白天有清晰標(biāo)線的大路一樣,不用人操心。
路邊交警示意停車,系統(tǒng)能像人類那樣理解意圖,平穩(wěn)妥帖停到路邊。更令人印象深刻的是,一次測試中,后方傳來救護(hù)車的鳴笛,第二代VLA果斷打燈靠邊減速讓行。
![]()
這說明,聲音也作為外界信息,成為融合輸入的一部分,不僅限于視覺或者毫米波雷達(dá)數(shù)據(jù)。更重要的是,這些反應(yīng)不僅及時(shí),而且不是編程編出來的,這些能力是模型“涌現(xiàn)”出來的,即無須事先擬定規(guī)則,系統(tǒng)就能通過上億個(gè)視頻切片,領(lǐng)悟到這個(gè)世界的規(guī)則。
這在很大程度上解決了所有公司最為頭痛的長尾問題。場景是無窮無盡的,極端情況是無法窮舉的。系統(tǒng)如果能像人類那樣,只須憑借底層規(guī)則認(rèn)知和長期駕車的肌肉記憶,就能處理絕大多數(shù)此前未曾碰到的情況。
![]()
能力躍升為智駕T0檔
這種“分寸感”,以前為人類司機(jī)所獨(dú)有。L2系統(tǒng)極力擬人,但一到關(guān)鍵時(shí)刻就開始露餡,第二代VLA則解決了這一問題。這預(yù)示著第二代VLA建立了通往L4的框架。
這些能力的背后,是辨識能力的躍升。第二代VLA對夜間深色物體的識別率提升了72%——再也不怕黑夜里穿黑衣服的行人、無路燈路段的障礙物。路面障礙物識別能力提升124%,側(cè)后車輛識別能力提升118%,前車軌跡預(yù)測精準(zhǔn)性提升300%,夜間決策準(zhǔn)確性提升96%。窄路平均接管里程直接提升13倍,新手也能輕松會車、走窄路。
小鵬智駕中心負(fù)責(zé)人劉先明,給出了一個(gè)更震撼的數(shù)據(jù):第二代VLA的安全接管里程提升了50倍,平均接管里程提升25倍。這意味著,用戶每開50倍的距離才需要接管一次——從“時(shí)刻準(zhǔn)備接管”到“偶爾看一下就行”,體驗(yàn)天差地別。小鵬的第二代VLA,已經(jīng)跳出業(yè)內(nèi)“一線”的能力范疇,進(jìn)入無人可比的智駕T0檔 。
![]()
安全與效率兼得的背后
如果說“安心”解決了敢不敢用的問題,“能力”回答了能不能開的問題,那么“效率”則決定了用戶愿不愿意用。而效率恰恰是傳統(tǒng)智駕最難跨越的坎。
有的智駕給人的印象是“莽”,有的則過于保守。遇到加塞只會讓行,調(diào)頭慢吞吞、堵住后面一長串車。
第二代VLA風(fēng)格拿捏得當(dāng)。在廣州晚高峰實(shí)測中,導(dǎo)航軟件預(yù)估44分鐘的路程,第二代VLA只用了43分鐘,比人駕快1分鐘;而傳統(tǒng)L2智駕跑了48分鐘,投入運(yùn)營的Robotaxi用時(shí)更長(顯示策略更保守)。
小鵬官方給出了一系列效率提升的數(shù)據(jù),其中最關(guān)鍵的,莫過于綜合行車效率提升23%。在擁堵的大中城市街道,這是所有駕駛者夢寐以求的能力。甚至比專車司機(jī)開的還好。
何小鵬說:“好的智駕應(yīng)該像坐電梯一樣,按下啟動鍵,就能夠從家里到達(dá)公司。”沒人關(guān)心電梯怎么運(yùn)行的,只管到?jīng)]到,這才是“國民智駕”的本質(zhì)。效率提升的背后,是決策邏輯的重構(gòu)。
![]()
當(dāng)前智駕行業(yè)正站在關(guān)鍵分水嶺:一邊是基于L2能力持續(xù)“小修小補(bǔ)”,在有限邊界內(nèi)迭代體驗(yàn);另一邊是推倒重來,以L4為目標(biāo)從底層重構(gòu)技術(shù)框架。小鵬選擇了后者。
第二代VLA的核心突破,就是系統(tǒng)的思考過程,變成一種類似人類的下意識反應(yīng)。
這套架構(gòu)的投入是驚人的:3萬卡算力、20多億訓(xùn)練費(fèi)用、50PB訓(xùn)練數(shù)據(jù)。從2025年科技日至今,已迭代468版模型,平均一天迭代4版。自研圖靈AI芯片單顆可提供750TOPS有效算力,基座模型編譯效率提升12倍。
在訓(xùn)練數(shù)據(jù)規(guī)模已經(jīng)很大的前提下,意味著通過不斷迭代,就可能達(dá)到L4,同時(shí)具備跨場景泛化能力,具身智能、飛行汽車都可以在同樣的基座模型上發(fā)展V-A鏈。
劉先明因此有底氣說,“小鵬第二代VLA,是小鵬與行業(yè)拉開代際差距的時(shí)刻,可能是目前中國最領(lǐng)先的智駕系統(tǒng)。”
![]()
玩法變了,影響波及整個(gè)市場
相比第一代VLA,第二代似乎鋪好了通往L4的路徑,這和特斯拉FSD從V13到V14的質(zhì)變剛好對應(yīng)。即便絲毫不考慮技術(shù)內(nèi)容,只從體驗(yàn)出發(fā),小鵬第二代VLA,很可能是唯一能在全球市場與特斯拉FSD競爭的中國智駕方案,小鵬因此回到智駕的T0梯隊(duì)。全量推送后,市場層面恐怕普遍反應(yīng)過來。原來,自動駕駛才是物理AI Agent第一個(gè)商業(yè)化落地方案。
以前老是說AI燒錢不賺錢,如果體驗(yàn)超出L2一大截,并毫不遲疑地直指L4,那么正向的商業(yè)循環(huán)也就建立起來。從這一點(diǎn)上看,小鵬的二代VLA,可能將引發(fā)市場競爭主線的變化。
![]()
以往輔助駕駛一直被當(dāng)做汽車“價(jià)值增量”,前者依附于后者。就眼下而言,智能駕駛的核心仍是安全、省心、好用。智駕普及,不僅意味著在入門級車型上的普及,還意味著在全系產(chǎn)品上普及能力更強(qiáng)、體驗(yàn)更佳、適用性空前廣泛的智駕系統(tǒng)。從而在用戶心理上,形成普遍接受并盡快擁有的愿望。市場寬度就此不同了,真正的全民智駕時(shí)代才會到來。
再進(jìn)一步,第二代VLA表明打通指向L4的道路,一切又不一樣了。何小鵬相信“汽車領(lǐng)域很快迎來跨域融合”。此前,具身智能看起來和車完全不同,外觀不同、運(yùn)動方式不同,控制、動力、線束和汽車都不一樣,但AI向物理Agent進(jìn)發(fā)的過程中,與汽車的自動駕駛需求產(chǎn)生了技術(shù)路線交疊。而動力、控制、底盤包括AI基座模型都在融合。小鵬二代VLA,可能是一場席卷整個(gè)市場的風(fēng)暴先兆。
![]()
如果跨域跨產(chǎn)業(yè)的“融合”預(yù)期落實(shí),不僅導(dǎo)致技術(shù)和供應(yīng)鏈復(fù)用、合并,而且極大加速了用戶心智的教育和占領(lǐng)。客戶從第二代VLA超預(yù)期體驗(yàn)當(dāng)中,大概率意識到,一個(gè)強(qiáng)智能體時(shí)代已經(jīng)來臨,整個(gè)商業(yè)模式、商業(yè)價(jià)值體系,都會產(chǎn)生顛覆性變化。
而小鵬的第二代VLA則第一次在公眾面前,替這種潛在變化揭開了面紗。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.