特斯拉的自動(dòng)駕駛技術(shù)一直是行業(yè)熱議的話題。今天,我們將采用AI技術(shù)來(lái)分析一下特斯拉的自動(dòng)駕駛專利。
如何從特斯拉的專利中找出所有的自動(dòng)駕駛相關(guān)的專利?
特斯拉與汽車相關(guān)的專利族超過(guò)了1000族,首先需要從中篩選出與“自動(dòng)駕駛”有關(guān)的專利。如果采用傳統(tǒng)方法進(jìn)行篩選,過(guò)程會(huì)非常費(fèi)時(shí)費(fèi)力,例如需要撰寫一條全面的自動(dòng)駕駛檢索式,這其實(shí)并不容易。具體來(lái)說(shuō),既要盡可能地涵蓋自動(dòng)駕駛的各種表達(dá)方式,如“autonomous driving”、“self driving”、“driverless”等關(guān)鍵詞,又要考慮各種相關(guān)的分類號(hào)。
更麻煩的是,很多與自動(dòng)駕駛相關(guān)的專利,并未在文本中明確提到“自動(dòng)駕駛”,比如涉及模型訓(xùn)練和圖像處理的專利。特斯拉的不少專利雖然涉及模型訓(xùn)練和圖像處理,專利文本中卻未明確出現(xiàn)“自動(dòng)駕駛”這一關(guān)鍵詞,但實(shí)際上它們正是為解決自動(dòng)駕駛問題而提出的技術(shù)方案。若要將這些專利識(shí)別出來(lái),只能逐篇閱讀。因此,用傳統(tǒng)的方法,僅僅找出特斯拉所有自動(dòng)駕駛相關(guān)的專利,就已非常困難。
現(xiàn)在,我們可以使用一種新方法:直接將特斯拉的全部專利交給AI,讓AI智能體逐篇進(jìn)行閱讀分析。這里可以使用Maxipat的“AI注釋功能”:用戶首先選中特斯拉的全部專利,然后用自然語(yǔ)言向Maxipat的“AI注釋”模塊發(fā)出指令,比如:“幫我逐篇閱讀特斯拉的所有專利,篩選出與自動(dòng)駕駛相關(guān)的專利,尤其需要找出專利文本中雖未提到‘自動(dòng)駕駛’關(guān)鍵詞,但實(shí)質(zhì)上是解決自動(dòng)駕駛問題的專利,例如涉及模型訓(xùn)練和圖像處理的專利。”
將上述這樣一段話告訴Maxipat的“AI注釋”模塊后,系統(tǒng)經(jīng)過(guò)一段時(shí)間的運(yùn)行,即可準(zhǔn)確地將特斯拉所有與自動(dòng)駕駛相關(guān)的專利挑選出來(lái)。
系統(tǒng)在運(yùn)行一段時(shí)間之后,就會(huì)自動(dòng)把特斯拉自動(dòng)駕駛的專利挑出來(lái)。
在AI挑選出這些自動(dòng)駕駛專利之后,會(huì)自動(dòng)給挑選出的專利打上標(biāo)簽,相當(dāng)于AI一篇篇去閱讀特斯拉的專利,把想要的專利選出來(lái)。用戶接下來(lái)就可以在系統(tǒng)上選中這部分?jǐn)?shù)據(jù)進(jìn)行分析。
如何用AI批量分析挑選出的自動(dòng)駕駛相關(guān)的專利?
分析完全可以通過(guò)自然語(yǔ)言的指令通過(guò)不同的角度進(jìn)行分析。例如輸入“請(qǐng)梳理出特斯拉的自動(dòng)駕駛專利與FSD密切相關(guān)的專利,并從這些專利出發(fā)分析特斯拉專利中的端到端技術(shù)。”
接下來(lái)用戶只需要不停地調(diào)整自己的指令進(jìn)行操作,從系統(tǒng)中摘取的分析內(nèi)容如下:
感知端到端
占用網(wǎng)絡(luò)與三維環(huán)境建模:上述WO2024073088A1專利詳細(xì)描述了特斯拉FSD中Occupancy Network的實(shí)現(xiàn)方式。車輛通過(guò)攝像頭獲取實(shí)時(shí)圖像,利用深度學(xué)習(xí)模型將車輛周圍環(huán)境劃分為體素網(wǎng)格并預(yù)測(cè)每個(gè)體素是否被障礙物占據(jù)。這一占用網(wǎng)絡(luò)輸出一個(gè)三維占用圖,相當(dāng)于用純視覺手段生成了類似激光雷達(dá)點(diǎn)云的環(huán)境模型。專利指出,該模型還能結(jié)合表面屬性檢測(cè)來(lái)識(shí)別地面道路等表面特征,以豐富環(huán)境理解。基于占用網(wǎng)絡(luò)提供的三維環(huán)境感知,特斯拉FSD能夠在無(wú)GPS定位或預(yù)先繪制高清地圖的條件下,識(shí)別自身所處環(huán)境并進(jìn)行定位。
增強(qiáng)目標(biāo)檢測(cè)與距離預(yù)測(cè):為了配合占用網(wǎng)絡(luò)的三維感知,特斯拉還改進(jìn)了視覺目標(biāo)檢測(cè)和距離估計(jì)的方法。例如,特斯拉的專利“預(yù)測(cè)自動(dòng)駕駛的三維特征”提出利用單目攝像頭圖像經(jīng)由訓(xùn)練的機(jī)器學(xué)習(xí)模型來(lái)預(yù)測(cè)物體的三維軌跡/位置,并將其用于自動(dòng)控制車輛。簡(jiǎn)單來(lái)說(shuō),就是用神經(jīng)網(wǎng)絡(luò)從攝像頭畫面中直接推斷出前方物體在三維空間中的位置和運(yùn)動(dòng)趨勢(shì),再交由車輛控制系統(tǒng)決策。這一技術(shù)彌補(bǔ)了沒有激光雷達(dá)時(shí)距離感知的不足,該專利利用其他傳感器輸出作為訓(xùn)練監(jiān)督信號(hào),讓神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)從視覺推斷距離。此外,特斯拉的增強(qiáng)型目標(biāo)檢測(cè)相關(guān)專利亦通過(guò)多攝像頭視場(chǎng)融合等手段,提高對(duì)障礙物的識(shí)別準(zhǔn)確率和視野覆蓋。這些視覺感知改進(jìn)專利共同確保了在FSD系統(tǒng)中,相機(jī)+神經(jīng)網(wǎng)絡(luò)能夠勝任原本需要激光雷達(dá)和傳統(tǒng)算法才能完成的環(huán)境感知任務(wù)。
規(guī)劃決策端到端
聯(lián)合行為預(yù)測(cè)與規(guī)劃:CN120166977A號(hào)專利及其同族文件提出了一種聯(lián)合多代理行為預(yù)測(cè)和車輛規(guī)劃的AI建模技術(shù)。其核心是在攝像頭感知到周圍車輛、行人等動(dòng)態(tài)代理后,引入分層節(jié)點(diǎn)圖結(jié)構(gòu)來(lái)表示多主體可能的軌跡與互動(dòng)。分層節(jié)點(diǎn)圖包含“目的層”和多個(gè)“交互層”,能夠?qū)⒏鱾€(gè)代理的意圖和相互影響關(guān)系建模。算法對(duì)節(jié)點(diǎn)進(jìn)行打分,綜合考慮代理行為預(yù)測(cè)和自車目標(biāo),選出最優(yōu)的自車行駛軌跡。也就是說(shuō),這個(gè)專利將他車行為預(yù)測(cè)和本車路徑規(guī)劃放在同一框架下求解,用人工智能方法處理復(fù)雜交通中的博弈關(guān)系。其結(jié)果是增強(qiáng)FSD系統(tǒng)在城市街道、高密度交通等場(chǎng)景下的決策反應(yīng)能力。相比傳統(tǒng)系統(tǒng)先預(yù)測(cè)他車再規(guī)劃自己的分段式流程,此專利體現(xiàn)出端到端聯(lián)合推理的優(yōu)勢(shì),將環(huán)境中多元素的動(dòng)態(tài)交互納入同一個(gè)模型中考慮。
基于視覺的端到端路徑規(guī)劃:特斯拉的另一組專利則專注于從視覺直接生成行車路徑。WO2024073088A1專利除了占用網(wǎng)絡(luò)感知外,還描述了車輛如何在得到占用網(wǎng)格后自動(dòng)規(guī)劃路徑:處理器在生成三維環(huán)境模型并獲得目標(biāo)點(diǎn)后,可直接利用圖像特征進(jìn)行定位,不依賴GPS,再生成車輛行進(jìn)路徑。其中提到,路徑可以表示為一系列控制指令,例如軌跡曲線、偏航角速度、前進(jìn)速度、橫向速度等,這些都是車輛控制層面的量。特斯拉FSD的規(guī)劃決策以視覺神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),再輔以少量規(guī)則約束,從而實(shí)現(xiàn)了從攝像頭畫面到駕駛動(dòng)作的高度集成。
整體端到端架構(gòu)
深度學(xué)習(xí)數(shù)據(jù)管線與實(shí)時(shí)控制:US11215999B2 “數(shù)據(jù)管線和深度學(xué)習(xí)系統(tǒng)”專利詳述了特斯拉FSD的大規(guī)模神經(jīng)網(wǎng)絡(luò)架構(gòu)如何直接輸出車輛控制指令。在該系統(tǒng)中,攝像頭等多源傳感器數(shù)據(jù)經(jīng)過(guò)預(yù)處理被拆分為不同頻段/尺度的圖像分量,分別送入神經(jīng)網(wǎng)絡(luò)的不同層,以提高特征提取效率。這種創(chuàng)新的數(shù)據(jù)管線使網(wǎng)絡(luò)既捕獲局部細(xì)節(jié)又利用全局視野。經(jīng)過(guò)多層深度卷積處理后,網(wǎng)絡(luò)的推理結(jié)果直接對(duì)應(yīng)車輛的控制動(dòng)作,例如轉(zhuǎn)向角度調(diào)整、車速控制等。專利明確指出,這些由深度學(xué)習(xí)分析得到的結(jié)果被發(fā)送到車輛控制模塊用于輔助操作車輛。因此,該系統(tǒng)實(shí)現(xiàn)了從傳感器原始數(shù)據(jù)到駕駛控制決策的端到端自動(dòng)化。值得一提的是,為保障如此大規(guī)模神經(jīng)網(wǎng)絡(luò)在車載平臺(tái)上的實(shí)時(shí)運(yùn)行,專利還介紹了通過(guò)分解圖像、并行處理以及逐層降分辨率等方法來(lái)提升計(jì)算效率,顯著減少深度學(xué)習(xí)推理的計(jì)算量和延遲。
多傳感器融合模擬與專用硬件支持:上述US20220043449A1多通道傳感器模擬專利是特斯拉純視覺/低成本傳感方案的關(guān)鍵補(bǔ)充。傳統(tǒng)自動(dòng)駕駛往往倚賴昂貴的激光雷達(dá)等傳感器提供精準(zhǔn)的3D環(huán)境數(shù)據(jù),而特斯拉選擇用算法彌補(bǔ)硬件:通過(guò)神經(jīng)網(wǎng)絡(luò)融合多攝像頭+雷達(dá)等信息,生成與激光雷達(dá)類似的環(huán)境點(diǎn)云或高分辨率感知結(jié)果。專利說(shuō)明這種模擬的高容量傳感數(shù)據(jù)可無(wú)縫用于現(xiàn)有的目標(biāo)檢測(cè)和控制算法。換言之,特斯拉用端到端學(xué)習(xí)模型把便宜傳感器的輸出提升為昂貴傳感器的效果,降低了對(duì)特定硬件的依賴。
特斯拉FSD采用“純視覺”方案為主,僅輔以少量常規(guī)傳感器(如攝像頭+毫米波雷達(dá)/超聲波),不使用激光雷達(dá)。特斯拉多項(xiàng)專利表明其有意規(guī)避高成本的高性能傳感器:例如US20220043449A1專利指出,高容量傳感器(如360°LiDAR)雖然信息豐富但非常昂貴復(fù)雜,而特斯拉的系統(tǒng)通過(guò)組合多個(gè)低容量傳感器的數(shù)據(jù)來(lái)模擬高容量傳感器數(shù)據(jù),讓沒有昂貴傳感器的車輛也能獲得類似環(huán)境感知能力。這意味著在特斯拉FSD中,攝像頭+神經(jīng)網(wǎng)絡(luò)=激光雷達(dá)替代品。從成本和部署角度,攝像頭體積小且廉價(jià),可多方位安裝;激光雷達(dá)則價(jià)格高昂且結(jié)構(gòu)笨重。特斯拉通過(guò)視覺融合技術(shù)實(shí)現(xiàn)激光雷達(dá)功能,大幅降低傳感器依賴和硬件成本,同時(shí)減少了對(duì)高精度地圖和定位傳感器的需求。
特斯拉FSD的架構(gòu)高度依賴深度學(xué)習(xí),將感知、語(yǔ)義理解、行為預(yù)測(cè)、路徑規(guī)劃等功能盡可能交由神經(jīng)網(wǎng)絡(luò)端到端完成。一系列專利(如Occupancy Network、聯(lián)合規(guī)劃與預(yù)測(cè)、深度學(xué)習(xí)管線等)顯示:攝像頭圖像經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)直接輸出豐富的環(huán)境模型和決策建議。例如,占用網(wǎng)絡(luò)模型使車輛對(duì)周圍占用狀況和可行駛空間有了端到端的理解,并與規(guī)劃模塊聯(lián)動(dòng);聯(lián)合規(guī)劃專利則把多車博弈決策融入單一AI框架。特斯拉的HydraNet+Occupancy網(wǎng)絡(luò)多任務(wù)模型以及深度學(xué)習(xí)控制器,使整個(gè)系統(tǒng)更像一個(gè)整體智能體,能夠通過(guò)端到端訓(xùn)練不斷優(yōu)化全局表現(xiàn)。這種高集成度優(yōu)勢(shì)在復(fù)雜場(chǎng)景下尤為明顯:當(dāng)?shù)缆翻h(huán)境瞬息萬(wàn)變時(shí),端到端網(wǎng)絡(luò)能同時(shí)考慮感知不確定性和行為優(yōu)化,做出更協(xié)調(diào)的響應(yīng)。簡(jiǎn)單說(shuō),特斯拉將人類駕駛經(jīng)驗(yàn)盡可能用神經(jīng)網(wǎng)絡(luò)吸收,從而在FSD中實(shí)現(xiàn)類似人類視覺-大腦-操作的一體化架構(gòu)。
成本與計(jì)算資源需求: 不采用激光雷達(dá)讓特斯拉在硬件物料上有巨大優(yōu)勢(shì)。然而,這一路線將挑戰(zhàn)轉(zhuǎn)嫁到計(jì)算和算法上:需要強(qiáng)大的計(jì)算硬件和高效算法來(lái)處理海量視覺數(shù)據(jù)。特斯拉通過(guò)專利展示了兩方面的應(yīng)對(duì):一是優(yōu)化算法,如數(shù)據(jù)管線專利采用多分辨率分層處理,大幅降低神經(jīng)網(wǎng)絡(luò)運(yùn)算量;二是自研芯片,如FSD計(jì)算平臺(tái)使用專用加速器和并行處理器,實(shí)現(xiàn)每秒數(shù)十TOPS的算力支持實(shí)時(shí)深度學(xué)習(xí)推理。相較傳統(tǒng)方案依賴激光雷達(dá)直觀數(shù)據(jù)、所需計(jì)算相對(duì)可控,特斯拉FSD需要在車載實(shí)時(shí)計(jì)算上投入更多。但特斯拉的設(shè)計(jì)在規(guī)模化后成本更具優(yōu)勢(shì):攝像頭+自研芯片隨著產(chǎn)量提升可以攤薄成本,而激光雷達(dá)等昂貴器件難以大幅降價(jià)。并且,特斯拉網(wǎng)絡(luò)優(yōu)化使其即便處理8路攝像頭數(shù)據(jù),所需算力仍在可實(shí)現(xiàn)范圍。另外,去除了激光雷達(dá)后,傳感/計(jì)算系統(tǒng)功耗和維護(hù)也有所降低。總體而言,特斯拉以更高的初始研發(fā)投入(AI算法和芯片)換取了單車更低的硬件成本和可量產(chǎn)性。這一點(diǎn)在專利US20220043449A1中得到體現(xiàn):廉價(jià)傳感器陣列+智能模擬即可替代昂貴傳感器達(dá)到類似效果。
特斯拉FSD的專利布局顯示出一條清晰的“純視覺+AI”技術(shù)路線:用神經(jīng)網(wǎng)絡(luò)算法最大化地替代昂貴傳感器和復(fù)雜規(guī)則,實(shí)現(xiàn)感知、預(yù)測(cè)、規(guī)劃到控制的端到端閉環(huán)。
Maxipat致力于作為成為科技創(chuàng)新和知識(shí)產(chǎn)權(quán)工作的AI加速器,主要包括輔助創(chuàng)新:提高研發(fā)的科技創(chuàng)新效率;智能搜索與分析:將專利搜索和報(bào)告制作借助AI實(shí)現(xiàn)智能化,包括智能查新、無(wú)效、FTO、Landscaping報(bào)告;投資助手:快速生成投資賽道報(bào)告、專利購(gòu)買篩選、專利轉(zhuǎn)化評(píng)估。目前開放注冊(cè)中。輔助科技創(chuàng)新和知識(shí)產(chǎn)權(quán)工作的AI智能體
感興趣的朋友可以通過(guò)以下三種方式填寫申請(qǐng)信息:
1. 請(qǐng)發(fā)郵件到郵箱:info@maxipat.com
2. 點(diǎn)擊文末閱讀全文;
3. 掃描以下二維碼
感興趣的朋友可以加筆者微信patentlight
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.