網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

特斯拉FSD相關(guān)專利篩選與端到端技術(shù)分析

2025-07-30 13:15:05　來(lái)源: 佑斌

上海舉報(bào)

分享至

特斯拉的自動(dòng)駕駛技術(shù)一直是行業(yè)熱議的話題。今天，我們將采用AI技術(shù)來(lái)分析一下特斯拉的自動(dòng)駕駛專利。

如何從特斯拉的專利中找出所有的自動(dòng)駕駛相關(guān)的專利？

特斯拉與汽車相關(guān)的專利族超過(guò)了1000族，首先需要從中篩選出與“自動(dòng)駕駛”有關(guān)的專利。如果采用傳統(tǒng)方法進(jìn)行篩選，過(guò)程會(huì)非常費(fèi)時(shí)費(fèi)力，例如需要撰寫一條全面的自動(dòng)駕駛檢索式，這其實(shí)并不容易。具體來(lái)說(shuō)，既要盡可能地涵蓋自動(dòng)駕駛的各種表達(dá)方式，如“autonomous driving”、“self driving”、“driverless”等關(guān)鍵詞，又要考慮各種相關(guān)的分類號(hào)。

更麻煩的是，很多與自動(dòng)駕駛相關(guān)的專利，并未在文本中明確提到“自動(dòng)駕駛”，比如涉及模型訓(xùn)練和圖像處理的專利。特斯拉的不少專利雖然涉及模型訓(xùn)練和圖像處理，專利文本中卻未明確出現(xiàn)“自動(dòng)駕駛”這一關(guān)鍵詞，但實(shí)際上它們正是為解決自動(dòng)駕駛問題而提出的技術(shù)方案。若要將這些專利識(shí)別出來(lái)，只能逐篇閱讀。因此，用傳統(tǒng)的方法，僅僅找出特斯拉所有自動(dòng)駕駛相關(guān)的專利，就已非常困難。

現(xiàn)在，我們可以使用一種新方法：直接將特斯拉的全部專利交給AI，讓AI智能體逐篇進(jìn)行閱讀分析。這里可以使用Maxipat的“AI注釋功能”：用戶首先選中特斯拉的全部專利，然后用自然語(yǔ)言向Maxipat的“AI注釋”模塊發(fā)出指令，比如：“幫我逐篇閱讀特斯拉的所有專利，篩選出與自動(dòng)駕駛相關(guān)的專利，尤其需要找出專利文本中雖未提到‘自動(dòng)駕駛’關(guān)鍵詞，但實(shí)質(zhì)上是解決自動(dòng)駕駛問題的專利，例如涉及模型訓(xùn)練和圖像處理的專利。”

將上述這樣一段話告訴Maxipat的“AI注釋”模塊后，系統(tǒng)經(jīng)過(guò)一段時(shí)間的運(yùn)行，即可準(zhǔn)確地將特斯拉所有與自動(dòng)駕駛相關(guān)的專利挑選出來(lái)。

系統(tǒng)在運(yùn)行一段時(shí)間之后，就會(huì)自動(dòng)把特斯拉自動(dòng)駕駛的專利挑出來(lái)。

在AI挑選出這些自動(dòng)駕駛專利之后，會(huì)自動(dòng)給挑選出的專利打上標(biāo)簽，相當(dāng)于AI一篇篇去閱讀特斯拉的專利，把想要的專利選出來(lái)。用戶接下來(lái)就可以在系統(tǒng)上選中這部分?jǐn)?shù)據(jù)進(jìn)行分析。

如何用AI批量分析挑選出的自動(dòng)駕駛相關(guān)的專利？

分析完全可以通過(guò)自然語(yǔ)言的指令通過(guò)不同的角度進(jìn)行分析。例如輸入“請(qǐng)梳理出特斯拉的自動(dòng)駕駛專利與FSD密切相關(guān)的專利，并從這些專利出發(fā)分析特斯拉專利中的端到端技術(shù)。”

接下來(lái)用戶只需要不停地調(diào)整自己的指令進(jìn)行操作，從系統(tǒng)中摘取的分析內(nèi)容如下：

感知端到端

占用網(wǎng)絡(luò)與三維環(huán)境建模：上述WO2024073088A1專利詳細(xì)描述了特斯拉FSD中Occupancy Network的實(shí)現(xiàn)方式。車輛通過(guò)攝像頭獲取實(shí)時(shí)圖像，利用深度學(xué)習(xí)模型將車輛周圍環(huán)境劃分為體素網(wǎng)格并預(yù)測(cè)每個(gè)體素是否被障礙物占據(jù)。這一占用網(wǎng)絡(luò)輸出一個(gè)三維占用圖，相當(dāng)于用純視覺手段生成了類似激光雷達(dá)點(diǎn)云的環(huán)境模型。專利指出，該模型還能結(jié)合表面屬性檢測(cè)來(lái)識(shí)別地面道路等表面特征，以豐富環(huán)境理解。基于占用網(wǎng)絡(luò)提供的三維環(huán)境感知，特斯拉FSD能夠在無(wú)GPS定位或預(yù)先繪制高清地圖的條件下，識(shí)別自身所處環(huán)境并進(jìn)行定位。

增強(qiáng)目標(biāo)檢測(cè)與距離預(yù)測(cè)：為了配合占用網(wǎng)絡(luò)的三維感知，特斯拉還改進(jìn)了視覺目標(biāo)檢測(cè)和距離估計(jì)的方法。例如，特斯拉的專利“預(yù)測(cè)自動(dòng)駕駛的三維特征”提出利用單目攝像頭圖像經(jīng)由訓(xùn)練的機(jī)器學(xué)習(xí)模型來(lái)預(yù)測(cè)物體的三維軌跡/位置，并將其用于自動(dòng)控制車輛。簡(jiǎn)單來(lái)說(shuō)，就是用神經(jīng)網(wǎng)絡(luò)從攝像頭畫面中直接推斷出前方物體在三維空間中的位置和運(yùn)動(dòng)趨勢(shì)，再交由車輛控制系統(tǒng)決策。這一技術(shù)彌補(bǔ)了沒有激光雷達(dá)時(shí)距離感知的不足，該專利利用其他傳感器輸出作為訓(xùn)練監(jiān)督信號(hào)，讓神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)從視覺推斷距離。此外，特斯拉的增強(qiáng)型目標(biāo)檢測(cè)相關(guān)專利亦通過(guò)多攝像頭視場(chǎng)融合等手段，提高對(duì)障礙物的識(shí)別準(zhǔn)確率和視野覆蓋。這些視覺感知改進(jìn)專利共同確保了在FSD系統(tǒng)中，相機(jī)+神經(jīng)網(wǎng)絡(luò)能夠勝任原本需要激光雷達(dá)和傳統(tǒng)算法才能完成的環(huán)境感知任務(wù)。

規(guī)劃決策端到端

聯(lián)合行為預(yù)測(cè)與規(guī)劃：CN120166977A號(hào)專利及其同族文件提出了一種聯(lián)合多代理行為預(yù)測(cè)和車輛規(guī)劃的AI建模技術(shù)。其核心是在攝像頭感知到周圍車輛、行人等動(dòng)態(tài)代理后，引入分層節(jié)點(diǎn)圖結(jié)構(gòu)來(lái)表示多主體可能的軌跡與互動(dòng)。分層節(jié)點(diǎn)圖包含“目的層”和多個(gè)“交互層”，能夠?qū)⒏鱾€(gè)代理的意圖和相互影響關(guān)系建模。算法對(duì)節(jié)點(diǎn)進(jìn)行打分，綜合考慮代理行為預(yù)測(cè)和自車目標(biāo)，選出最優(yōu)的自車行駛軌跡。也就是說(shuō)，這個(gè)專利將他車行為預(yù)測(cè)和本車路徑規(guī)劃放在同一框架下求解，用人工智能方法處理復(fù)雜交通中的博弈關(guān)系。其結(jié)果是增強(qiáng)FSD系統(tǒng)在城市街道、高密度交通等場(chǎng)景下的決策反應(yīng)能力。相比傳統(tǒng)系統(tǒng)先預(yù)測(cè)他車再規(guī)劃自己的分段式流程，此專利體現(xiàn)出端到端聯(lián)合推理的優(yōu)勢(shì)，將環(huán)境中多元素的動(dòng)態(tài)交互納入同一個(gè)模型中考慮。

基于視覺的端到端路徑規(guī)劃：特斯拉的另一組專利則專注于從視覺直接生成行車路徑。WO2024073088A1專利除了占用網(wǎng)絡(luò)感知外，還描述了車輛如何在得到占用網(wǎng)格后自動(dòng)規(guī)劃路徑：處理器在生成三維環(huán)境模型并獲得目標(biāo)點(diǎn)后，可直接利用圖像特征進(jìn)行定位，不依賴GPS，再生成車輛行進(jìn)路徑。其中提到，路徑可以表示為一系列控制指令，例如軌跡曲線、偏航角速度、前進(jìn)速度、橫向速度等，這些都是車輛控制層面的量。特斯拉FSD的規(guī)劃決策以視覺神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)，再輔以少量規(guī)則約束，從而實(shí)現(xiàn)了從攝像頭畫面到駕駛動(dòng)作的高度集成。

整體端到端架構(gòu)

深度學(xué)習(xí)數(shù)據(jù)管線與實(shí)時(shí)控制：US11215999B2 “數(shù)據(jù)管線和深度學(xué)習(xí)系統(tǒng)”專利詳述了特斯拉FSD的大規(guī)模神經(jīng)網(wǎng)絡(luò)架構(gòu)如何直接輸出車輛控制指令。在該系統(tǒng)中，攝像頭等多源傳感器數(shù)據(jù)經(jīng)過(guò)預(yù)處理被拆分為不同頻段/尺度的圖像分量，分別送入神經(jīng)網(wǎng)絡(luò)的不同層，以提高特征提取效率。這種創(chuàng)新的數(shù)據(jù)管線使網(wǎng)絡(luò)既捕獲局部細(xì)節(jié)又利用全局視野。經(jīng)過(guò)多層深度卷積處理后，網(wǎng)絡(luò)的推理結(jié)果直接對(duì)應(yīng)車輛的控制動(dòng)作，例如轉(zhuǎn)向角度調(diào)整、車速控制等。專利明確指出，這些由深度學(xué)習(xí)分析得到的結(jié)果被發(fā)送到車輛控制模塊用于輔助操作車輛。因此，該系統(tǒng)實(shí)現(xiàn)了從傳感器原始數(shù)據(jù)到駕駛控制決策的端到端自動(dòng)化。值得一提的是，為保障如此大規(guī)模神經(jīng)網(wǎng)絡(luò)在車載平臺(tái)上的實(shí)時(shí)運(yùn)行，專利還介紹了通過(guò)分解圖像、并行處理以及逐層降分辨率等方法來(lái)提升計(jì)算效率，顯著減少深度學(xué)習(xí)推理的計(jì)算量和延遲。

多傳感器融合模擬與專用硬件支持：上述US20220043449A1多通道傳感器模擬專利是特斯拉純視覺/低成本傳感方案的關(guān)鍵補(bǔ)充。傳統(tǒng)自動(dòng)駕駛往往倚賴昂貴的激光雷達(dá)等傳感器提供精準(zhǔn)的3D環(huán)境數(shù)據(jù)，而特斯拉選擇用算法彌補(bǔ)硬件：通過(guò)神經(jīng)網(wǎng)絡(luò)融合多攝像頭+雷達(dá)等信息，生成與激光雷達(dá)類似的環(huán)境點(diǎn)云或高分辨率感知結(jié)果。專利說(shuō)明這種模擬的高容量傳感數(shù)據(jù)可無(wú)縫用于現(xiàn)有的目標(biāo)檢測(cè)和控制算法。換言之，特斯拉用端到端學(xué)習(xí)模型把便宜傳感器的輸出提升為昂貴傳感器的效果，降低了對(duì)特定硬件的依賴。

特斯拉FSD采用“純視覺”方案為主，僅輔以少量常規(guī)傳感器（如攝像頭+毫米波雷達(dá)/超聲波），不使用激光雷達(dá)。特斯拉多項(xiàng)專利表明其有意規(guī)避高成本的高性能傳感器：例如US20220043449A1專利指出，高容量傳感器（如360°LiDAR）雖然信息豐富但非常昂貴復(fù)雜，而特斯拉的系統(tǒng)通過(guò)組合多個(gè)低容量傳感器的數(shù)據(jù)來(lái)模擬高容量傳感器數(shù)據(jù)，讓沒有昂貴傳感器的車輛也能獲得類似環(huán)境感知能力。這意味著在特斯拉FSD中，攝像頭+神經(jīng)網(wǎng)絡(luò)=激光雷達(dá)替代品。從成本和部署角度，攝像頭體積小且廉價(jià)，可多方位安裝；激光雷達(dá)則價(jià)格高昂且結(jié)構(gòu)笨重。特斯拉通過(guò)視覺融合技術(shù)實(shí)現(xiàn)激光雷達(dá)功能，大幅降低傳感器依賴和硬件成本，同時(shí)減少了對(duì)高精度地圖和定位傳感器的需求。

特斯拉FSD的架構(gòu)高度依賴深度學(xué)習(xí)，將感知、語(yǔ)義理解、行為預(yù)測(cè)、路徑規(guī)劃等功能盡可能交由神經(jīng)網(wǎng)絡(luò)端到端完成。一系列專利（如Occupancy Network、聯(lián)合規(guī)劃與預(yù)測(cè)、深度學(xué)習(xí)管線等）顯示：攝像頭圖像經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)直接輸出豐富的環(huán)境模型和決策建議。例如，占用網(wǎng)絡(luò)模型使車輛對(duì)周圍占用狀況和可行駛空間有了端到端的理解，并與規(guī)劃模塊聯(lián)動(dòng)；聯(lián)合規(guī)劃專利則把多車博弈決策融入單一AI框架。特斯拉的HydraNet+Occupancy網(wǎng)絡(luò)多任務(wù)模型以及深度學(xué)習(xí)控制器，使整個(gè)系統(tǒng)更像一個(gè)整體智能體，能夠通過(guò)端到端訓(xùn)練不斷優(yōu)化全局表現(xiàn)。這種高集成度優(yōu)勢(shì)在復(fù)雜場(chǎng)景下尤為明顯：當(dāng)?shù)缆翻h(huán)境瞬息萬(wàn)變時(shí)，端到端網(wǎng)絡(luò)能同時(shí)考慮感知不確定性和行為優(yōu)化，做出更協(xié)調(diào)的響應(yīng)。簡(jiǎn)單說(shuō)，特斯拉將人類駕駛經(jīng)驗(yàn)盡可能用神經(jīng)網(wǎng)絡(luò)吸收，從而在FSD中實(shí)現(xiàn)類似人類視覺-大腦-操作的一體化架構(gòu)。

成本與計(jì)算資源需求：不采用激光雷達(dá)讓特斯拉在硬件物料上有巨大優(yōu)勢(shì)。然而，這一路線將挑戰(zhàn)轉(zhuǎn)嫁到計(jì)算和算法上：需要強(qiáng)大的計(jì)算硬件和高效算法來(lái)處理海量視覺數(shù)據(jù)。特斯拉通過(guò)專利展示了兩方面的應(yīng)對(duì)：一是優(yōu)化算法，如數(shù)據(jù)管線專利采用多分辨率分層處理，大幅降低神經(jīng)網(wǎng)絡(luò)運(yùn)算量；二是自研芯片，如FSD計(jì)算平臺(tái)使用專用加速器和并行處理器，實(shí)現(xiàn)每秒數(shù)十TOPS的算力支持實(shí)時(shí)深度學(xué)習(xí)推理。相較傳統(tǒng)方案依賴激光雷達(dá)直觀數(shù)據(jù)、所需計(jì)算相對(duì)可控，特斯拉FSD需要在車載實(shí)時(shí)計(jì)算上投入更多。但特斯拉的設(shè)計(jì)在規(guī)模化后成本更具優(yōu)勢(shì)：攝像頭+自研芯片隨著產(chǎn)量提升可以攤薄成本，而激光雷達(dá)等昂貴器件難以大幅降價(jià)。并且，特斯拉網(wǎng)絡(luò)優(yōu)化使其即便處理8路攝像頭數(shù)據(jù)，所需算力仍在可實(shí)現(xiàn)范圍。另外，去除了激光雷達(dá)后，傳感/計(jì)算系統(tǒng)功耗和維護(hù)也有所降低。總體而言，特斯拉以更高的初始研發(fā)投入（AI算法和芯片）換取了單車更低的硬件成本和可量產(chǎn)性。這一點(diǎn)在專利US20220043449A1中得到體現(xiàn)：廉價(jià)傳感器陣列+智能模擬即可替代昂貴傳感器達(dá)到類似效果。

特斯拉FSD的專利布局顯示出一條清晰的“純視覺+AI”技術(shù)路線：用神經(jīng)網(wǎng)絡(luò)算法最大化地替代昂貴傳感器和復(fù)雜規(guī)則，實(shí)現(xiàn)感知、預(yù)測(cè)、規(guī)劃到控制的端到端閉環(huán)。

Maxipat致力于作為成為科技創(chuàng)新和知識(shí)產(chǎn)權(quán)工作的AI加速器，主要包括輔助創(chuàng)新：提高研發(fā)的科技創(chuàng)新效率；智能搜索與分析：將專利搜索和報(bào)告制作借助AI實(shí)現(xiàn)智能化，包括智能查新、無(wú)效、FTO、Landscaping報(bào)告；投資助手：快速生成投資賽道報(bào)告、專利購(gòu)買篩選、專利轉(zhuǎn)化評(píng)估。目前開放注冊(cè)中。輔助科技創(chuàng)新和知識(shí)產(chǎn)權(quán)工作的AI智能體

感興趣的朋友可以通過(guò)以下三種方式填寫申請(qǐng)信息：

1. 請(qǐng)發(fā)郵件到郵箱：info@maxipat.com

2. 點(diǎn)擊文末閱讀全文；

3. 掃描以下二維碼

感興趣的朋友可以加筆者微信patentlight

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.