對(duì)專利數(shù)據(jù)進(jìn)行分類和標(biāo)引是專利工作的重要組成部分。在進(jìn)行專利信息分析的過(guò)程中,不管是專利導(dǎo)航、專利地圖、專利全景分析等,對(duì)專利數(shù)據(jù)進(jìn)行分類和標(biāo)引是基礎(chǔ)工作,常常占專利分析工作的一半以上的時(shí)間。比如我們要了解下自動(dòng)駕駛這個(gè)領(lǐng)域的專利,那就需要對(duì)自動(dòng)駕駛這個(gè)領(lǐng)域的專利數(shù)據(jù)進(jìn)行分類標(biāo)引,給每個(gè)專利打上標(biāo)簽。例如分成感測(cè)、導(dǎo)航、高精度地圖、決策,規(guī)劃,其中高精度地圖有可能分成點(diǎn)云地圖、靜態(tài)高精度地圖、動(dòng)態(tài)高精度地圖,每個(gè)技術(shù)點(diǎn)有時(shí)候需要分成好幾個(gè)層次。
在很多專利分析項(xiàng)目中,分析人員需要專利打上多個(gè)技術(shù)層級(jí)以及效果標(biāo)簽等,在專利分析中,對(duì)一項(xiàng)專利打上三四個(gè)層級(jí)標(biāo)簽和效果標(biāo)簽是很常見(jiàn)的。
但是對(duì)專利分類標(biāo)引或打標(biāo)簽真是費(fèi)時(shí)費(fèi)力的事情,一個(gè)專利分析項(xiàng)目,需要標(biāo)引的專利動(dòng)輒成千上萬(wàn),打標(biāo)簽相當(dāng)于分析人員要去閱讀每一份專利,對(duì)于打多個(gè)標(biāo)簽的情況下,不僅去讀專利的摘要,有時(shí)候還要看專利的說(shuō)明書(shū)和權(quán)利要求才能確定,對(duì)于大型的專利分析項(xiàng)目,有時(shí)標(biāo)引時(shí)間就要花幾個(gè)月。
如果標(biāo)引分類工作變得簡(jiǎn)單準(zhǔn)確,專利的應(yīng)用范圍會(huì)擴(kuò)大很多。企業(yè)可以對(duì)自己感興趣的領(lǐng)域的專利進(jìn)行實(shí)時(shí)標(biāo)引,讓技術(shù)人員和IP人員隨時(shí)查看,促進(jìn)企業(yè)的創(chuàng)新和專利布局。
當(dāng)AI一出現(xiàn)的時(shí)候,知識(shí)產(chǎn)權(quán)界就希望通過(guò)AI解決專利標(biāo)引的問(wèn)題。最初的技術(shù)路線是通過(guò)向量標(biāo)引,比如需要標(biāo)引1000項(xiàng)專利,先人工標(biāo)引100項(xiàng),剩下的900項(xiàng)與已經(jīng)標(biāo)引過(guò)的100項(xiàng)進(jìn)行向量匹配,根據(jù)向量匹配的程度進(jìn)行標(biāo)引。這種標(biāo)引方式理論上是用戶標(biāo)引的越多,剩余的部分越少,標(biāo)引就越準(zhǔn)確。但這種標(biāo)引方式的缺陷是非常明顯的,本質(zhì)上這種標(biāo)引相當(dāng)于做了多次語(yǔ)義搜索,標(biāo)引的準(zhǔn)確度完全依賴embedding的優(yōu)劣,最大的缺陷是標(biāo)引的精度取決于數(shù)據(jù)本身的技術(shù)領(lǐng)域分布情況,假設(shè)標(biāo)引的1000項(xiàng)專利中分布有藥品、汽車、小家電,用這種方式標(biāo)引效果較好,因?yàn)閿?shù)據(jù)相互之間的差距大,很容易區(qū)分。
Maxipat基礎(chǔ)版的標(biāo)引就是采用這種方式,比如筆者標(biāo)引一份量子糾錯(cuò)的專利,一共422項(xiàng)專利,用戶標(biāo)引20項(xiàng)-40項(xiàng),剩余300多項(xiàng)專利都用AI標(biāo)引。但是這種標(biāo)引的缺點(diǎn)也是很明顯的:
首先、標(biāo)引的準(zhǔn)確率取決于數(shù)據(jù)本身的技術(shù)領(lǐng)域分布程度,如果分布得很廣,比如1000項(xiàng)數(shù)據(jù)中有藥品、汽車、小家電,就會(huì)標(biāo)引得準(zhǔn)確。如果1000項(xiàng)專利中數(shù)據(jù)全部是量子糾錯(cuò),要在量子糾錯(cuò)中再細(xì)分,對(duì)于這樣的標(biāo)引任務(wù),這種標(biāo)引方式缺陷就出來(lái)了。
其次,在標(biāo)引之前,人工先要標(biāo)引一定量的數(shù)據(jù),一般要標(biāo)引20%左右,這對(duì)于很多大型的標(biāo)引項(xiàng)目,這樣的標(biāo)引數(shù)據(jù)量也是很費(fèi)時(shí)費(fèi)力的。
第三、一旦發(fā)現(xiàn)標(biāo)引錯(cuò)誤,糾正非常麻煩,糾正了一部分錯(cuò)誤,很可能導(dǎo)致另一部分錯(cuò)誤,而且糾錯(cuò)只能繼續(xù)標(biāo)引具體數(shù)據(jù),無(wú)法通過(guò)指令操作。
Maxipat的AI深度標(biāo)引系統(tǒng)完全改變過(guò)去的標(biāo)引模式。采用新的標(biāo)引系統(tǒng)后,標(biāo)引完全在用戶可控的基礎(chǔ)上實(shí)現(xiàn)。
我們以一個(gè)很小的案例來(lái)看Maxipat深度標(biāo)引系統(tǒng)的強(qiáng)大。假設(shè)我們要標(biāo)引下一個(gè)自動(dòng)駕駛的數(shù)據(jù)包,這個(gè)數(shù)據(jù)包括506項(xiàng)專利。用戶需要將這些數(shù)據(jù)標(biāo)引為感測(cè)、高精度地圖、導(dǎo)航、決策、規(guī)劃,其中感測(cè)分為攝像頭感測(cè)、激光雷達(dá)感測(cè)。這時(shí)候用戶需要做的很簡(jiǎn)單,只需要把這個(gè)指令輸入到Maxipat的標(biāo)引系統(tǒng)中,如下所示:
Maxipat的標(biāo)引系統(tǒng)會(huì)自動(dòng)將標(biāo)引輸入分成若干層級(jí):
用戶根據(jù)自己的理解,對(duì)相應(yīng)層級(jí)進(jìn)行適當(dāng)?shù)慕忉專部梢圆唤忉專到y(tǒng)就會(huì)進(jìn)行第一次標(biāo)引。
在系統(tǒng)進(jìn)行第一次標(biāo)引之后,用戶可以進(jìn)行確認(rèn),確認(rèn)之后刷新一次,相當(dāng)于帶著人工監(jiān)督的數(shù)據(jù)進(jìn)行標(biāo)引。
假如在系統(tǒng)標(biāo)引之后,用戶發(fā)現(xiàn)還有需要糾正的,直接啟動(dòng)自然語(yǔ)言糾正程序,讓Maxipat修改。比如有的數(shù)據(jù)既涉及到規(guī)劃也涉及到?jīng)Q策,用戶通過(guò)指令要求系統(tǒng)將所有標(biāo)引為規(guī)劃的這部分?jǐn)?shù)據(jù)修改為決策。系統(tǒng)得到指令后會(huì)自動(dòng)對(duì)已經(jīng)標(biāo)引的數(shù)據(jù)進(jìn)行糾正。
Maxipat的標(biāo)引系統(tǒng)克服傳統(tǒng)AI標(biāo)引的幾大缺陷,能夠在用戶可控的基礎(chǔ)上實(shí)現(xiàn)大規(guī)模的專利數(shù)據(jù)標(biāo)引,而且根據(jù)用戶的指令隨時(shí)調(diào)整。
當(dāng)用戶需要對(duì)大規(guī)模專利數(shù)據(jù)進(jìn)行分類標(biāo)引,按照技術(shù)領(lǐng)域進(jìn)行預(yù)警時(shí),只要啟動(dòng)Maxipat的AI標(biāo)引系統(tǒng),可以輕松可控地實(shí)現(xiàn),最大限度節(jié)約用戶的時(shí)間和成本。
Maxipat致力于作為成為科技創(chuàng)新和知識(shí)產(chǎn)權(quán)工作的AI加速,主要包括輔助創(chuàng)新:提高研發(fā)的科技創(chuàng)新效率,通過(guò)problem-solution算法深層關(guān)聯(lián)到的真實(shí)技術(shù)方案,能夠跨領(lǐng)域進(jìn)行技術(shù)方案的深層挖掘和關(guān)聯(lián);智能搜索與分析:將專利搜索和報(bào)告制作借助AI實(shí)現(xiàn)智能化,包括智能查新、無(wú)效、FTO、Landscaping報(bào)告,采用GT搜索算法(graph transformer)(),系統(tǒng)真正做到理解概念后再搜索。目前開(kāi)放注冊(cè)中。
感興趣的朋友可以通過(guò)以下三種方式填寫(xiě)申請(qǐng)信息:
1. 請(qǐng)發(fā)郵件到郵箱:info@maxipat.com
2. 點(diǎn)擊文末閱讀全文;
3. 掃描以下二維碼
感興趣的朋友可以加筆者微信patentlight
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.