![]()
日前,《天津日報》刊發(fā)《濱海新區(qū)打造數(shù)據(jù)標注產(chǎn)業(yè)高地 訂單足 AI“啟蒙老師”忙不停》文章,聚焦位于天津經(jīng)開區(qū)的北方高端數(shù)據(jù)標注產(chǎn)業(yè)園,揭秘數(shù)據(jù)標注如何為人工智能提供認知世界的“第一手教材”。
![]()
給AI(人工智能)當“啟蒙老師”,是一種怎樣的角色?
今年以來,北方高端數(shù)據(jù)標注產(chǎn)業(yè)園加快推進河北鼎聯(lián)科技有限公司智能標注平臺、高端標注行業(yè)能力中心等項目建設(shè)。作為我市首個數(shù)據(jù)類產(chǎn)業(yè)園區(qū),園區(qū)內(nèi)不少企業(yè)在給AI當“啟蒙老師”。
“我們用精準的數(shù)據(jù)標注,為AI提供認識真實世界的第一手教材,讓AI學(xué)會看懂路、理解人、服務(wù)生活。”作為數(shù)據(jù)標注行業(yè)的“老兵”,天津經(jīng)緯智圖信息技術(shù)有限公司(以下簡稱經(jīng)緯智圖)總經(jīng)理張紅告訴記者,“我們聚焦高精地圖、智慧出行、具身智能、新零售等領(lǐng)域,把原始數(shù)據(jù)加工成適配AI模型訓(xùn)練的優(yōu)質(zhì)‘燃料’,并一點點打磨、校準,讓模型變得更聰明、更精準。”
在人工智能時代,數(shù)據(jù)被譽為“新石油”,而標注則是將數(shù)據(jù)“原油”煉成“汽油”的關(guān)鍵工藝。依托天津經(jīng)開區(qū)內(nèi)的國家級人力資源產(chǎn)業(yè)園、中國北方首家數(shù)字游民國際人才港、泰達中小企業(yè)園片區(qū)等資源,北方高端數(shù)據(jù)標注產(chǎn)業(yè)園已聚集經(jīng)緯智圖、融匯(天津)智能科技有限公司等近10家數(shù)據(jù)標注企業(yè),年產(chǎn)值超過1億元。
新興業(yè)務(wù)持續(xù)增長
引入“AI教AI”模式
從事數(shù)據(jù)標注行業(yè)10余年,張紅發(fā)現(xiàn)具身智能等AI領(lǐng)域的標注業(yè)務(wù)增長很快。“今年,我們接了一些自動駕駛、機器人方面的標注項目,這類業(yè)務(wù)以前占比不到5%,現(xiàn)在超過了20%,未來有望達到50%。”他說。
隨著AI市場持續(xù)火爆,數(shù)據(jù)標注需求水漲船高,也讓經(jīng)緯智圖更忙了。
“最近,我們剛談下與廣東一家移動出行科技公司的業(yè)務(wù)合作,訂單量十分充足。”張紅告訴記者,公司數(shù)據(jù)標注業(yè)務(wù)主要覆蓋智慧出行、倉儲物流、教育培訓(xùn)及智能機器人等應(yīng)用場景,業(yè)務(wù)伙伴以京津冀地區(qū)頭部出行機構(gòu)、互聯(lián)網(wǎng)平臺為主,其中北京客戶占比約八成。
日前,記者走進經(jīng)緯智圖數(shù)據(jù)標注基地,100余名數(shù)據(jù)標注員點擊鼠標的聲音此起彼伏。屏幕上鋪滿了各類圖片和數(shù)據(jù),大家紛紛用鼠標拖動標記框或勾勒線路,精準標記著每一個要素。
“你看,這條鄉(xiāng)間小路之前并沒有被標注出來,但通過司機行車軌跡形成的熱力圖,我們發(fā)現(xiàn)‘原來這里真的可以走’。”現(xiàn)場,數(shù)據(jù)標注員王霞對記者說,基于熱力數(shù)據(jù)和實景圖片,她在電子地圖上把這條路“畫”了出來,讓原本無法導(dǎo)航的區(qū)域?qū)崿F(xiàn)精準導(dǎo)航。“我主要做圖片標記、倉庫地圖繪制等業(yè)務(wù),忙的時候一天處理上千條信息。”她說。
怎樣判斷AI“啟蒙老師”是否稱職?
張紅給出的答案是:數(shù)據(jù)標注準確率需達到99.9%以上,這意味著每1000個標注樣本中,最多只能錯1個。
為提升數(shù)據(jù)標注能力,張紅聯(lián)手河北鼎聯(lián)科技有限公司開發(fā)了“鼎聯(lián)AI數(shù)據(jù)標注平臺”。該平臺已會聚全國各地超16萬名兼職標注員,其中不乏金融、醫(yī)療、工業(yè)等領(lǐng)域的專業(yè)人才。大家可在平臺完成線上培訓(xùn)、接單、生產(chǎn)、驗收、交付、結(jié)算的全流程工作。
專業(yè)人才的加持,讓數(shù)據(jù)標注準確率穩(wěn)步提升。除此之外,張紅還有另一項“殺手锏”——引入智能標注技術(shù),讓“AI教AI”。
“AI算法可以先自動識別出圖片中車輛、紅綠燈等物體并標注位置,人工只需快速復(fù)核,修正個別錯誤。”張紅介紹,這種通過AI模型實現(xiàn)的智能標注技術(shù),可使整體標注效率提升30%以上,適用于智能駕駛、智慧教育、工業(yè)質(zhì)檢等標準化場景。“目前,我們以人機協(xié)同作業(yè)為主,對于判定難度較高的復(fù)雜數(shù)據(jù),會人工二次標注確認,確保每一份交付數(shù)據(jù)的質(zhì)量。”他說。
“采標一體”成趨勢
產(chǎn)業(yè)園打造特色標桿
隨著具身智能等領(lǐng)域快速發(fā)展,高質(zhì)量數(shù)據(jù)集的重要性愈發(fā)凸顯。
“過去做數(shù)據(jù)標注,更看重數(shù)據(jù)量夠不夠大、夠不夠全;如今則更注重數(shù)據(jù)品質(zhì),但不少場景并沒有現(xiàn)成可用的數(shù)據(jù)資源。”張紅坦言,比如讓機器人疊衣服這類操作,就缺乏高質(zhì)量數(shù)據(jù)集支撐,必須開展全新的數(shù)據(jù)采集工作,這也為數(shù)據(jù)標注行業(yè)帶來新的發(fā)展空間。
眼下,經(jīng)緯智圖正著手布局數(shù)據(jù)采集相關(guān)業(yè)務(wù),例如借助穿戴設(shè)備還原人類動作,在采集數(shù)據(jù)的同時完成標注工作,形成“采標一體”的業(yè)務(wù)閉環(huán),提供涵蓋數(shù)據(jù)采集、清洗處理到標注的一站式服務(wù)。這意味著,數(shù)據(jù)標注逐漸從早期的基礎(chǔ)“啟蒙教學(xué)”階段,向著高品質(zhì)、智能化、一體化方向升級,為人工智能發(fā)展提供源源不斷的“動力原料”。
為推動數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展,北方高端數(shù)據(jù)標注產(chǎn)業(yè)園放眼長遠,著力培育“標注服務(wù)+技術(shù)研發(fā)+場景應(yīng)用+人才培育”四位一體的產(chǎn)業(yè)生態(tài)。
“這個產(chǎn)業(yè)園緊鄰長城汽車、騰訊、博蘊生物等龍頭企業(yè),能夠快速響應(yīng)本地市場需求,未來將構(gòu)建從數(shù)據(jù)標注、模型訓(xùn)練到產(chǎn)業(yè)應(yīng)用的完整發(fā)展閉環(huán),形成發(fā)展合力。”天津經(jīng)開區(qū)工業(yè)和信息化局相關(guān)負責人介紹,目前,北方高端數(shù)據(jù)標注產(chǎn)業(yè)園正加快建設(shè)智能標注產(chǎn)業(yè)賦能平臺與專項算力支持平臺,服務(wù)覆蓋數(shù)據(jù)處理、質(zhì)量評測、模型測試、人才實訓(xùn)等全鏈條環(huán)節(jié),并配備高性能算力資源,保障大規(guī)模標注任務(wù)高效推進;同時,與天津科技大學(xué)等高校開展數(shù)據(jù)標注工程師定向人才培養(yǎng),年培養(yǎng)規(guī)模有望達2000人以上。
按照規(guī)劃,北方高端數(shù)據(jù)標注產(chǎn)業(yè)園將通過3—5年建設(shè),力爭引入數(shù)據(jù)標注及上下游關(guān)聯(lián)企業(yè)20家以上,年產(chǎn)值突破5億元,打造自動駕駛、智慧醫(yī)療、工業(yè)智能等細分領(lǐng)域特色標桿。
今年,張紅也定下了新目標:“目前,我們在對接一家乳品企業(yè),圍繞生產(chǎn)質(zhì)檢開展數(shù)據(jù)標注合作。一旦落地,將助力企業(yè)在生產(chǎn)線上實現(xiàn)不合格產(chǎn)品自動識別、智能剔除,完成從人工查驗到智能篩選的升級轉(zhuǎn)型。未來這樣的合作場景還有很多,我們有信心今年數(shù)據(jù)處理業(yè)務(wù)實現(xiàn)兩位數(shù)增長。”
信息來源:《天津日報》
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.