![]()
作者 | 樊雅婷
郵箱 | fanyating@pingwest.com
早上九點(diǎn),小林戴上耳機(jī),打開(kāi)標(biāo)注平臺(tái),耳朵里傳來(lái)一段帶四川口音的普通話。
她要先逐字把這段語(yǔ)音轉(zhuǎn)寫(xiě)出來(lái),再標(biāo)出發(fā)音偏差、語(yǔ)調(diào)異常和方言特征詞,最后判斷 AI 的識(shí)別結(jié)果哪里對(duì)了、哪里跑偏。聽(tīng)起來(lái)像在聽(tīng)播客,旁人或許以為她在摸魚(yú),可這就是她的工作。
她的官方 title 叫"數(shù)據(jù)標(biāo)注員",但她更愿意說(shuō)自己是"AI 訓(xùn)練師"——這樣聽(tīng)起來(lái)酷一點(diǎn)。畢竟在大多數(shù)人的認(rèn)知里,這份工作就是 AI 時(shí)代的流水線:面對(duì)電腦,機(jī)械地點(diǎn)鼠標(biāo),日復(fù)一日地畫(huà)框、打標(biāo)簽,技術(shù)含量不高,是典型的"人肉電池"。
可一旦有人追問(wèn)"具體做什么",小林通常會(huì)沉默兩秒,然后答:"就……教 AI 聽(tīng)人話。"再多的,她也說(shuō)不上來(lái)了。
也許下面這份從業(yè)者簡(jiǎn)歷里的工作描述,大致能說(shuō)明他們每天在做的事。
對(duì)于越來(lái)越多想進(jìn)入AI行業(yè)的年輕人,數(shù)據(jù)標(biāo)準(zhǔn)正在成為他們會(huì)考慮的入門(mén)工作,這個(gè)工種因何而生,整個(gè)行業(yè)是什么面貌,從業(yè)者又將走向何方——我們抓取了 Boss 直聘上"數(shù)據(jù)標(biāo)注"關(guān)鍵詞下、base 在北京的 302 個(gè)崗位,逐一拆解其中 151 份完整 JD。
1
同一份標(biāo)注工作,月薪能差出三十倍
ChatGPT 會(huì)寫(xiě)詩(shī),靠的是標(biāo)注員逐條評(píng)價(jià)"這句好、那句差";自動(dòng)駕駛能在路口認(rèn)出紅綠燈,是因?yàn)橛腥藢?duì)著數(shù)萬(wàn)張街景圖、一個(gè)像素一個(gè)像素地描出邊界。你對(duì) agent 說(shuō)一句"播放周杰倫的歌",它一秒就聽(tīng)懂并執(zhí)行,這背后是成千上萬(wàn)條帶口音、帶環(huán)境噪聲、帶吞音連讀的語(yǔ)音指令被人工標(biāo)好了。
如今為了更自然的交互,語(yǔ)音標(biāo)注的復(fù)雜度還在指數(shù)級(jí)上升——不再只是把聲音轉(zhuǎn)成文字,而是要標(biāo)出情緒、意圖、語(yǔ)用場(chǎng)景,連方言里那點(diǎn)微妙差異都要標(biāo),模型才能真正學(xué)會(huì)"聽(tīng)人話"。
每一處智能閃光,都有一雙人類的手在托底。這雙手的主人靠它掙多少、能干多久,是另一回事。先看收入。
151 份完整 JD 里,北京數(shù)據(jù)標(biāo)注崗位月薪中位數(shù) 10500 元,最低 2K,最高 65K——首尾相差三十多倍。
低薪這頭多是實(shí)習(xí)、兼職和眾包。日薪崗有 84 個(gè),中位 185 元/天,招聘帖上寫(xiě)著"數(shù)據(jù)標(biāo)注,雙休,小白可做",學(xué)歷經(jīng)驗(yàn)全不限,月薪 4-5K。光譜另一端,百度給自動(dòng)駕駛數(shù)據(jù)標(biāo)注算法實(shí)習(xí)生開(kāi)出 500-600 元/天,要求碩士;阿里巴巴的 AI 訓(xùn)練師崗 20-35K、16 薪,同樣卡碩士。
同為標(biāo)注,身價(jià)差出十倍。差距來(lái)自工作內(nèi)容早已分化:低薪端是執(zhí)行,按要求標(biāo)、按 SOP 做;高薪端是定義,定標(biāo)注規(guī)則、管質(zhì)量標(biāo)準(zhǔn)、打通算法和數(shù)據(jù)的閉環(huán)。前者可替代,后者難復(fù)制。
一個(gè)在標(biāo)注行業(yè)干了六年的老兵說(shuō)得直白:2016 年,標(biāo)注員是手藝人,熟手吃香;現(xiàn)在,標(biāo)注員是流水線工人,誰(shuí)都能干,你就是個(gè)賬號(hào)。
1
從"畫(huà)框"到替 AI 拿主意
151 份 JD 能分出四種主要模態(tài)。
文本標(biāo)注占 16%,做語(yǔ)料清洗、對(duì)話質(zhì)量評(píng)估、多語(yǔ)言翻譯校對(duì)。
大模型時(shí)代這類需求暴增——騰訊在招"大模型數(shù)據(jù)標(biāo)注-代碼方向",應(yīng)聘者得看懂代碼,判斷 AI 寫(xiě)的程序哪里好、哪里有 bug,再用人的判斷去糾正它。
圖像和視頻標(biāo)注占 17%,包含框選、描點(diǎn)、分割、關(guān)鍵點(diǎn)標(biāo)注,自動(dòng)駕駛是大戶。
某大型車(chē)企的"智駕數(shù)據(jù)標(biāo)注算法工程師"崗,要求處理 4D 點(diǎn)云和 LiDAR 數(shù)據(jù),輸出時(shí)序一致的 BBox 真值,月薪 40-70K、15 薪。這早不是"畫(huà)框",而是要懂傳感器原理和三維空間關(guān)系。
![]()
語(yǔ)音和音頻標(biāo)注在招聘平臺(tái)占比最低,只有 1%,要求卻一點(diǎn)不低。
今年 6 月初,馬斯克的 xAI 面向全球招中文 AI 導(dǎo)師,訓(xùn)練 Grok 的中文語(yǔ)音能力,要求母語(yǔ)級(jí)中文、熟悉方言和地域口音差異,能做語(yǔ)音轉(zhuǎn)寫(xiě)、發(fā)音糾錯(cuò)和音頻標(biāo)注,美國(guó)境內(nèi)時(shí)薪 35-45 美元。同一時(shí)期,京東科技在招法語(yǔ)、德語(yǔ)、荷蘭語(yǔ)標(biāo)注,專八是門(mén)檻,要能識(shí)別發(fā)音錯(cuò)誤和語(yǔ)調(diào)偏差——標(biāo)準(zhǔn)堪比語(yǔ)言學(xué)研究。
![]()
多模態(tài)和綜合標(biāo)注占比最大,達(dá) 36%,一個(gè)崗位同時(shí)涉及圖文音視頻,常見(jiàn)于大模型數(shù)據(jù)團(tuán)隊(duì)。單一技能的可替代性越來(lái)越高,全能選手更吃香。
把這 151 份 JD 按業(yè)務(wù)領(lǐng)域看,分布高度集中:
大模型/AIGC 語(yǔ)料直接占 28%,自動(dòng)駕駛和醫(yī)療影像各占 7%。近三成崗位在給大模型"喂飯"。軍備競(jìng)賽進(jìn)入白熱化,GPU 數(shù)量不再是唯一籌碼,誰(shuí)的數(shù)據(jù)更貼近真實(shí)人類,誰(shuí)就多一分勝算。
門(mén)檻也跟著被改寫(xiě)。近九成崗位要求本科或大專,表面仍是低門(mén)檻工種。但那 13 個(gè)卡碩士的崗位,幾乎全扎在大模型評(píng)測(cè)、算法配套和海外多語(yǔ)言方向——盛大網(wǎng)絡(luò)"專家級(jí)數(shù)據(jù)標(biāo)注師"日薪 400-800 元,要碩士、可遠(yuǎn)程;阿里訓(xùn)練師 20-35K、16 薪,非碩士不招;還有金融類標(biāo)注專家,時(shí)薪 150-200 元。
![]()
專業(yè)壁壘也在往高了筑。醫(yī)療標(biāo)注明確要臨床醫(yī)學(xué)、影像學(xué)背景;代碼方向要計(jì)算機(jī)專業(yè),能寫(xiě)能 debug;影視美學(xué)標(biāo)注青睞戲劇影視文學(xué)、數(shù)字媒體藝術(shù);金融標(biāo)注要金融經(jīng)濟(jì)專業(yè);具身智能標(biāo)注則指向機(jī)械和自動(dòng)化。離數(shù)據(jù)價(jià)值鏈的上游越近,越不只靠細(xì)心和耐心,而是實(shí)打?qū)嵉念I(lǐng)域知識(shí)。
同一頂帽子底下,眾包日薪 100 與專家月薪 6.5 萬(wàn)并存,中間地帶正被持續(xù)擠壓。
換個(gè)角度,一個(gè)崗位能同時(shí)容下學(xué)醫(yī)的、寫(xiě)代碼的、做設(shè)計(jì)的、搞金融的,它也正在變成幾乎所有專業(yè)的出口。
1
大廠定規(guī)則,外包拆包
再看招聘池里的公司,大廠和外包商涇渭分明。
302 個(gè)崗位中能認(rèn)出的大廠有京東、騰訊、阿里、快手、小紅書(shū)、百度,但招人最多的不是它們,而是標(biāo)注外包公司和數(shù)據(jù)服務(wù)商——海天瑞聲、云測(cè)數(shù)據(jù)、倍賽科技牢牢占據(jù)崗位數(shù)前列。
行業(yè)邏輯很清晰:大廠定標(biāo)注規(guī)則和評(píng)測(cè)標(biāo)準(zhǔn),外包公司拆成細(xì)碎 SOP 再層層分包。
許多標(biāo)注員覺(jué)得工作機(jī)械、看不到全貌,原因就在這里——他們站在流水線末端,手里只有一個(gè)賬號(hào)和一套指令。
但核心模型能力,大廠從不輕易交出去。
騰訊親自招代碼方向的大模型標(biāo)注,快手直接為可靈 AI 招標(biāo)注項(xiàng)目管理,小紅書(shū)招大模型數(shù)據(jù)標(biāo)注實(shí)習(xí)生。模型越關(guān)鍵,數(shù)據(jù)質(zhì)量越要握在自己手里。
1
數(shù)據(jù)標(biāo)注的過(guò)去,現(xiàn)在和未來(lái)
數(shù)據(jù)標(biāo)準(zhǔn)已經(jīng)成為AI進(jìn)展背后的人類底座。而要理解它如何發(fā)展到今天,未來(lái)會(huì)走向何方,還是要看一看它一整個(gè)歷史。
2006—2014,是前標(biāo)注時(shí)代。
那時(shí)"數(shù)據(jù)標(biāo)注"還不算一個(gè)職業(yè)。李飛飛在普林斯頓啟動(dòng) ImageNet 時(shí),最初以 10 美元時(shí)薪雇本科生逐張標(biāo)圖,可學(xué)生很快受不了這種重復(fù)勞動(dòng),按當(dāng)時(shí)效率估算,標(biāo)完整個(gè)數(shù)據(jù)集要 19 年。轉(zhuǎn)機(jī)來(lái)自 Amazon Mechanical Turk:2008 到 2010 年,來(lái)自 167 個(gè)國(guó)家的近 5 萬(wàn)名眾包工人,完成了超過(guò) 1400 萬(wàn)張圖片的標(biāo)注。在學(xué)術(shù)圈,做標(biāo)注被當(dāng)成"搬磚",李飛飛的基金申請(qǐng)甚至被 NIH 評(píng)審批為"普林斯頓做這個(gè)是一種恥辱"。
![]()
2012 年,AlexNet 以 15.3% 的 top-5 錯(cuò)誤率拿下 ILSVRC 冠軍,領(lǐng)先第二名超過(guò) 10 個(gè)百分點(diǎn),Yann LeCun 后來(lái)稱之為計(jì)算機(jī)視覺(jué)史上無(wú)可爭(zhēng)議的轉(zhuǎn)折點(diǎn)。整個(gè)行業(yè)由此意識(shí)到:算法差距可以追趕,數(shù)據(jù)差距才是壁壘。標(biāo)注這件事,第一次有了變成一門(mén)生意的可能。
2014—2017,標(biāo)注工廠時(shí)代。
第一批數(shù)據(jù)標(biāo)注公司成立,這些公司選址往往在三線城市,理由很現(xiàn)實(shí):人力便宜、租金便宜、有補(bǔ)貼。"我們就是在吃人口紅利,"一位標(biāo)注公司老板曾毫不避諱地說(shuō),"開(kāi)在北京一個(gè)月 4000 招不到人,開(kāi)到縣城 2000 就有人搶著干。"
大量農(nóng)村青年、小鎮(zhèn)寶媽、殘障人士經(jīng)培訓(xùn)成了標(biāo)注員,在產(chǎn)業(yè)匱乏的縣城,月入 3000-5000 已是體面收入。但他們大多不知道自己在做什么:"每天就是拉框拉框拉框,這些框拿去干嘛,沒(méi)人告訴我們。"
![]()
2017—2020,分化與升級(jí)。
一些大廠開(kāi)始建起更大規(guī)模的數(shù)據(jù)標(biāo)注基地,大廠入場(chǎng)帶來(lái)標(biāo)準(zhǔn)化和分層。標(biāo)注師群體開(kāi)始分化:底層仍是基礎(chǔ)框選,往上是質(zhì)檢員,再往上是標(biāo)注規(guī)則師——要懂 AI 基本原理,收入翻好幾倍。2020年初,人社部正式將"人工智能訓(xùn)練師"納入國(guó)家職業(yè)分類目錄,頂級(jí)訓(xùn)練師年薪已超過(guò)30萬(wàn)。
2020 至今,AI 反噬。
GPT-3 論文(《Language Models are Few-Shot Learners》,NeurIPS 2020)證明了大模型的少樣本學(xué)習(xí)能力,模型不再需要海量人工標(biāo)注也能完成許多任務(wù)。同時(shí)自動(dòng)標(biāo)注技術(shù)成熟、合成數(shù)據(jù)崛起,行業(yè)自動(dòng)化率從三年前的約 30% 飆到 60% 以上。
但 RLHF 又催生出一類全新需求:給模型輸出做偏好排序、評(píng)估事實(shí)準(zhǔn)確性、糾正推理鏈路——這些活不再叫標(biāo)注,而叫提示詞工程師或 AI 對(duì)齊訓(xùn)練師,技能門(mén)檻完全不同。
這種替代已經(jīng)寫(xiě)進(jìn)了招聘啟事。百度的"自動(dòng)駕駛數(shù)據(jù)標(biāo)注模型算法實(shí)習(xí)生",工作內(nèi)容就是開(kāi)發(fā)預(yù)標(biāo)注模型,讓 AI 自己標(biāo)數(shù)據(jù)。"自動(dòng)標(biāo)注+人工復(fù)核"成了主流工作流:AI 先粗標(biāo)一版,人負(fù)責(zé)質(zhì)檢、糾錯(cuò)、補(bǔ)齊邊界案例。基礎(chǔ)重復(fù)性標(biāo)注確實(shí)在被吞噬,可"這版標(biāo)得好不好""邊界案例怎么處理""這段畫(huà)面美感夠不夠",這類要主觀判斷和領(lǐng)域經(jīng)驗(yàn)的環(huán)節(jié),仍得人來(lái)兜底。
2024 年的行業(yè)數(shù)據(jù)呈現(xiàn)出一道明確的剪刀差:80% 的投資流向自動(dòng)標(biāo)注公司,傳統(tǒng)勞動(dòng)密集型標(biāo)注企業(yè)拿到的融資不到 5%;基礎(chǔ)標(biāo)注用工在收縮,懂醫(yī)學(xué)、法律、金融的專家級(jí)標(biāo)注師卻持續(xù)緊缺。
一位 AI 公司 HR 對(duì)我們說(shuō)得更直接:"AI 訓(xùn)練師的薪資是標(biāo)注員的 3-5 倍,但我們幾乎不會(huì)從標(biāo)注員里招訓(xùn)練師,寧愿招剛畢業(yè)的計(jì)算機(jī)系學(xué)生從頭帶。"
純執(zhí)行型標(biāo)注員正在退場(chǎng)。留下的,要么有某個(gè)領(lǐng)域里難以替代的專業(yè)判斷,要么有質(zhì)量管理和項(xiàng)目統(tǒng)籌的能力。
![]()
回到開(kāi)頭我們提到的小林,她對(duì)我們表示,現(xiàn)在她不只做語(yǔ)音轉(zhuǎn)寫(xiě)。每天要開(kāi)團(tuán)隊(duì)對(duì)齊會(huì),爭(zhēng)論方言口音的標(biāo)注邊界該劃在哪兒;要寫(xiě)質(zhì)檢報(bào)告,分析語(yǔ)音模型在哪幾個(gè)聲調(diào)上最容易翻車(chē);偶爾被拉去和算法工程師開(kāi)會(huì),憑聽(tīng)感給語(yǔ)料提改進(jìn)意見(jiàn)。
這一行變得太快了。去年還在標(biāo)文本對(duì)話,今年改標(biāo)語(yǔ)音語(yǔ)調(diào),明年也許要標(biāo)機(jī)器人的動(dòng)作數(shù)據(jù)。這似乎在給這個(gè)工作崗位帶來(lái)更多的需求,但同時(shí)AI的自動(dòng)標(biāo)注也在快速搶走這些新出現(xiàn)的需求。數(shù)據(jù)標(biāo)注依然會(huì)是不可或缺的AI背后的人類底座,只不過(guò)接下來(lái)它注定把會(huì)被替代的人和不會(huì)被替代的人分到越來(lái)越遠(yuǎn)的兩端。
![]()
點(diǎn)個(gè)“愛(ài)心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.