无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

時薪800、學歷碩士起:大廠熱搶的AI數據“煉金師”到底在做什么?

0
分享至


智東西
作者 陳駿達
編輯 心緣

在公眾的傳統認知里,AI數據標注始終帶著某種“數字流水線”的色彩。

它通常意味著坐在電腦前,重復處理著圖片、語音或文本,比如給自動駕駛圖像逐一框出行人與車輛,為語音系統一句句校對字幕,或者按照既定規則為數據打上標簽。其低門檻、低薪資、機械性的特質,堪比AI時代的“電子廠”。

但當大模型浪潮席卷AI行業之后,數據標注行業開始出現一種出人意料的變化。雖然傳統數據標注工作仍有龐大需求,但越來越多AI企業,尤其是頭部大模型廠商,正在尋找一種更有技術含量的新型標注員。

如今,阿里、字節、DeepSeek、MiniMax等企業的一些相關崗位,不再冠以“數據標注”的名稱,而是改名為“數據百曉生”、“AI出題專家”、“數據煉金師”等等。

能力要求也隨之變化。不少崗位的學歷要求提高到碩士及以上,擁有法律、金融、醫學、編程、語言學等專業背景,或是具備豐富從業經驗和競賽經歷的人才更為吃香。


要求提升后,這些崗位的薪資待遇也有可觀的上浮。在Boss直聘等招聘平臺上,金融、法律、醫學等垂類任務已經出現每小時500-800元的報價。即便是在大廠做外包崗,這類崗位的月薪也從傳統數據標注三四千元的水平,提高到8000-10000元左右的水平。

大模型時代的數據標注,正在成為一種復雜得多的職業。而這一變化背后,其實對應著AI產業自身的一次轉向。

一、AI數據標注,為什么突然需要專家?

大模型行業的數據供給模式,正在發生變化。

早期大模型的訓練高度依賴海量公開數據,廠商抓取互聯網文本、圖片和視頻,讓模型學習語言規律與世界知識。在這一階段,算力、參數和數據規模很大程度上決定了模型能力上限,這也構成了預訓練階段的Scaling Law。

然而,互聯網上的數據終歸是有限的。2024年,OpenAI前首席科學家Ilya Sutskever就曾提出一個觀點,互聯網上用于訓練模型的數據即將枯竭,這可能會終結我們過去所熟知的預訓練范式。

具體到中文上,這一數據短缺的問題可能會更嚴重。阿里研究院發布的《大模型訓練數據白皮書》顯示,互聯網上中文語料和英文語料占比存在顯著差異,英文語料占比高達59.8%,而中文語料僅占1.3%。

同時,互聯網數據并非天然的高質量資源,其中大量內容存在重復、噪聲、錯誤甚至相互矛盾的語料。模型可以靠互聯網數據學習語言模式,卻未必能夠形成可靠判斷。


▲某大廠的數據標注崗位要求中,提到了高質量中文數據的短缺

合成數據雖被視為緩解這一問題的路徑,但難以根本解決問題。模型生成的數據受限于自身能力邊界,可以擴展已有知識,卻難以創造超出自身認知的判斷標準。

因此,后訓練階段的Scaling逐漸成為行業重點。這一階段,模型能力的提升越來越依賴人工反饋,包括模型評測、偏好數據構建以及RLHF等工作。模型需要人類告訴它,什么答案更優,什么邏輯更符合現實,什么表達更符合專業標準。

而在金融、法律、醫療等專業領域,以及推理、創意寫作等復雜任務中,只有具備深厚專業知識和判斷能力的人,才能產出真正高質量的數據,反哺模型的能力提升。

二、時薪可達500元,但學歷并非通關密碼

隨著后訓練重要性的持續提升,從2025年下半年開始,字節、阿里等國內大廠和DeepSeek、MiniMax、智譜等AI頭部廠商,陸續在招聘平臺、高校社群和社交媒體上宣傳自家的專家數據平臺或是高級數據標注崗位,吸引更多專業人才加入。

為了理解這類新型數據標注工作的具體內容,智東西采訪了兩位參與者。他們進入行業的路徑不同,所處職業階段也不相同,對工作的感受更存在明顯差異,但都在參與同一件事:幫助模型學習如何判斷、理解與表達。

去年,擁有十多年金融和互聯網從業經歷的Molly,在社交平臺上看到字節專家數據平臺Xpert的招募信息后,隨即投遞了簡歷。

▲字節專家數據標注平臺Xpert

真正進入平臺之前,她首先需要通過測試。候選人不僅要證明自身專業背景,還需要設計能夠“難倒模型”的問題。平臺會同時調用多個模型進行驗證,只有當至少兩個模型回答失敗時,題目才有機會被認定為有效。

Molly并不覺得測試困難,但她也觀察到,不少參與測試的候選人會卡在這一環節。在她看來,原因并不只是學歷高低,而是真實行業經驗的差異。“很多碩博學生沒有真正的從業經歷,所以很難設計出有行業深度的問題。”她說。

最終,Molly進入了商科與金融方向的專家任務組。她提到,這類任務往往對應真實業務場景。以投資盡調場景為例,多種模型會模擬機構對項目開展評估,圍繞風險、運營與商業可行性生成數份上萬字分析報告。

而她的工作,則是以金融從業者的視角,對這些結果進行比較與判斷:哪份分析更符合真實業務邏輯,風險識別是否充分,評估框架是否貼近實際決策流程。完成選擇之后,工作并未結束。她還需要進一步拆解判斷過程,從多個維度解釋依據,并指出其他答案存在的問題。

這類任務采用時薪制,根據測試結果和專業能力進行分級。Molly觀察到,在金融方向,300元至500元時薪并不罕見。

需要補充的是,這份工作的時薪并不能直接換算為月薪,其薪酬完全與工作量掛鉤,專家每天接多少任務、平臺每天放多少任務,都會影響專家在一段時間內的總收入。

在Xpert上,大多數任務都可以在線完成,但需要全程錄屏以防作弊,確保判斷來自真實專家,而非其他AI工具。

在Molly看來,這份工作的核心能力要求并不是學歷,而是長期積累的行業經驗,真正做過投資、做過評估,才知道模型的問題在哪。

除了金融相關任務,Molly有時也會主動選擇一些時薪較低的邏輯題。在她眼里,這些任務更像桌游,因此做起來頗有趣味。

談起這些經歷時,Molly始終帶著一種明顯的興奮感。我們問她是否享受這份工作,她幾乎沒有猶豫地說道:“很快樂。”

三、創意外殼之下,數據標注仍是流水線?

不是所有人都像Molly那樣,將這份工作視為享受。

畢業于中國礦業大學的淵星在2025年5月以外包身份進入一家互聯網大廠,從事AI小說方向的標注工作,半年后離職。這是他人生中的第一份工作。他說:“在入職之前,我沒有任何工作經驗,也沒有做過數據標注。”

他所在的AI小說項目組剛成立不久,正處于缺人階段。相比成熟團隊優先招募有標注經驗的從業者,這個組更看重寫作背景。

淵星恰好符合這一點。他有出版經歷,也拿過一些寫作獎項,因此即使缺乏標注經驗,仍順利通過面試進入團隊。

但真正入職后,他發現,這份工作的實際內容與外界對“AI小說”的想象并不完全一致:拋去創意工作的外殼,其本質上是一套高度細分的數據生產流程。

淵星所在的團隊需要同時處理多個模型生成結果:同一個小說指令會被交給該大廠的模型以及其他競品模型作答,標注員則負責逐條閱讀、比較,并依據規則判斷問題所在。

這份工作對專業能力有著不低的要求。團隊里有大概一半人干過編劇,其他人則有網文創作、媒體投稿的經歷,標注員需要判斷人物行為是否符合設定、劇情推進是否合理、沖突是否成立,一切都被拆解成細致的評分標準。

完成問題識別后,標注員還要給模型輸出打分,并在部分項目中對文本進行人工改寫,刪除冗余描寫、修補邏輯漏洞,或重新調整結構。其中一項工作是為長篇小說“抽細綱”。一部十幾章、上萬字的小說,需要被逐章提煉成結構化大綱,再作為模型擴寫和訓練的數據輸入。

從本質上來看,這更像一種需要文學判斷力的流水線工作,任務高度重復、標準化。淵星認為,標注員在生態鏈中的位置很低。

淵星稱,他的工作時間是每天上午9:30到晚上6:30,中午有90分鐘休息時間,上下班時間彈性,基本不會加班。

盡管對文學審美和寫作能力有一定要求,但淵星的薪資水平并不高。他在北京工作,每月到手收入約為8000元,五險一金按當地最低標準繳納。

四、同一份數據標注,不同的職業現實

同樣從事數據標注,Molly與淵星卻身處兩個截然不同的世界:一邊是高度專業、能獲得價值感的崗位,另一邊雖也有專業性要求,卻更像是枯燥壓抑的流水線。

這種分化,也塑造了他們對AI行業完全不同的理解。

Molly對這份工作抱有明顯認同。在她看來,制造數據、訓練AI本質上是一種知識共享過程。金融專家、法律專家、心理咨詢師都在向模型輸入經驗,而模型再以更低成本回流給社會。

在過去一年里,她明顯感受到模型迭代越來越快。金融領域里,監管規則和行業變化頻繁,而早期模型經常無法識別這些變化,如今類似問題已經減少。

除了標注工作外,Molly還將AI應用到了她的另一個身份上。她經營著一家心理咨詢工作室,過去,咨詢師需要花費大量成本尋求專業督導(由經驗豐富的咨詢師對其他咨詢師的工作進行評估和支持),而現在,她開始借助模型完成部分督導的需求。

她相信,這會讓專業服務變得更加普惠。

淵星的感受則更克制。他承認模型在進步,但這種進步并不總是直觀,尤其在小說領域,半年時間里,他并未看到令人驚艷的變化。

更重要的是,他始終難以確認自己的勞動究竟產生了多大作用。模型吸收的是海量數據,而他處理的只是極小部分。即便模型提升,他也無法清楚判斷,哪些改變真正來自自己的工作。

這種感覺,他形容為“黑箱”。勞動存在,但成果距離自己很遠。

淵星還在他的敘述中提到一個體驗——“被挑刺”。在日常工作中,數據必須經過質檢員修改才能提交。質檢員每改完一篇,都會在群里@標注員并指出問題,群里幾乎全是問題反饋,從不說哪里寫得好。

然而,在小說標注這種高度主觀的任務中,所謂“錯誤”并不總是絕對的,而更像是不同理解之間的差異。但在流程中,它仍然會被呈現為需要修正的問題。

淵星觀察到,很多標注員在工作中開始懷疑自己的價值,他們所處的工作氛圍也比較壓抑。在他工作的半年時間里,有兩位同事因此離職。

結語:誰在教會AI理解世界

如何高效地組織人類經驗,正成為大模型下一階段競爭的關鍵因素。在這一過程中,像Molly和淵星這樣的參與者,構成了連接模型與真實行業經驗的關鍵節點:他們將自身的專業知識與判斷能力,按照易于模型理解與吸收的形式重新組織,再注入訓練與反饋流程之中。

在大模型時代,這項工作不再以相對單一、固定的形態存在,而是被進一步細化、拆解。從通用標注走向領域分工,從簡單判斷走向復雜推理,從結果打分走向過程解釋,數據生產正在形成更精細的任務鏈條。

與此同時,也需要看到這種新型知識工作給人帶來的差異體驗。有人在其中獲得價值感,也有人在重復與標準化流程中被消耗。如何讓人的經驗被更有尊嚴地對待、讓專業判斷的價值被更清晰地看見,正在成為這個新生產體系中無法回避的問題。

注:Molly、淵星均為化名

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
《主角》原著:14歲被玷污,20歲閃婚生下低能兒,50歲被養女背刺

《主角》原著:14歲被玷污,20歲閃婚生下低能兒,50歲被養女背刺

慢半拍sir
2026-05-18 21:23:56
《主角》劉浩存“翻跟斗”這段戲,在全網火了,原來張嘉譯沒說謊

《主角》劉浩存“翻跟斗”這段戲,在全網火了,原來張嘉譯沒說謊

空樽對月花獨瘦
2026-05-20 10:17:55
巨嬰!孫楊采訪中途突然打斷主持人說到飯點了,直接拿手機點起外賣

巨嬰!孫楊采訪中途突然打斷主持人說到飯點了,直接拿手機點起外賣

818體育
2026-05-19 17:52:24
主帥被籃協禁賽三年,上海玄鳥:堅決擁護并執行處罰決定

主帥被籃協禁賽三年,上海玄鳥:堅決擁護并執行處罰決定

懂球帝
2026-05-20 16:20:08
沒完沒了?巴薩婉拒7000萬買下巴斯托尼,轉向搶購國米邊翼衛人選

沒完沒了?巴薩婉拒7000萬買下巴斯托尼,轉向搶購國米邊翼衛人選

里芃芃體育
2026-05-20 16:00:07
電車開8年,就成一堆廢鐵了嗎?

電車開8年,就成一堆廢鐵了嗎?

百車全說
2026-05-20 18:19:43
中冠官方:武漢車谷合和綠茵退出本賽季中冠,廣州悅高遞補

中冠官方:武漢車谷合和綠茵退出本賽季中冠,廣州悅高遞補

懂球帝
2026-05-20 15:59:45
海南一兒童吃手撕肉干碎渣掉地上,螞蟻群啃食后短時間內集體死亡,“零食配料中有亞硝酸鈉對螞蟻來說超量”

海南一兒童吃手撕肉干碎渣掉地上,螞蟻群啃食后短時間內集體死亡,“零食配料中有亞硝酸鈉對螞蟻來說超量”

大象新聞
2026-05-20 20:46:05
夢鴿李天一赴美不歸?看到85歲李雙江“現狀”,原來楊洪基沒說謊

夢鴿李天一赴美不歸?看到85歲李雙江“現狀”,原來楊洪基沒說謊

阿纂看事
2024-11-05 11:54:58
明日24時,油價調整

明日24時,油價調整

南昌青云譜發布
2026-05-20 16:26:29
狼群從不碰蒙古包?牧民三招防狼,游牧先民的智慧太絕了!

狼群從不碰蒙古包?牧民三招防狼,游牧先民的智慧太絕了!

老達子
2026-05-20 06:20:03
直到劉雯再次閃耀戛納,才懂井柏然和倪妮,本就不是“一路人”

直到劉雯再次閃耀戛納,才懂井柏然和倪妮,本就不是“一路人”

賞心悅目的我
2026-05-19 08:27:06
白人女性與黑人女性的體味差異,網友真實分享引發熱議

白人女性與黑人女性的體味差異,網友真實分享引發熱議

特約前排觀眾
2025-12-22 00:20:06
穆里尼奧下死令!皇馬砸鍋也要簽他,巴薩 3 年美夢徹底碎了

穆里尼奧下死令!皇馬砸鍋也要簽他,巴薩 3 年美夢徹底碎了

奶蓋熊本熊
2026-05-20 03:43:28
布倫森那邊都打瘋了,騎士都不考慮讓后場大閘上去限制他一下?

布倫森那邊都打瘋了,騎士都不考慮讓后場大閘上去限制他一下?

稻谷與小麥
2026-05-20 22:48:16
前車頂住后車后續,央媒點贊,司機身份曝光,廠家贈送新車

前車頂住后車后續,央媒點贊,司機身份曝光,廠家贈送新車

奇思妙想草葉君
2026-05-20 00:18:52
網傳女騎手越來越多了,說明了什么?評論區炸鍋…

網傳女騎手越來越多了,說明了什么?評論區炸鍋…

慧翔百科
2026-05-20 17:27:17
《主角》熱度破萬,5位女演員演技排名:劉浩存倒數,第1沒爭議

《主角》熱度破萬,5位女演員演技排名:劉浩存倒數,第1沒爭議

八斗小先生
2026-05-19 17:47:03
女子吐槽老媽從早6點起來去下地,8點還沒走到地里,評論區炸鍋!

女子吐槽老媽從早6點起來去下地,8點還沒走到地里,評論區炸鍋!

夜深愛雜談
2026-05-20 21:18:55
紅色,我想穿到60歲,像赫本那樣!

紅色,我想穿到60歲,像赫本那樣!

Yuki女人故事
2026-05-19 22:19:55
2026-05-20 23:40:49
智東西 incentive-icons
智東西
智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
11861文章數 117078關注度
往期回顧 全部

科技要聞

一文看懂谷歌I/O2026:谷歌打響智能體大戰

頭條要聞

楊梅被"一刀切"禁入 福建楊梅協會會長懇求給果農生路

頭條要聞

楊梅被"一刀切"禁入 福建楊梅協會會長懇求給果農生路

體育要聞

尼克斯贏下最窒息的一場翻盤,場場都是逆天局

娛樂要聞

王菲“沒事兒”,成年人學不來的松弛

財經要聞

白酒榜|汾酒營收凈利雙增 口子窖"造富"

汽車要聞

26.98萬起步 看小鵬GX如何詮釋一車多能以及滿配的科技與豪華

態度原創

手機
時尚
健康
本地
軍事航空

手機要聞

華為nova16系列三杯芯片全曝光,并確認出海,十周年誠意拉滿

被這個顏色刷屏了!今年夏天想減齡好看就穿它吧

專家:別把PRP當作“自體干細胞”

本地新聞

用云錦的方式,打開江蘇南京

軍事要聞

俄媒盛贊中國軍人:身姿挺拔 站如松柏

無障礙瀏覽 進入關懷版