在人工智能的浪潮里,人人都在談算法、談芯片、談模型,但有一個(gè)華裔創(chuàng)業(yè)者,卻靠一件看起來(lái)“最不起眼的工作”悶聲發(fā)了財(cái)。
他叫陳奕文,今年37歲,最新福布斯榜單顯示,他以180億美元的身家,成為美國(guó)最年輕的億萬(wàn)富豪之一。
![]()
他創(chuàng)辦的公司估值高達(dá)2400億元,但做的事情很簡(jiǎn)單,為人工智能模型“喂飯”。
準(zhǔn)確說(shuō),是給海量的數(shù)據(jù)做標(biāo)注。
別人追求速度、拼技術(shù),他卻選擇了別人嫌麻煩的角落。
可就是這件看似“苦力活”的事,讓他賺得比無(wú)數(shù)寫(xiě)代碼、造芯片的人還多。
![]()
陳奕文的父母是來(lái)自臺(tái)灣的移民,在美國(guó)佛羅里達(dá)州的一個(gè)小鎮(zhèn)開(kāi)了一家中餐廳。
小鎮(zhèn)人口只有三千來(lái)人,白天冷清,晚上餐廳油煙彌漫,他的童年在盤(pán)子碰撞聲和顧客點(diǎn)單聲中度過(guò)。
沒(méi)有名校的早教、沒(méi)有富裕的家境,他能依靠的,只有自己的天賦。
小時(shí)候,他就展現(xiàn)出驚人的邏輯感,對(duì)數(shù)學(xué)極其敏感,小學(xué)階段就能自學(xué)微積分。
那時(shí)他就喜歡科幻電影,對(duì)未來(lái)的世界充滿(mǎn)好奇。
![]()
別人做作業(yè),他在琢磨“機(jī)器能不能像人一樣學(xué)習(xí)”。
后來(lái),他一路考入美國(guó)最頂尖的理工學(xué)院,主修數(shù)學(xué)、語(yǔ)言學(xué)和計(jì)算機(jī)。
別人學(xué)一個(gè)專(zhuān)業(yè)就頭大,他偏偏要學(xué)三個(gè)。
這種跨學(xué)科背景,為他后來(lái)創(chuàng)立“高質(zhì)量數(shù)據(jù)服務(wù)”打下了基礎(chǔ)。
數(shù)學(xué)讓他懂邏輯,語(yǔ)言學(xué)讓他懂語(yǔ)義,計(jì)算機(jī)讓他懂實(shí)現(xiàn),這三者結(jié)合,幾乎構(gòu)成了人工智能的核心能力。
![]()
畢業(yè)后,他進(jìn)入華爾街做算法開(kāi)發(fā),隨后在推特、谷歌、臉書(shū)等科技巨頭工作,專(zhuān)門(mén)負(fù)責(zé)人工智能模型訓(xùn)練。
在這期間,他發(fā)現(xiàn)一個(gè)令人頭疼的問(wèn)題,無(wú)論多聰明的算法,如果輸入的數(shù)據(jù)是錯(cuò)的、臟的、模糊的,模型訓(xùn)練的結(jié)果就全都失效。
有一次,他所在的團(tuán)隊(duì)需要處理五萬(wàn)條社交媒體數(shù)據(jù),由外包公司負(fù)責(zé)標(biāo)注。
![]()
半年過(guò)去,結(jié)果交上來(lái)時(shí),幾乎全部不合格。
俚語(yǔ)沒(méi)標(biāo)清楚、反話(huà)當(dāng)正話(huà)、情緒被誤判。
那一刻,他意識(shí)到,人工智能再聰明,也得靠人去教,沒(méi)有高質(zhì)量數(shù)據(jù),算法再?gòu)?qiáng)也是空殼。
這個(gè)行業(yè)一直在追求更快的算力、更大的模型,卻忽略了喂養(yǎng)它的食物,那些細(xì)致、準(zhǔn)確、成體系的數(shù)據(jù)。
而他決定,就從這里切入。
![]()
2020年,32歲的陳奕文辭去了硅谷的高薪工作,在舊金山租下一間小公寓,開(kāi)始創(chuàng)業(yè)。
沒(méi)有融資、沒(méi)有團(tuán)隊(duì),他白天打電話(huà)找客戶(hù),晚上通宵寫(xiě)代碼。
那段時(shí)間,他常常連續(xù)工作二十個(gè)小時(shí),只靠泡面和咖啡撐著。
他給公司的定位非常明確:不是做便宜的外包,而是做最專(zhuān)業(yè)的人工智能數(shù)據(jù)標(biāo)注。
他要提供的是懂語(yǔ)境、懂專(zhuān)業(yè)、懂邏輯的標(biāo)注,比如醫(yī)學(xué)影像、自動(dòng)駕駛、對(duì)話(huà)系統(tǒng)等復(fù)雜領(lǐng)域。
![]()
第一次客戶(hù)的到來(lái)甚至是偶然,一次攀巖時(shí),他碰到一家科技公司的高管。
閑聊中說(shuō)起自己在做“高質(zhì)量數(shù)據(jù)服務(wù)”,對(duì)方立刻決定試用。
那次合作成功后,對(duì)方又介紹了更多客戶(hù),短短一年,公司營(yíng)收突破千萬(wàn)美元。
更幸運(yùn)的是,2023年之后,大語(yǔ)言模型爆發(fā),整個(gè)AI行業(yè)對(duì)高質(zhì)量數(shù)據(jù)的需求激增。
他的公司一躍成為多家科技巨頭的長(zhǎng)期合作方,連OpenAI、微軟、谷歌等都在使用他的服務(wù)。
如今,公司擁有250多名員工,年收入超過(guò)十億美元。
他本人持有約75%的股份,靠“自有資金”滾動(dòng)發(fā)展,從未引入外部資本。
這在硅谷幾乎是異類(lèi)。別的創(chuàng)業(yè)者靠融資活著,他靠利潤(rùn)自給自足。
![]()
外界常說(shuō):“人工智能是大腦,數(shù)據(jù)是血液。”
陳奕文正是那個(gè)負(fù)責(zé)“造血”的人。
他認(rèn)為,未來(lái)的人工智能競(jìng)爭(zhēng),不在誰(shuí)的算法更復(fù)雜,而在誰(shuí)的數(shù)據(jù)更真實(shí)、更干凈、更能反映人類(lèi)的思維。
他最早提出“高質(zhì)量數(shù)據(jù)是AI的燃料”這一理念。
他的公司給出的解決方案不是便宜,而是精確。
他招聘的標(biāo)注員并不是最低薪外包,而是經(jīng)過(guò)系統(tǒng)訓(xùn)練的專(zhuān)家。
醫(yī)療數(shù)據(jù)由醫(yī)生審閱,自動(dòng)駕駛數(shù)據(jù)由工程師審核,對(duì)話(huà)標(biāo)注由語(yǔ)言學(xué)家校對(duì)。
![]()
這讓他的公司在AI行業(yè)里獲得了極高的口碑。
許多客戶(hù)愿意支付三倍于市場(chǎng)的價(jià)格,只為確保模型訓(xùn)練更精準(zhǔn)。
他把“數(shù)據(jù)標(biāo)注”這個(gè)原本被視作體力活的行業(yè),變成了一個(gè)需要智慧、文化和判斷力的知識(shí)產(chǎn)業(yè)。
更關(guān)鍵的是,他提前布局了下一步,研發(fā)AI輔助標(biāo)注工具,用人工智能去幫人類(lèi)標(biāo)注,讓AI反過(guò)來(lái)“教AI”。
當(dāng)多數(shù)人還在為算法優(yōu)化爭(zhēng)得頭破血流時(shí),他已經(jīng)在下一條供應(yīng)鏈上挖掘新礦。
![]()
陳奕文的故事很勵(lì)志,但更值得我們反思。
他不是那種一夜暴富的“科技天才”,也不是站在風(fēng)口上的“資本寵兒”。
他只是看到別人忽視的東西,然后堅(jiān)持把它做到極致。
在這個(gè)人人都想造風(fēng)口、講故事的時(shí)代,他偏偏選擇做“幕后工程”。
別人追浪花,他修水管,最終,是他掌握了整個(gè)系統(tǒng)最關(guān)鍵的閥門(mén)。
![]()
從小餐館到硅谷,他的成長(zhǎng)路徑讓人明白:成功從來(lái)不是靠炫酷,而是靠穩(wěn)扎穩(wěn)打。
未來(lái)五年,人工智能將繼續(xù)重塑世界,但真正的贏家,可能不是那些喊得最響的,而是那些在背后默默“補(bǔ)洞”的人。
他證明了一個(gè)道理:越不起眼的地方,越可能藏著真正的金礦。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.