![]()
“1美元/時的數(shù)據(jù)采集你會做嗎?
大約一個月前,一段視頻在全球瘋傳,視頻中大量服裝工人在“肯印度(Ken India)”公司位于馬哈拉施特拉邦的紡織制造廠工作時,頭上戴著Egolab AI的微型攝像頭設(shè)備。人們普遍猜測,這是一種所謂的“以自我為中心的數(shù)據(jù)采集”系統(tǒng),主要負(fù)責(zé)收集人們工作時的第一視角影像,用于訓(xùn)練具身智能模型。
Egolab AI于2026年1月由印度兩名青少年創(chuàng)立,自稱為“印度最大的第一人稱視角(POV)數(shù)據(jù)聚合商”。但該公司創(chuàng)立僅兩個月,就被美國一家公司收購,據(jù)稱交易金額達(dá)到七位數(shù)。
不久前,一家名為Human Archive的初創(chuàng)公司再次在科技圈引發(fā)轟動。這家由四位20歲斯坦福和伯克利輟學(xué)生創(chuàng)辦的公司,拿到了820萬美元的種子輪融資。領(lǐng)投方是Wing Venture Capital和NVP Capital,跟投名單里擠滿了來自O(shè)penAI、英偉達(dá)、谷歌、Meta、DoorDash AI Research的天使投資人。
![]()
他們所做的事情,同樣就是把視頻這套模式變成了現(xiàn)實(shí),在印度班加羅爾和舊金山之間架起了一條新的數(shù)據(jù)管道。商業(yè)模式也很簡單,就是把印度工人采集的數(shù)據(jù),以高價賣給了美國具身智能企業(yè)。
這套影子數(shù)據(jù)采集通道背后,一端是家政工人的頭戴式攝像頭,另一端連著具身智能實(shí)驗室的訓(xùn)練隊列。
01.
他們賭的是什么?
為什么具身智能需要“看人干活”?你可能已經(jīng)聽說過,大語言模型是靠從互聯(lián)網(wǎng)上抓取數(shù)萬億個詞條訓(xùn)練出來的。視覺模型是靠從數(shù)十億張公開圖片中學(xué)習(xí)成長起來的。但機(jī)器人沒法從網(wǎng)上“下載”怎么擰螺絲、怎么疊被子、怎么把一杯水穩(wěn)穩(wěn)端到老人面前。這些操作數(shù)據(jù),無法通過爬蟲獲取,仿真數(shù)據(jù)還不太靠譜,最快的還是只能在真實(shí)世界中采集。
過去,機(jī)器人實(shí)驗室的做法是,讓研究人員在實(shí)驗室或者數(shù)采工廠里,一遍又一遍地做同一個動作,用昂貴的動捕設(shè)備記錄下來。問題是,實(shí)驗室和數(shù)采工廠太干凈了。真實(shí)的家庭、餐館、建筑工地,充滿了雜亂、意外和不確定性。一張歪了的椅子、一個反光的桌面、一只突然跳出來的貓,都可能讓機(jī)器人“死機(jī)”。
Human Archive的創(chuàng)始人們發(fā)現(xiàn)了一個更聰明、也更冷酷的解決方案,那就是直接去正在干活的人頭上裝攝像頭。
![]()
一句話:讓印度零工工人的雙手,成為訓(xùn)練下一代具身智能和物理AI的“石油”。
而這些“人”,在印度有數(shù)百萬。他們是每天穿梭在德里、班加羅爾、孟買的家政工、外賣員、餐廳服務(wù)員、工廠裝配工,但他們又可以很快、很大規(guī)模采集到第一人稱視角數(shù)據(jù)。
02.
1美元的時薪換來什么?
Human Archive的模式并不復(fù)雜,甚至可以說非常直接。
他們通過與工廠、家政服務(wù)、酒店、餐飲、建筑等行業(yè)的公司合作,給工人配備頭戴式設(shè)備,上面有一個向下拍攝的4K攝像頭(30幀/秒),外加深度感知攝像頭、廣角鏡頭、觸覺手套、腕部攝像頭、慣性測量單元。
工人只需要正常干活,分揀物品、擦桌子、拖地、疊衣服、端盤子、切菜,所有動作被頭頂?shù)南鄼C(jī)錄下來,經(jīng)過匿名化、標(biāo)注、處理,打包賣給機(jī)器人公司和AI實(shí)驗室
工人可以每小時獲得1美元的基本工資。目前,印度藍(lán)領(lǐng)工人的平均月薪在15000到35000盧比之間(約180-420美元)。1美元時薪聽起來不高,但對許多工人來說,這是“額外收入”。
目前,Human Archive已經(jīng)在印度部署了超過1000套活躍設(shè)備,收集了數(shù)萬小時的數(shù)據(jù)。他們的目標(biāo)是每天穩(wěn)定采集數(shù)百萬小時可用數(shù)據(jù)
![]()
這類模式在全球并不算稀奇,今年3月,美國外賣巨頭DoorDash推出一款名為Tasks(任務(wù))的獨(dú)立應(yīng)用。根據(jù)該公司公告,Tasks允許其美國800萬名零工從業(yè)者通過記錄自己執(zhí)行各種任務(wù)的視頻來賺錢。這些數(shù)據(jù)隨后將被應(yīng)用于訓(xùn)練AI和機(jī)器人。
其他機(jī)器人開發(fā)商也開發(fā)了類似的數(shù)據(jù)收集策略。總部位于美國加州的機(jī)器人公司Sunday Robotics向全國各地郵寄一種“技能捕捉手套”,人們通過戴著這種機(jī)械手套做家務(wù)來收集運(yùn)動數(shù)據(jù),數(shù)據(jù)隨后會被用來訓(xùn)練該公司正在研發(fā)的AI驅(qū)動家用機(jī)器人。
在中國,鹿明機(jī)器人也采取了一種背包版UMI數(shù)采設(shè)備,并同步啟動真實(shí)場景數(shù)據(jù)采集計劃。2026年,鹿明機(jī)器人計劃在多個城市投放1萬臺背包版FastUMI Pro,目標(biāo)為百萬小時級數(shù)據(jù)產(chǎn)能。
03.
為什么是印度?
你可能會問:為什么選擇在印度,而不去美國做這件事?硅谷不是離客戶更近嗎?Human Archive的聯(lián)合創(chuàng)始人Rushil Agarwal給出了三個非常“硬核”的理由。
第一,印度擁有極其豐富的產(chǎn)業(yè)類型。從珠寶、紡織、煤炭、鋼鐵到其他所有行業(yè)都有,這句話不是隨便說的。機(jī)器人最終要進(jìn)入的不是單一場景,而是成千上萬種不同的中低端工作環(huán)境。印度幾乎什么都有。
第二,印度擁有美國所不具備的勞動力經(jīng)濟(jì)。翻譯一下就是更便宜,且數(shù)量大。1美元時薪在加州連一杯咖啡都買不到,但在印度,這個價格仍然有大量工人愿意參與。
第三,印度工人每天做的事,恰好就是機(jī)器人最想學(xué)的事。清潔、整理、搬運(yùn)、裝配、服務(wù),這些是具身智能最核心的應(yīng)用場景,也是印度零工經(jīng)濟(jì)每天在重復(fù)的動作。
目前,全球前沿的具身智能公司例如Figure AI、Covariant、Tesla、Google DeepMind都在爭分奪秒地開發(fā)能夠執(zhí)行真實(shí)任務(wù)的具身智能系統(tǒng)。它們共同的瓶頸不是算法,不是算力,而是高質(zhì)量的真實(shí)世界操作數(shù)據(jù)
![]()
根據(jù)MarketsandMarkets的報告,2026年到2032年間,物理人工智能市場的復(fù)合年增長率將超過47%,達(dá)到152.4億美元。因此Human Archive賭的是誰掌握了最大、最多樣化、最干凈的人類操作數(shù)據(jù)集,誰就能在這場競賽中占據(jù)上游。
因為他們甚至不只是在賣數(shù)據(jù)。他們還在訓(xùn)練自己的模型,用這些數(shù)據(jù)微調(diào)AI系統(tǒng),并在真實(shí)機(jī)器人上測試。這讓他們能夠向客戶證明:我們的數(shù)據(jù),真的能讓機(jī)器人學(xué)得更快。
04.
爭議、拒絕與一場不可避免的摩擦
當(dāng)然,這條路并不平坦。Human Archive接觸過印度多家主流家政服務(wù)平臺,包括Urban Company和Pronto。結(jié)果幾乎全部被拒
Urban Company的CEO公開表示:不會參與這種數(shù)據(jù)收集。Human Archive的聯(lián)合創(chuàng)始人Raj Patel立刻回懟:“他們最終會重新考慮,否則將面臨失去市場地位的風(fēng)險。”
Pronto則承認(rèn)確實(shí)聊過,但最后選擇不繼續(xù)。那Human Archive怎么辦?他們換了個打法。他們與一些規(guī)模較小的初創(chuàng)公司合作,并且給終端消費(fèi)者提供兩個選項:
- 折扣價:同意工作人員在服務(wù)過程中進(jìn)行數(shù)據(jù)采集。
- 全價:不錄像,正常服務(wù)。
Patel說,很多客戶選擇了折扣價。原因有點(diǎn)意外:因為錄像可以用來解決服務(wù)質(zhì)量糾紛,比如你說保潔沒擦桌子,錄像一看,確實(shí)擦了。
有趣的是,這個“副作用”在印度反而成了一種賣點(diǎn)。
![]()
但爭議不僅來自商業(yè)、同行,也來自監(jiān)管機(jī)構(gòu)。Human Archive的核心商業(yè)模式,建立在“在別人家中錄像”的基礎(chǔ)上。
雖然公司表示:
- 攝像頭角度朝下,很少拍到人臉。
- 任何意外拍到的面部信息,會在后期處理中模糊掉。
- 合同符合印度《數(shù)字個人數(shù)據(jù)保護(hù)法》。
但上周,印度電子和信息技術(shù)部已經(jīng)開始調(diào)查一些初創(chuàng)公司通過家政服務(wù)人員收集數(shù)據(jù)的同意機(jī)制和做法。這件事的最終走向,將直接影響Human Archive能否繼續(xù)規(guī)模化擴(kuò)張。
然而,很多人忽略了一點(diǎn),那就是除了擴(kuò)大規(guī)模搞數(shù)據(jù)采集,Human Archive正在開發(fā)自己的硬件。
從早期的iPhone+現(xiàn)成設(shè)備,到現(xiàn)在擁有50多種定制硬件,包括觸覺手套、全身動捕服、腕部攝像頭、胸部IMU。
為什么自己做硬件?聯(lián)合創(chuàng)始人Rahil Agarwal解釋得很清楚,因為只靠視頻,價值有限。但如果你能把視頻、觸覺力反饋、全身動捕數(shù)據(jù)同步采集下來,這套數(shù)據(jù)集的價值就會指數(shù)級上升。
![]()
換句話說,他們不是在賣“人類數(shù)據(jù)錄像”,而是在賣解決方案。
因為單純數(shù)據(jù)采集的賽道太過于擁擠,以及低門檻。例如印度公司阿維格(Awign)企業(yè)有限公司也在收集類似數(shù)據(jù),用于實(shí)現(xiàn)切黃瓜或整理玩具等家務(wù)活的自動化。另一家總部位于舊金山的初創(chuàng)公司Humyn AI也正試圖建立類似的業(yè)務(wù)。
05.
結(jié)語與未來
Human Archive的故事,讓人既興奮又不安。
興奮的是,它展示了一種極具想象力、甚至可以說“天才”的商業(yè)模式:利用現(xiàn)存的、規(guī)模龐大的零工經(jīng)濟(jì),為具身智能提供最稀缺的訓(xùn)練燃料。因為科技公司的具身智能目前算下來,大概至少需要來自多個地區(qū)的數(shù)十億小時的高質(zhì)量數(shù)據(jù)。
不安的是,它觸碰了太多敏感的邊界:勞動者的報酬是否合理?他們是否真正理解自己交出了什么?客戶的隱私如何保障?當(dāng)一家公司掌握了數(shù)百萬小時的家庭內(nèi)部錄像,權(quán)力邊界在哪里?
創(chuàng)始人今年20歲。他們可能是下一代科技巨頭的締造者,也可能成為一個關(guān)于“數(shù)據(jù)殖民”的警示案例。
但無論如何,有一件事是確定的,在硅谷的機(jī)器人學(xué)會擦桌子之前,印度的家政工人已經(jīng)用手上的動作,寫下了第一行代碼。
而這行代碼的代價,是時薪1美元。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.