![]()
4月12日,靈初智能官宣完成新一輪融資,投資方是國投先導(dǎo)和京西瑞瓴,一個(gè)是硬科技賽道的頭部國資機(jī)構(gòu),一個(gè)是北京國資聯(lián)合高瓴背景發(fā)起的AI產(chǎn)業(yè)基金。兩天前,靈初剛發(fā)布了新一代模型Psi-R2和世界模型Psi-W0,其中Psi-R2在國際權(quán)威基準(zhǔn)MolmoSpaces上拿下全球第一,超過了PI和英偉達(dá)GEAR。同時(shí)開源1000小時(shí)人類操作數(shù)據(jù)集。
融資、發(fā)模型、屠榜、開源,四件事擠在一周里,節(jié)奏很密。但如果只盯著這些動(dòng)作本身,容易看岔。
這件事真正值得聊的,不是靈初拿了多少錢,而是資本在押注什么。
答案是一條數(shù)據(jù)路線。
具身智能眼下最大的瓶頸,不是算法不夠好,是數(shù)據(jù)不夠用。這一點(diǎn)行業(yè)里幾乎已經(jīng)有共識(shí)了。機(jī)器人想學(xué)會(huì)干活,不能像大語言模型那樣從互聯(lián)網(wǎng)上白撈文本,也不像自動(dòng)駕駛有多年路測(cè)數(shù)據(jù)可以吃。它的訓(xùn)練素材只能從現(xiàn)實(shí)世界里一口一口喂。
過去幾年,主流方案是真機(jī)遙操作——人盯著屏幕遠(yuǎn)程控制機(jī)械臂,一條一條錄軌跡。這條路在早期確實(shí)管用,但規(guī)模一上來就撐不住了。采集一小時(shí)數(shù)據(jù)動(dòng)輒花幾百塊,還得搭專業(yè)動(dòng)捕環(huán)境,人盯著屏幕操控的節(jié)奏也很難跟上真實(shí)生產(chǎn)節(jié)拍。模型越大、任務(wù)越復(fù)雜,這種供給方式就越像用水杯往游泳池里灌水。
靈初智能選了另一條路:不讓人遠(yuǎn)程控制機(jī)器人,而是讓人直接干活,再把人的操作數(shù)據(jù)”翻譯”給機(jī)器人用。
邏輯很樸素。人類本來就每天在工廠、倉庫、流水線上完成海量精細(xì)操作,這些數(shù)據(jù)天然存在,成本極低,而且自帶真實(shí)作業(yè)的節(jié)拍和動(dòng)作細(xì)節(jié)。據(jù)靈初披露,他們積累的人類操作數(shù)據(jù)總規(guī)模已經(jīng)接近10萬小時(shí),覆蓋294種場(chǎng)景、4821種任務(wù)。這個(gè)量級(jí),靠遙操作恐怕再干幾年也攢不出來。
但人類數(shù)據(jù)有一個(gè)繞不過去的硬傷:人手和機(jī)械手長得不一樣。人抓一個(gè)蘋果的動(dòng)作,直接映射到機(jī)械臂上,很可能就差那么一丁點(diǎn)就抓不起來。對(duì)手機(jī)裝配、精密插接這類任務(wù),毫米級(jí)的誤差就能讓整個(gè)動(dòng)作失效。
靈初的解法是搭了一套雙模型框架。策略模型Psi-R2負(fù)責(zé)從人類數(shù)據(jù)里學(xué)”任務(wù)該怎么做”,世界模型Psi-W0負(fù)責(zé)推演”換種做法會(huì)怎樣”。人類的操作軌跡先經(jīng)過Psi-R2學(xué)習(xí),再交給Psi-W0在機(jī)器人的視覺和動(dòng)力學(xué)條件下做模擬驗(yàn)證,不行就用強(qiáng)化學(xué)習(xí)繼續(xù)調(diào),直到這條軌跡變成機(jī)器人真能執(zhí)行的動(dòng)作。相當(dāng)于在模型里多了一層”夢(mèng)里試錯(cuò)”的空間,好的軌跡回流訓(xùn)練,壞的軌跡幫助識(shí)別失敗邊界,數(shù)據(jù)飛輪就這么轉(zhuǎn)起來了。
從結(jié)果看,這條路暫時(shí)跑通了。Psi-R2預(yù)訓(xùn)練完成后,只需要不到100條真機(jī)軌跡微調(diào),就能完成手機(jī)裝配、工業(yè)包裝、紙盒折疊這些長時(shí)序高精度任務(wù)。MolmoSpaces榜單上的全球第一,也算是一個(gè)外部驗(yàn)證。
當(dāng)然,這條路遠(yuǎn)談不上沒有風(fēng)險(xiǎn)。純靠第一視角視頻恢復(fù)的人手軌跡,精度只到毫米級(jí),靈初自己也承認(rèn)得靠自研外骨骼手套才能壓到亞毫米級(jí)。跨本體遷移的損耗到底有多大,在更多任務(wù)類型上能不能持續(xù)扛住,都還需要更大規(guī)模的驗(yàn)證。
但我覺得這件事的意義,不在于靈初現(xiàn)在做到了什么程度,而在于它指出了一個(gè)方向:當(dāng)遙操作數(shù)據(jù)這條路明顯到頂?shù)臅r(shí)候,人類數(shù)據(jù)有可能成為具身智能下一階段的主燃料。
國投先導(dǎo)和京西瑞瓴這筆錢投進(jìn)去,表面上投的是一家公司,實(shí)際上押的是這個(gè)判斷。如果這條路走通了,靈初占住的就不只是一個(gè)產(chǎn)品的身位,而是下一代具身智能訓(xùn)練范式的入口。
這才是這筆融資真正值錢的地方。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.