亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

成立一年半累計(jì)融資超 20 億,這個(gè)團(tuán)隊(duì)想搞定具身智能最難的「數(shù)據(jù)瓶頸」

0
分享至


用「無本體數(shù)采」的方式訓(xùn)練具身模型,靈初智能的這條路徑是 VLA 之后行業(yè)最熱的方向之一。


作者|Li Yuan

編輯|鄭玄

3 月 10 日,據(jù)極客公園獲悉,具身智能企業(yè)靈初智能首次對(duì)外披露其過往融資進(jìn)展:公司已先后完成天使輪及 Pre-A 輪融資,累計(jì)融資規(guī)模達(dá) 20 億元。

天使輪由國開金融、國中資本、央視融媒體產(chǎn)業(yè)投資基金等國家級(jí)「國家隊(duì)」資本,某數(shù)千億上市公司旗下戰(zhàn)投、長飛光纖旗下基金,兩大核心產(chǎn)業(yè)龍頭資本,沃德爾等知名產(chǎn)業(yè)資本,及元生創(chuàng)投、珠海科技產(chǎn)業(yè)集團(tuán)、鈞山投資、燕緣創(chuàng)投、大米資本、沃賦資本、彬復(fù)資本、泰合資本等多家知名基金共同投資。

Pre-A 輪由上海國資徐匯資本等基金領(lǐng)投,梁溪科創(chuàng)產(chǎn)業(yè)二期母基金 (博華資本管理)、錫創(chuàng)投等地方國資,及普豐資本、鈦銘資本等市場化基金跟投,多家老股東實(shí)現(xiàn)超額跟投。華興資本擔(dān)任長期財(cái)務(wù)顧問。

經(jīng)估算,公司估值一年內(nèi)大概翻了 6-7 倍,已經(jīng)向行業(yè)獨(dú)角獸邁進(jìn)。

靈初智能成立于 2024 年年底,此前宣傳并不多。

創(chuàng)始人兼 CEO 王啟斌在創(chuàng)辦靈初智能之前,先后就職于云跡科技和京東機(jī)器人,主要負(fù)責(zé)酒店配送機(jī)器人與物流配送機(jī)器人的研發(fā)。

聯(lián)合創(chuàng)始人陳源培出生于 2001 年,曾在北京大學(xué)楊耀東教授團(tuán)隊(duì)及斯坦福大學(xué)李飛飛實(shí)驗(yàn)室學(xué)習(xí)與研究。他此前的研究重點(diǎn)包括:利用強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)靈巧手完成復(fù)雜長程任務(wù)與類人操作,以及將人類數(shù)據(jù)遷移到機(jī)器人系統(tǒng)中。

與今年年初獲得大額融資的多家具身智能公司類似,靈初智能也將重心放在「具身大腦」方向。

公司當(dāng)前的核心路線,是用「無本體數(shù)采」的方式訓(xùn)練具身模型:通過人類佩戴式設(shè)備采集操作數(shù)據(jù),以緩解具身智能長期面臨的高質(zhì)量數(shù)據(jù)瓶頸。這條路徑在 VLA 之后成為行業(yè)最熱的方向之一。

在模型訓(xùn)練上,則采取強(qiáng)化學(xué)習(xí)為主、模仿學(xué)習(xí)為輔的方式,追求更高節(jié)拍與成功率。

極客公園采訪了靈初智能兩位創(chuàng)始人。兩人的分工和路線選擇都很清楚:CEO 王啟斌的表達(dá)更鋒利,核心抓手是落地與交付;聯(lián)合創(chuàng)始人陳源培更偏技術(shù)掌舵,對(duì)接下來技術(shù)路線要往哪走,有一套相對(duì)確定的判斷。

他們的共識(shí)也很明確:靈初智能不做整機(jī)硬件自研——在他們看來,輪式底盤已經(jīng)供給過剩、缺乏差異化空間;但在決定長期能力邊界的關(guān)鍵環(huán)節(jié)上,他們又非常強(qiáng)硬:一定要自研靈巧手和數(shù)據(jù)采集裝置,并把落地場景收斂在物流/商超,用一個(gè)足夠小、但可以持續(xù)外推泛化的細(xì)分任務(wù)打穿,跑出能夠持續(xù)回流的數(shù)據(jù)飛輪。

在采訪中,兩位反復(fù)強(qiáng)調(diào):他們已經(jīng)進(jìn)入真實(shí)世界部署階段——不是拍 demo、寫論文,而是在客戶現(xiàn)場把系統(tǒng)跑起來,再用現(xiàn)場數(shù)據(jù)反哺模型迭代。下面摘錄幾段最具代表性的原話,可以看出這是一支很務(wù)實(shí)、強(qiáng)落地導(dǎo)向的團(tuán)隊(duì):

·「夾爪能解決 80% 的問題」其實(shí)是個(gè)偽命題。你真的進(jìn)到客戶現(xiàn)場就知道——一個(gè)倉庫里 100 個(gè)物體你只能搞 80 個(gè),那剩下 20 個(gè)怎么辦?總不能扔掉。 ·很多公司說要做商超,但你真正去商超現(xiàn)場看,會(huì)發(fā)現(xiàn)核心問題根本不是「從貨架上拿東西」的這種抓取放置的工作(pick and place),商超的主戰(zhàn)場依然是有人作業(yè)。 ·我們的判斷是:人最終是「載體」,所以我們會(huì)盡可能把人的各類模態(tài)都采下來,從而最大程度避免數(shù)據(jù)未來「不可用」。
·未來數(shù)據(jù)采集本身會(huì)一直持續(xù),但它要么進(jìn)入少數(shù)算法能力很強(qiáng)的公司體系里;要么就只能退化成純?nèi)肆ν獍尽烧叩膬r(jià)值和定價(jià)會(huì)差非常多。 ·大廠只要肯投人、肯投錢,收很多數(shù)據(jù)去訓(xùn)練,基本都能訓(xùn)出一些「看起來還可以」的模型。但如果我們把物流場景的數(shù)據(jù)牢牢握在手里——甚至不對(duì)外出售,同時(shí)把大部分物流場景占住——那別人再想進(jìn)來,不管是數(shù)據(jù)質(zhì)量還是數(shù)據(jù)收集速度都會(huì)差很多,最終效果也會(huì)差很多。

以下是部分采訪紀(jì)要,經(jīng)極客公園整理。

01

靈初智能為什么要關(guān)注人類數(shù)據(jù)?

問:過去幾年具身智能沒有落地的核心問題是什么?

王啟斌:核心是數(shù)據(jù)問題。

數(shù)據(jù)問題大家都有共識(shí),但更底層的問題在于:目前還沒有形成一種技術(shù)路徑與商業(yè)模式相結(jié)合的機(jī)制,使得數(shù)據(jù)能夠大規(guī)模、低成本地回流。也就是說,具身領(lǐng)域現(xiàn)在還不存在「特斯拉模式」。

我自己對(duì)特斯拉做過比較深入的研究:特斯拉模式之所以能啟動(dòng),是因?yàn)閺?2013 年開始鋪墊,Model 3 在 2017 年發(fā)布后,很快做到年銷量上百萬臺(tái),靠巨量部署讓數(shù)據(jù)快速回流,從而推動(dòng) FSD 快速迭代。但具身機(jī)器人今天最難的就是市場怎么冷啟動(dòng)、數(shù)據(jù)從哪里來——仿真數(shù)據(jù)的 gap 太大,而缺數(shù)據(jù)就無法大規(guī)模部署;無法部署就沒有低成本的數(shù)據(jù)回流,形成了一個(gè)典型的「雞生蛋、蛋生雞」的閉環(huán)難題。

所以現(xiàn)在大家都在搞數(shù)據(jù):美國頭部公司在做,中國從政府到頭部企業(yè)也都在做。但關(guān)鍵不在于「做不做數(shù)據(jù)」,而在于數(shù)據(jù)能不能形成一個(gè)有效、可持續(xù)的模式——從數(shù)據(jù)基礎(chǔ)設(shè)施(Infra)、數(shù)據(jù)采集方式、怎么采、怎么訓(xùn),到是否能訓(xùn)練出具備泛化能力的預(yù)訓(xùn)練模型,這些是具身繼續(xù)往前走必須跨過的幾步。

對(duì)靈初來說,今年的主旋律就是解決這個(gè)問題。

我們?cè)谧鰯?shù)據(jù)采集設(shè)備上非常激進(jìn)——我們?cè)谧鲆惶子糜陬A(yù)訓(xùn)練的、無本體的多模態(tài)數(shù)據(jù)采集手套,目前已經(jīng)在北京規(guī)模化部署。


靈初的思路其實(shí)很簡單:我們會(huì)用人的多模態(tài)數(shù)據(jù)作為基礎(chǔ)——戴上數(shù)據(jù)手套,大規(guī)模采集從物流、商超到泛服務(wù)業(yè)的各類真實(shí)作業(yè)數(shù)據(jù)。我們采的是長程、多模態(tài)數(shù)據(jù):包括觸覺、頭部/手部等多視角視覺,以及關(guān)節(jié)角等信息。然后用這些數(shù)據(jù)去訓(xùn)練我們的基礎(chǔ)模型。真正落地到某個(gè)機(jī)型時(shí),再針對(duì)目標(biāo)機(jī)型補(bǔ)充很少量的數(shù)據(jù)——通常是百小時(shí)量級(jí)的 teleop/遙操作數(shù)據(jù)——把它接到后訓(xùn)練里,去解決具體場景的問題。

問:這套方案用的是真實(shí)人類數(shù)據(jù),但是早期你們其實(shí)更多的用的是仿真強(qiáng)化學(xué)習(xí)來訓(xùn)練嗎,是做了轉(zhuǎn)向嗎?

陳源培:我們?cè)缙谄鋵?shí)更像是一套「混合方案」,仿真一直是其中的一部分。但我們也很早就在講人類數(shù)據(jù),只是當(dāng)時(shí)行業(yè)里很多人未必能立刻理解,所以外界印象可能更集中在「仿真」上。

仿真的優(yōu)勢很明確:它可以用來冷啟動(dòng),也可以用來驗(yàn)證很多思路。比如我們?cè)缙谧龅囊恍?demo——像打麻將——很多數(shù)據(jù)就是從仿真里收集的,因?yàn)榉抡娌⑿行屎芨摺?shù)據(jù)量可以迅速堆起來,所以短期內(nèi)容易做出成果。

但隨著行業(yè)發(fā)展,人類數(shù)據(jù)規(guī)模變成可行方案之后,仿真在模型訓(xùn)練里的權(quán)重就會(huì)逐步下降。換句話說,不是仿真「完全沒用」,而是它更適合早期的冷啟動(dòng)與驗(yàn)證;當(dāng)真實(shí)數(shù)據(jù)能規(guī)模化時(shí),訓(xùn)練主線會(huì)自然往真實(shí)數(shù)據(jù)遷移。

我們內(nèi)部也討論過:未來的仿真大概可以分成三個(gè)階段。

第一階段,類似現(xiàn)在 Isaac 這一套,主要是物理規(guī)則寫死的仿真系統(tǒng)。

第二階段,是可微分仿真,能夠模擬一些軟體物體,并支持梯度回傳。

第三階段,則是端到端的「仿真」——也就是大家說的視覺模型/世界模型:簡單說,就是把視覺模型當(dāng)作仿真器來用。

我覺得如果未來「仿真」真的還能發(fā)揮很大作用,可能更像第三種:用世界模型做仿真器。因?yàn)槿绻€是純靠寫規(guī)則,其實(shí)很難真正解決 sim-to-real gap,而且現(xiàn)在算力也基本到了一個(gè)卡點(diǎn),再往上堆也很難帶來質(zhì)變。也正因?yàn)槿绱耍蠹椰F(xiàn)在都在往世界模型的方向轉(zhuǎn)。

我們也關(guān)注模型側(cè)的進(jìn)展,但真正投入比較多人力去做的,是一個(gè)我認(rèn)為長期都會(huì)非常有用的方向:跨本體數(shù)據(jù)遷移。也就是怎么把人的數(shù)據(jù)遷移到機(jī)器人上,比如我輸入一段人類操作的視頻,怎么把它轉(zhuǎn)換成機(jī)器人能夠執(zhí)行的操作序列。

02

全球首個(gè)靈巧手真實(shí)世界數(shù)采引擎,

意味著什么?

問:靈初智能的數(shù)據(jù)采集管線和其他公司有什么不同?

王啟斌:靈初智能一直關(guān)注長程靈巧操作。

我們之前在看,全世界范圍內(nèi)有沒有人把靈巧手的人類數(shù)據(jù)集真正做得很好?

我們的結(jié)論是沒有,從去年開始基本全是夾爪的數(shù)據(jù)。我們做模型,對(duì)手部數(shù)據(jù)的需求非常清楚,所以我們判斷:這塊供應(yīng)缺口很大,我們有能力用類似 UMI 的商業(yè)模式做出自己的方案,于是就自己開始做數(shù)據(jù)采集工具。

我們做的是一套多模態(tài)的數(shù)據(jù)采集手套。強(qiáng)調(diào)「多模態(tài)」,是因?yàn)槿说牟僮髂芰Ρ举|(zhì)上就是多模態(tài)融合的:既有力/觸覺反饋,也有視覺信息,還包含 21 個(gè)關(guān)節(jié)角的數(shù)據(jù)


human data 為中心來構(gòu)建數(shù)據(jù)體系,之后可以 retarget(重定向/遷移)到不同機(jī)器人的末端執(zhí)行器,甚至不同本體上去。

我觀察行業(yè)里目前很多方案,要么只是手套采關(guān)節(jié)角,但缺觸覺;要么加了觸覺,卻沒有把末端執(zhí)行器的高自由度位置等信息納入一個(gè)統(tǒng)一體系。

同時(shí)我們也是已經(jīng)進(jìn)行了規(guī)模化部署的——不是做一個(gè)樣機(jī)拍個(gè)片,發(fā)兩篇論文、寫兩篇 PR 稿,你去看看行業(yè)里有沒有部署百臺(tái)以上的真實(shí)部署的?我們 3 月底會(huì)發(fā)布一個(gè)相對(duì)更大的數(shù)據(jù)集,今年的目標(biāo)是百萬小時(shí)的數(shù)據(jù)。

問:夾爪不能通向未來嗎?

陳源培:我認(rèn)為未來只靠夾爪商業(yè)模式肯定是跑不通的。

原因很簡單:所謂「夾爪能解決 80% 的問題」其實(shí)是個(gè)偽命題。你真的進(jìn)到客戶現(xiàn)場就知道——一個(gè)倉庫里 100 個(gè)物體你只能搞 80 個(gè),那剩下 20 個(gè)怎么辦?總不能扔掉,也不可能跟客戶說「這 20 個(gè) SKU 你別下單了」。真實(shí)落地場景里很多時(shí)候是沒有討價(jià)還價(jià)空間的:哪怕有一個(gè) SKU 做不了,也算失敗,這個(gè)場景就落不了地。

很多人覺得「80% 也可以」,是因?yàn)樗麄冏龅氖?demo:100 個(gè)抓到 80 個(gè),剩下 20 個(gè)不展示就完了。但在真實(shí)場景里不可能這樣,你只有到現(xiàn)場做過,才會(huì)知道夾爪的局限到底有多大。

比如很多公司說要做商超,但你真正去商超現(xiàn)場看,會(huì)發(fā)現(xiàn)核心問題根本不是「從貨架上拿東西」的這種抓取放置的工作(pick and place),商超的主戰(zhàn)場依然是有人作業(yè)。

真正剛需是人類長程作業(yè)鏈條。補(bǔ)貨(拆箱→分裝→推車→上架→整理)、掛鉤陳列、冰柜補(bǔ)貨(開門/擺放/調(diào)整)、過期品處理等,都是長程、強(qiáng)交互、強(qiáng)泛化的靈巧操作鏈路。

另外,從數(shù)據(jù)角度也很關(guān)鍵:如果你是夾爪路線,你換一個(gè)倉、換一個(gè)任務(wù),末端結(jié)構(gòu)和執(zhí)行能力可能都要變,你的數(shù)據(jù)往往得重新收一遍,根本不通用。

這也是為什么我們要做多模態(tài)數(shù)據(jù):我們的判斷是:人最終是「載體」,所以我們會(huì)盡可能把人的各類模態(tài)都采下來,從而最大程度避免數(shù)據(jù)未來「不可用」。


相反,機(jī)器人的數(shù)據(jù)——包括各種 UMI/夾爪那類數(shù)據(jù)——是有可能變得不可用的。因?yàn)闄C(jī)器人硬件會(huì)更新?lián)Q代:你今天用的夾爪可能過一兩年就不適用了,你可能要換末端結(jié)構(gòu);一旦末端構(gòu)型變了,過去那套數(shù)據(jù)很可能也就用不上了。但人是不變的,人的數(shù)據(jù)不僅量級(jí)最大、也最具多樣性,因此長期價(jià)值更高,能最大限度降低「數(shù)據(jù)作廢」的風(fēng)險(xiǎn)。

問:成本如何?

王啟斌:數(shù)據(jù)成本有三個(gè)大來源:第一是硬件投入,第二是人員成本,第三是存儲(chǔ)成本。我們這套方案相比遙操作的數(shù)據(jù)采集,除了更有泛化性之外,整體成本 3 月份后,可以達(dá)到整機(jī)遙操作的 1/10。

后面我們還會(huì)有一些商業(yè)模式:比如從現(xiàn)在的室內(nèi)版本,往后做一個(gè)可攜帶、可眾包的 portable 版本,它會(huì)變成類消費(fèi)品,大家戴著它,用眾籌/眾包的方式采集。人可以在自己的工作中,甚至在隱私保護(hù)的前提下,在生活中用它來采集數(shù)據(jù)。因?yàn)閭鹘y(tǒng)的數(shù)據(jù)采集場景離真實(shí)作業(yè)環(huán)境太遠(yuǎn),大家很難真實(shí)復(fù)刻工作生活里那么復(fù)雜的環(huán)境和物體堆放方式。

包括數(shù)據(jù)設(shè)備本身,我們也可能做眾籌模式,或者租賃平臺(tái)模式,把數(shù)據(jù)采集成本大幅降下來。


不過要記得:低成本只能保證數(shù)據(jù)能夠大規(guī)模生產(chǎn),并不能保證模型訓(xùn)練就一定能訓(xùn)出效果。如何把這樣大規(guī)模的數(shù)據(jù)訓(xùn)到模型里頭,訓(xùn)出效果來,這是靈初的核心競爭力。

問:靈初會(huì)把賣數(shù)據(jù)作為商業(yè)模式嗎?

陳源培:會(huì)有數(shù)據(jù)的售賣。但我們不會(huì)把自己定位成一個(gè)純粹的數(shù)據(jù)供應(yīng)商,單靠「賣數(shù)據(jù)」這個(gè)模式,是不強(qiáng)也不長久的。

你看國內(nèi)很多所謂做數(shù)采的,本質(zhì)上就是人力采集、外包式的供給:短期可能有用,但長期很容易因?yàn)閿?shù)據(jù)多樣性不足等問題被淘汰。更關(guān)鍵的是,這種模式的壁壘不在技術(shù),而更像是人力外包——當(dāng)越來越多人都能做時(shí),它的價(jià)格會(huì)被打下去,公司價(jià)值也會(huì)快速下降。

數(shù)據(jù)本身永遠(yuǎn)是缺的,尤其在具身領(lǐng)域,有些長尾需求可能一直都需要采,這個(gè)需求不會(huì)消失。所以我判斷未來會(huì)變成這樣:數(shù)據(jù)采集本身會(huì)一直持續(xù),但它要么進(jìn)入少數(shù)算法能力很強(qiáng)的公司體系里——因?yàn)檫@些公司能定義數(shù)據(jù)結(jié)構(gòu)、采集方式、設(shè)備形態(tài),并把數(shù)據(jù)真正訓(xùn)進(jìn)模型里;要么就只能退化成純?nèi)肆ν獍荆峁竸趧?wù)式采集服務(wù)」,類似現(xiàn)在一些云服務(wù)廠商提供的人力標(biāo)注/采集能力。兩者的價(jià)值和定價(jià)會(huì)差非常多。

03

百萬小時(shí)物流場景專用數(shù)據(jù)

問:靈初智能之前提過今年做到百萬小時(shí)數(shù)據(jù)的說法,百萬小時(shí)對(duì)于靈初意味著什么?

王啟斌:聊到「百萬小時(shí)夠不夠」,我覺得首先得把范圍說清楚。我們并不認(rèn)為百萬小時(shí)就能直接通向所謂的 AGI 或家庭 ToC。

百萬小時(shí)指的是在一個(gè)比較大的域里——比如物流和泛商超——這一級(jí)別的真實(shí)數(shù)據(jù)可以支撐一個(gè)基礎(chǔ)模型,覆蓋商超、物流的一些揀選、打包等任務(wù),但這還不足以泛化到家庭 ToC 場景。我們做的真實(shí)人類數(shù)據(jù),也是大規(guī)模采集的從物流、商超到泛服務(wù)業(yè)的各類真實(shí)作業(yè)數(shù)據(jù)。

問:為什么選擇物流?

王啟斌:公司成立后,我們花了接近半年把大量場景都梳理了一遍:看泛化性、看技能結(jié)構(gòu)、結(jié)合這一波具身的能力邊界,再看成功率要求和工程可交付性,看了個(gè)方向:制造業(yè)、物流、再到服務(wù)業(yè)/ToC。

如果把這些場景放在一條軸上看,你會(huì)發(fā)現(xiàn)有幾條「曲線」在拉扯:在工業(yè)端,精確性和節(jié)拍要求非常高,尤其是主線裝配這種場景,但它的泛化需求反而沒那么強(qiáng);而越往服務(wù)業(yè)、ToC 走,泛化性越來越強(qiáng),但對(duì)精確性、對(duì)節(jié)拍的要求形態(tài)又變了。

我們判斷這一波具身智能更合適的切入點(diǎn),是去找這些曲線的「交叉區(qū)間」——既有足夠泛化價(jià)值,又不像工業(yè)主線那樣對(duì)成功率/節(jié)拍要求極端到一開始就很難啃動(dòng)。所以我們更傾向從物流和泛服務(wù)業(yè)切入。

我覺得大家聊物流經(jīng)常聊得太粗了,物流本身顆粒度非常大,里面又有生產(chǎn)物流、流通物流,倉留到門店級(jí),一直到 ToC。

靈初現(xiàn)在做的不是「大物流」,我們做得很具體:目前我們選了三個(gè)場景。

第一個(gè)是衣服的供包(裝袋/打包),核心在柔性物體的抓取、掃碼、放置;


第二個(gè)是入箱檢,就是從標(biāo)準(zhǔn)周轉(zhuǎn)箱里把物品拿出來掃碼、再放置;

第三個(gè)是分撥墻,和入箱檢差不多。

我們之所以選這些細(xì)分場景,一方面它們有商業(yè)基礎(chǔ),算是相對(duì)通用、需求穩(wěn)定的場景;另一方面在技能結(jié)構(gòu)上,核心技能其實(shí)就是三到四個(gè),但真正難的是物品泛化在變、環(huán)境也在變。

比如服裝供包,我們面對(duì)的是上萬件衣服,不同尺寸、不同顏色,而且不同倉庫的燈光條件也不一樣;入箱檢也是一樣,物體數(shù)量多、混放與堆疊很復(fù)雜。物流的難點(diǎn)其實(shí)經(jīng)常被低估:除了物體和環(huán)境的泛化,你還要同時(shí)解決成功率和節(jié)拍。

我們選場景的邏輯,除了傳統(tǒng)「商業(yè)能不能跑通」之外,還疊加了一個(gè)更重要的維度:數(shù)據(jù)能不能在真實(shí)場景里形成增量,數(shù)據(jù)回流能不能反哺模型,形成飛輪。這也是我們選擇這些場景的核心原因。

問:當(dāng)前進(jìn)展如何?

王啟斌:以服裝供包為例,我們已經(jīng)進(jìn)入初步商業(yè)化階段。第一階段,我們能做到千件以上衣服的泛化——多件混放、隨手丟在一起,也能穩(wěn)定抓取處理;同時(shí)節(jié)拍也很高,最高可以做到800 UPH,應(yīng)該是國內(nèi)目前比較領(lǐng)先的水平。雖然我們真正做這個(gè)場景只有兩個(gè)多月,但已經(jīng)在客戶現(xiàn)場進(jìn)入「陪產(chǎn)」階段。

入箱檢(從周轉(zhuǎn)箱中取出物品掃碼、放置)這條線,我們也已經(jīng)在客戶現(xiàn)場完成了第一階段驗(yàn)證,目前正在做現(xiàn)場爬坡。之所以能推進(jìn)到這個(gè)程度,本質(zhì)上還是建立在模型能力和數(shù)據(jù)量之上,支撐我們?cè)诂F(xiàn)場快速迭代。

問:節(jié)拍怎么做到這么高?

陳源培:我們現(xiàn)在基本上已經(jīng)以強(qiáng)化學(xué)習(xí)為主了,模仿學(xué)習(xí)用得比較少。整體訓(xùn)練流程更像是一個(gè)offline-to-online RL的過程:從一開始的 offline 階段(用數(shù)據(jù)集訓(xùn)練),我們就主要采用強(qiáng)化學(xué)習(xí)的方式去做,因?yàn)檫@樣和后續(xù)的 online 階段銜接更順、過渡也更自然。

強(qiáng)化學(xué)習(xí)在訓(xùn)練過程中會(huì)有一段「自我探索 + 加速」的階段,所以它在動(dòng)作速度上有機(jī)會(huì)超過人類遙操作的上限。你會(huì)看到用強(qiáng)化學(xué)習(xí)訓(xùn)出來的動(dòng)作往往更干凈、更利落,也更「靈巧」。成功率也會(huì)持續(xù)攀升。

今年看起來,對(duì)于模型來說最有意義的還是后訓(xùn)練階段的強(qiáng)化:在真實(shí)場景里,通過一些human-in-the-loop的方法去解決實(shí)際落地的問題——這一塊價(jià)值最大。

問:下一個(gè)階段的靈初智能的主要目標(biāo)是什么?

王啟斌:對(duì)靈初來說,今年的主旋律會(huì)先聚焦在兩件事:數(shù)據(jù)模型能力。在這個(gè)基礎(chǔ)上,我們?cè)儆媚P偷暮笥?xùn)練能力去落地一些細(xì)分的物流場景。

今年在物流方向,我們會(huì)把手頭這三個(gè)場景做到規(guī)模化發(fā)貨/交付,但不會(huì)為了擴(kuò)張而去做十個(gè)場景——擴(kuò)到更多場景會(huì)是明年的主旋律:等模型能力到了一定水平之后,再把能力往更多場景里擴(kuò)展會(huì)更自然。

我覺得這也代表了行業(yè)一個(gè)相對(duì)正常的節(jié)奏:在預(yù)訓(xùn)練和泛化能力還沒真正做強(qiáng)之前,單靠「一個(gè)場景一個(gè)場景」用真機(jī)遙操堆出來,很難形成規(guī)模效應(yīng)。

問:怎么看待未來具身智能來自大廠的競爭?

王啟斌:我覺得大廠推進(jìn)具身智能的想法是對(duì)的——做基模本來就是大廠應(yīng)該做的事。但他們的路徑和我們不太一樣:很多大廠的數(shù)據(jù)采集和訓(xùn)練,跟「具體場景」的關(guān)聯(lián)度其實(shí)沒那么高,另外在落地工具鏈這一整套上也未必是同一個(gè)體系。

說白了,大廠只要肯投人、肯投錢,收很多數(shù)據(jù)去訓(xùn)練,基本都能訓(xùn)出一些「看起來還可以」的模型,做 demo 是沒問題的,這有點(diǎn)像大模型早期那種狀態(tài):砸資源總能做出一個(gè)像樣的展示。至于效果好壞,會(huì)有差異——你可能覺得某家現(xiàn)在更強(qiáng)、某家現(xiàn)在差一點(diǎn),但過一段時(shí)間排名又可能變化,我覺得這都很正常。

但我們追求的并不是「做出一個(gè)看起來不錯(cuò)的 demo」。我們更看重的是商業(yè)閉環(huán):能不能找到具身真正的落地場景,把數(shù)據(jù)飛輪轉(zhuǎn)起來,并且快速把這一套模式跑通、跑規(guī)模,盡快占住新的行業(yè)位置——我覺得這才是關(guān)鍵。

也有人會(huì)類比大模型,覺得最后可能變成「國內(nèi)就是大廠之間的競爭」。但我認(rèn)為具身不太容易出現(xiàn)完全同樣的格局,因?yàn)榫呱碛幸粋€(gè)非常關(guān)鍵的問題:數(shù)據(jù)孤島。大語言模型為什么能卷得那么快?因?yàn)閿?shù)據(jù)相對(duì)公開,大家都知道去哪拿,互聯(lián)網(wǎng)上一扒就有;自動(dòng)駕駛也是類似。

但具身不一樣:你收集兩三年的物流場景數(shù)據(jù),和別人收集兩三年的工業(yè)場景數(shù)據(jù),本質(zhì)上是兩套完全不同的數(shù)據(jù)分布,訓(xùn)出來的模型也會(huì)完全不一樣。即使是大廠,很多時(shí)候也只能在內(nèi)部搭一個(gè)相對(duì)封閉的場景去采數(shù)據(jù);但如果我們把機(jī)器人真正部署進(jìn)真實(shí)業(yè)務(wù)環(huán)境,數(shù)據(jù)回流速度會(huì)非常快,而這部分?jǐn)?shù)據(jù)大廠是拿不到的,模型偏差也會(huì)很大。

所以這恰恰構(gòu)成了初創(chuàng)公司的時(shí)間窗口:不是說大廠投錢就做不到,而是大廠一定有組織和路徑依賴;初創(chuàng)公司的機(jī)會(huì)在于能不能趁這個(gè)窗口期把場景和數(shù)據(jù)飛輪跑起來、把市場占住。大模型里很難形成這種壁壘,因?yàn)殚T檻更多在人才,而人才是流動(dòng)的;但具身不一樣,具身還有「數(shù)據(jù)」這一層。如果我們把物流場景的數(shù)據(jù)牢牢握在手里——甚至不對(duì)外出售,同時(shí)把大部分物流場景占住——那別人再想進(jìn)來,不管是數(shù)據(jù)質(zhì)量還是數(shù)據(jù)收集速度都會(huì)差很多,最終效果也會(huì)差很多。

*頭圖來源:靈初智能

本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO

極客一問

你如何看待靈初智能?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
10天后世乒賽,走路已瘸!國乒三號(hào),還能站住嗎?

10天后世乒賽,走路已瘸!國乒三號(hào),還能站住嗎?

曹老師評(píng)球
2026-04-18 19:43:07
美日韓媒體稱:一旦開戰(zhàn),中國將會(huì)被打得潰不成軍

美日韓媒體稱:一旦開戰(zhàn),中國將會(huì)被打得潰不成軍

音樂時(shí)光的娛樂
2026-04-18 21:04:10
三觀炸裂!翟欣欣出軌聊天記錄流出,尺度大到咂舌,判12年都嫌少

三觀炸裂!翟欣欣出軌聊天記錄流出,尺度大到咂舌,判12年都嫌少

有范又有料
2025-09-29 14:21:11
美國停火后才發(fā)現(xiàn),伊朗空軍大部分飛機(jī)都好好的

美國停火后才發(fā)現(xiàn),伊朗空軍大部分飛機(jī)都好好的

瀲滟晴方DAY
2026-04-19 03:00:58
王晶曝陳百強(qiáng)真正死因,64歲何超瓊顏面盡失

王晶曝陳百強(qiáng)真正死因,64歲何超瓊顏面盡失

君笙的拂兮
2026-03-22 03:44:36
東風(fēng) - 31 泄密大案:總工程師被美色策反,國之重器險(xiǎn)遭滅頂之災(zāi)

東風(fēng) - 31 泄密大案:總工程師被美色策反,國之重器險(xiǎn)遭滅頂之災(zāi)

干史人
2026-04-18 13:44:12
新娘確實(shí)漂亮,但我更喜歡戴眼鏡那個(gè)。

新娘確實(shí)漂亮,但我更喜歡戴眼鏡那個(gè)。

動(dòng)物奇奇怪怪
2026-04-12 12:44:36
申軍誼患腦梗四年現(xiàn)身足療館,女兒37歲成心病

申軍誼患腦梗四年現(xiàn)身足療館,女兒37歲成心病

夢回千年aa
2026-04-19 04:25:18
剛拿WSBK冠軍就翻車!820RR半路爆缸,張雪回應(yīng)太果斷

剛拿WSBK冠軍就翻車!820RR半路爆缸,張雪回應(yīng)太果斷

童叔不飆車
2026-04-19 00:54:41
王勵(lì)勤坦言包攬6金壓力太大!男乒現(xiàn)狀讓人捏把汗,洛奧路不好走

王勵(lì)勤坦言包攬6金壓力太大!男乒現(xiàn)狀讓人捏把汗,洛奧路不好走

吳蛛旅行ing
2026-04-19 05:05:48
變天了!伊朗,徹底反轉(zhuǎn)

變天了!伊朗,徹底反轉(zhuǎn)

藍(lán)鉆故事
2026-04-18 00:07:14
花了1萬5和梅根合照,結(jié)果梅根卻對(duì)著粉絲大倒苦水:我生活真難啊!

花了1萬5和梅根合照,結(jié)果梅根卻對(duì)著粉絲大倒苦水:我生活真難啊!

英國那些事兒
2026-04-18 23:20:17
哈登價(jià)值盡顯!騎士季后賽喜迎開門紅,一戰(zhàn)完美印證引援抉擇!

哈登價(jià)值盡顯!騎士季后賽喜迎開門紅,一戰(zhàn)完美印證引援抉擇!

田先生籃球
2026-04-19 05:19:57
張雪820RR爆缸事件后續(xù)來了:張雪宣布全部整改 不達(dá)標(biāo)直接關(guān)店!

張雪820RR爆缸事件后續(xù)來了:張雪宣布全部整改 不達(dá)標(biāo)直接關(guān)店!

藍(lán)色海邊
2026-04-18 20:26:13
豬油再次被關(guān)注!研究發(fā)現(xiàn):高血壓患者吃豬油 或出現(xiàn)4種變化

豬油再次被關(guān)注!研究發(fā)現(xiàn):高血壓患者吃豬油 或出現(xiàn)4種變化

華庭講美食
2026-04-19 04:54:48
俄羅斯遠(yuǎn)東交通事故中受傷的中國人已有14人回國治療

俄羅斯遠(yuǎn)東交通事故中受傷的中國人已有14人回國治療

界面新聞
2026-04-18 21:44:02
難怪我國措辭升級(jí),驅(qū)離畫面曝光,日艦艦炮上膛,載有反艦導(dǎo)彈

難怪我國措辭升級(jí),驅(qū)離畫面曝光,日艦艦炮上膛,載有反艦導(dǎo)彈

林子說事
2026-04-18 20:51:07
世錦賽戰(zhàn)報(bào):中國雙星領(lǐng)先,張安達(dá)優(yōu)勢明顯,衛(wèi)冕冠軍表現(xiàn)低迷

世錦賽戰(zhàn)報(bào):中國雙星領(lǐng)先,張安達(dá)優(yōu)勢明顯,衛(wèi)冕冠軍表現(xiàn)低迷

張辱鹵說體育
2026-04-18 21:56:59
街頭已大量出現(xiàn)!不少人捂鼻吐槽:別靠近,太上頭

街頭已大量出現(xiàn)!不少人捂鼻吐槽:別靠近,太上頭

舟山交通97
2026-04-18 15:52:29
清算終于來了!中方給日本的最后期限:180 天,歸還被掠百年國寶

清算終于來了!中方給日本的最后期限:180 天,歸還被掠百年國寶

z千年歷史老號(hào)
2026-01-31 13:50:06
2026-04-19 06:31:00
極客公園
極客公園
讓最棒的創(chuàng)新成為頭條
11962文章數(shù) 78871關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

頭條要聞

伊朗革命衛(wèi)隊(duì)向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊(duì)向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

體育要聞

時(shí)隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

汽車要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬元起

態(tài)度原創(chuàng)

教育
時(shí)尚
房產(chǎn)
家居
手機(jī)

教育要聞

杭州老師解讀古人如何說愛你,陌上花開,可緩緩歸矣

選對(duì)發(fā)型,真的能少走很多變美彎路

房產(chǎn)要聞

官宣簽約最強(qiáng)城更!海口樓市,突然殺入神秘房企!

家居要聞

法式線條 時(shí)光靜淌

手機(jī)要聞

榮耀600系列參數(shù)、外觀全曝光

無障礙瀏覽 進(jìn)入關(guān)懷版