无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

熊鵬航:大部分?jǐn)?shù)據(jù)是浪費(fèi)的,以人為本才能見終局

0
分享至



具身智能終于來到了脖子以下的戰(zhàn)爭

2017年,留學(xué)歸來沒多久的熊鵬航在武漢光谷租下一間不大的辦公室,開始做一件事:把人手每根手指的關(guān)節(jié)角度數(shù)據(jù),用IMU傳感器采出來,傳感器精度做到0.001度,延遲壓到3毫秒以內(nèi)。那時候大部分人覺得這是浪費(fèi)——機(jī)器人連走路都還搖搖晃晃,研究手指有什么用?更何況,市面上99%的機(jī)器人裝的還是夾爪,不是靈巧手。

從2017年到2026年,將近十年時間,整個具身智能行業(yè)的注意力都在大腦上,大模型、視覺理解、語義推理。現(xiàn)在,行業(yè)終于發(fā)現(xiàn),脖子以下也是硬仗。

這似乎得益于行業(yè)大趨勢的轉(zhuǎn)向:2026年初,Jim Fan在英偉達(dá)GTC上宣布“VLA已死”,提出WAM(世界動作模型),核心論點(diǎn)是讓模型先去預(yù)測世界的下一個物理狀態(tài),再輸出動作,而不是用語言去描述一個抓取任務(wù)。Genesis AI隨后發(fā)布GENE-26.5,把機(jī)械臂端到端控制延遲從80毫秒壓到3毫秒。Sharpa的North在CES上用靈巧手打乒乓球。這些新動態(tài)背后,意味著具身智能的戰(zhàn)場,正在從大腦的語義空間遷移到肢體的物理空間。

而這個轉(zhuǎn)向,正好撞上了灝存科技CEO熊鵬航一直在等的那個時刻。2026年一季度,意大利的一個機(jī)器人研究團(tuán)隊(duì)直接飛到杭州,沖進(jìn)灝存科技的辦公室,要當(dāng)場驗(yàn)證那雙數(shù)據(jù)手套的精度數(shù)字是不是真的。他們不是第一批這樣做的海外客戶。這一季度,灝存拿到了將近十個海外訂單。這種勢頭在三年前完全不可想象。2023年,國內(nèi)大多數(shù)機(jī)器人公司還在問“什么是數(shù)據(jù)手套”;2024年,一批公司開始在實(shí)驗(yàn)室用;到了2026年,頭部機(jī)器人公司開始討論把高精度動作采集設(shè)備列入硬件標(biāo)配。

灝存做的事情,用最簡單的話說,是采集人類手部和全身運(yùn)動時每一個關(guān)節(jié)的角度數(shù)據(jù),并把這套數(shù)據(jù)通用化賦予各類機(jī)器人。你可以不綁定任何一家機(jī)器人硬件,讓所有符合人體工程學(xué)設(shè)計(jì)的靈巧手和機(jī)械臂都能調(diào)用同一套運(yùn)動數(shù)據(jù)基礎(chǔ)設(shè)施,更快完成訓(xùn)練和部署。


(2010年在法國巴黎六大求學(xué)的熊鵬航)

01.

為什么是現(xiàn)在

大講堂:2026年一開年,Sharpa帶著North在CES上打乒乓球、組裝風(fēng)車,Genesis AI隨后用GENE-26.5單手打蛋、彈鋼琴,英偉達(dá)的Jim Fan又在4月宣布“VLA已死”、提出WAM世界動作模型。你作為在這個方向上做了十年的人,看到這些變化時,什么感受?

熊鵬航:最大的感受是,行業(yè)終于開始回答那個最基礎(chǔ)的問題了。2017年我跟投資人講“未來機(jī)器人會需要人類動作數(shù)據(jù)來訓(xùn)練”,大部分人覺得我在講科幻。過去十年里,我們一直在等——等這個行業(yè)意識到“脖子以下”的技術(shù)不是可有可無的,等市場承認(rèn)肢體動作識別和運(yùn)動控制是整個具身智能產(chǎn)業(yè)鏈上不可繞開的一環(huán)。

過去十年,具身智能的聚光燈幾乎全部打在“大腦”上——大模型、視覺理解、語義推理。但一個機(jī)器人最終要被評判的,不是它聽懂了什么,而是它做到了什么。Sharpa打乒乓球、Genesis單手打蛋——這些Demo之所以讓人興奮,不是因?yàn)樗鼈冇昧硕鄰?fù)雜的語言模型,而是因?yàn)樗鼈冋故玖司_的物理操作能力。行業(yè)正在從“能說會道”轉(zhuǎn)向“能干活”,這個轉(zhuǎn)向我們等了十年。

Jim Fan宣布“VLA已死”、提出WAM世界動作模型,我認(rèn)為這標(biāo)志著一個更深的認(rèn)知轉(zhuǎn)變:具身智能的核心問題正在從“如何用語言描述世界”回歸到“如何用動作與世界交互”。他在方法論層面把這件事講透了——預(yù)訓(xùn)練的目標(biāo)應(yīng)該是預(yù)測下一個世界狀態(tài),而不是預(yù)測下一個token。這個判斷和我們十年來的工程直覺完全一致,區(qū)別只在于他站在模型層提出概念,我們站在數(shù)據(jù)采集和運(yùn)動控制的工程層,已經(jīng)把這些概念做成了產(chǎn)品。看到行業(yè)最前沿的認(rèn)知終于追上了我們十年前就相信的方向,這種感覺很復(fù)雜,但更多是欣慰。

大講堂:Jim Fan說WAM的核心邏輯是“用預(yù)測世界下一狀態(tài)替代預(yù)測下一個token”。你們的技術(shù)路線早于這個概念,但你們說的是關(guān)節(jié)角度數(shù)據(jù)預(yù)測機(jī)器人的下一個動作。WAM的技術(shù)路徑對你們來說是顛覆嗎?這兩件事的關(guān)系是什么?

熊鵬航:我們正在密切關(guān)注這條路線,而且已經(jīng)有一些初步探索。

WAM的核心邏輯一-“預(yù)訓(xùn)練模擬下一個世界狀態(tài),對應(yīng)LLM的nexttokenprediction;動作微調(diào)校準(zhǔn)對真實(shí)機(jī)器人有價值的部分”--這條路徑在方法論上是優(yōu)雅的,本質(zhì)上是在做一件事:把物理常識變成模型的先驗(yàn)知識。但這套邏輯有一個隱含前提:你用來微調(diào)的那部分“高質(zhì)量真實(shí)動作數(shù)據(jù)”,本身必須是精確、高保真、具備跨平臺通用性的。如果用于微調(diào)的數(shù)據(jù)本身質(zhì)量不高或綁定了特定硬件,再好的預(yù)訓(xùn)練模型也只是“在沙灘上建城堡”。

所以WAM的出現(xiàn)不是替代我們的價值,而是放大了我們的價值一一WAM越普及,行業(yè)對高質(zhì)量動作數(shù)據(jù)的需求就越大,對數(shù)據(jù)手套精度和泛化能力的要求就越高。我們的角色恰好卡在WAM路線最需要的那一層:提供高保真、跨平臺通用的動作數(shù)據(jù)采集與標(biāo)準(zhǔn)化基礎(chǔ)設(shè)施。我們內(nèi)部也在研究如何將關(guān)節(jié)角度數(shù)據(jù)直接接入世界模型的訓(xùn)練管線,讓模型在“做夢”的時候不僅僅是預(yù)測像素變化,還能預(yù)測關(guān)節(jié)狀態(tài)變化。


(2019年熊鵬航設(shè)計(jì)的第一代數(shù)據(jù)手套)


02.

技術(shù)路線的選擇與架構(gòu)底層邏輯

大講堂:也有人拿你和Genesis AI類比,因?yàn)槟銈兗夹g(shù)路線相似,參數(shù)上也都能做到3毫秒延遲。但Gemini的周銜說“操控不是一個純模型訓(xùn)練問題,而是一個系統(tǒng)問題”,因此他們做了垂直硬件整合,數(shù)據(jù)策略是高保真穿戴手套、第一視角視頻、第三人稱視頻三類并行。你們卻不綁定任何一家硬件,只做適配,這是怎么考慮的?你們兩者路線的共性和差異在哪?

熊鵬航:我們聚焦高保真層,是因?yàn)樗俏ㄒ荒苤苯虞敵鰴C(jī)器人關(guān)節(jié)指令的數(shù)據(jù)類型。第一視角視頻提供場景語義,第三人稱視頻做行為理解和大規(guī)模預(yù)訓(xùn)練,但從看懂怎么做到精確執(zhí)行,中間缺的恰恰是關(guān)節(jié)角度數(shù)據(jù)這一層,它是動作信息的最終表達(dá),是機(jī)器人可以直接消費(fèi)的控制信號。

但這套數(shù)據(jù)的天花板確實(shí)存在,而且我們正在主動突破它:觸覺。視覺和關(guān)節(jié)角度數(shù)據(jù)解決的是“怎么動”的問題,觸覺解決的是“用了多大力”的問題。捏草莓和捏螺絲,關(guān)節(jié)的運(yùn)動軌跡可以完全相同,唯一的區(qū)別在于接觸瞬間的力控,多一分則碎,少一分則滑。在遮擋場景和微小形變場景下,視覺對力控的感知能力接近失效,而關(guān)節(jié)角度數(shù)據(jù)本身也只描述運(yùn)動學(xué),無法描述接觸力學(xué)。

灝存科技正在做的一件事,是在數(shù)據(jù)手套上集成觸覺傳感模塊。邏輯是一副手套如果能同時采集關(guān)節(jié)角度和指尖接觸力,形成的“運(yùn)動-力覺”多模態(tài)數(shù)據(jù),能讓下游訓(xùn)練的模型不僅知道“手指彎到了哪里”,還知道“彎到這里時產(chǎn)生了多大接觸力、該不該繼續(xù)用力”。這在靈巧操作里是決定性的細(xì)節(jié)。

此外,我們整個技術(shù)路線有一個設(shè)計(jì)原點(diǎn),叫Human-Centric,即以人的自然運(yùn)動為采集基準(zhǔn),而不是讓人去適配設(shè)備。這不是產(chǎn)品設(shè)計(jì)哲學(xué),而是訓(xùn)練數(shù)據(jù)質(zhì)量的底層保障:只有采集到最接近人類自然運(yùn)動模式的數(shù)據(jù),訓(xùn)練出的機(jī)器人才可能真正復(fù)現(xiàn)人的靈巧性,而不是在模擬一個穿著外骨骼的被約束的人。

我們的判斷是,在一個硬件形態(tài)高度分散、尚未形成標(biāo)準(zhǔn)的產(chǎn)業(yè)早期,綁定某一款硬件的風(fēng)險很高,而讓所有硬件都能接入同一套數(shù)據(jù)生態(tài)的價值,遠(yuǎn)比服務(wù)某一家要大。我們的3毫秒是感知輸入層延遲,從人手指關(guān)節(jié)產(chǎn)生運(yùn)動,MEMS傳感器采集角度變化,經(jīng)過我們自研的無線通信協(xié)議棧傳輸,到上位機(jī)完成姿態(tài)解算并輸出控制指令,整條鏈路小于3毫秒。這是“感官信號”進(jìn)入系統(tǒng)的延遲。

大講堂:UMI方案在過去兩年里部署速度很快,成本低、不需要穿戴,適合快速規(guī)模化采集。你們的IMU手套方案精度更高,但穿戴成本更高、需要培訓(xùn)。在數(shù)據(jù)采集的量和質(zhì)之間,市場用腳投票的結(jié)果是什么?

熊鵬航:這個問題的核心不是量和質(zhì)的權(quán)衡,而是兩種方案服務(wù)的根本需求是不是同一件事。

UMI方案的邏輯是用最低門檻采集最多樣的操作行為,然后用模型的泛化能力去彌補(bǔ)數(shù)據(jù)精度的不足。這個邏輯在特定任務(wù)上成立,當(dāng)操作行為本身的物理復(fù)雜度不高,比如推箱子、開抽屜、倒水,UMI采集的數(shù)據(jù)已經(jīng)足夠模型學(xué)習(xí)。它的部署速度確實(shí)快,在行業(yè)里搶到了一批早期客戶。但它有一個根本局限,夾爪的自由度是2,人手的自由度是27。用夾爪采集的數(shù)據(jù),只能訓(xùn)練有夾爪的機(jī)器人,或者通過非常復(fù)雜的遷移流程才能適配到靈巧手。而行業(yè)趨勢非常清晰,那就是能完成復(fù)雜任務(wù)的機(jī)器人必然是靈巧手設(shè)計(jì),不是夾爪。


(熊鵬航設(shè)計(jì)的M11數(shù)據(jù)手套高精度采集手部動作數(shù)據(jù))


大講堂:靈巧手賽道2025年至今內(nèi)卷非常激烈,腱繩驅(qū)動、直驅(qū)電機(jī)、旋轉(zhuǎn)電機(jī)各種路線都有人做。你們不做硬件,專注于給各種靈巧手提供運(yùn)動神經(jīng)中樞,但如果一家硬件公司自己把控制層吃透,你們的空間會不會被壓縮?

熊鵬航:如果一家靈巧手公司把控制層吃透,恰恰是在驗(yàn)證我們的價值主張,而不是取代我們。原因在于,吃透控制層意味著什么?意味著那家公司要從傳感器、通信協(xié)議到融合算法全部重新做一遍,至少需要三到五年,而且做出來的方案天然只服務(wù)于自己的硬件生態(tài)。

機(jī)器人產(chǎn)業(yè)現(xiàn)在最不需要的,就是又一個封閉生態(tài)。一家機(jī)器人公司的實(shí)際采購結(jié)構(gòu)是:A品牌靈巧手、B品牌機(jī)械臂、C品牌移動底盤混搭使用,它需要一套能統(tǒng)一管理所有這些硬件運(yùn)動數(shù)據(jù)的操作系統(tǒng)。每家靈巧手公司各自把控制層吃透,只會造成數(shù)據(jù)孤島,讓集成成本更高。

我們做的是所有靈巧手公司的“共同基礎(chǔ)設(shè)施”。泛化適配不是營銷話術(shù),是具體的工程工作,腱繩驅(qū)動的關(guān)節(jié)映射邏輯、直驅(qū)電機(jī)的力矩轉(zhuǎn)換參數(shù)、旋轉(zhuǎn)電機(jī)的角速度補(bǔ)償——每一種驅(qū)動類型都是一套獨(dú)立的適配工作。我們今天能做到對任意一款靈巧手進(jìn)行適配,依靠的是多年的硬件對接積累,任何一家新進(jìn)入者都需要從頭做這些工作。

03.

數(shù)據(jù)經(jīng)濟(jì)的真實(shí)結(jié)構(gòu)

大講堂:2026年初全球高質(zhì)量真實(shí)物理交互數(shù)據(jù)只有約50萬小時,不足大語言模型訓(xùn)練數(shù)據(jù)規(guī)模的兩萬分之一。但我想從另一個角度追問:動作數(shù)據(jù)本質(zhì)上是一種高度碎片化的資產(chǎn),每個操作場景、每個物體類型都需要單獨(dú)采集,這意味著數(shù)據(jù)的覆蓋問題不是靠規(guī)模投入就能解決的,而是一個結(jié)構(gòu)性的長尾問題。你們怎么看這個長尾困境?

熊鵬航:你說的這個結(jié)構(gòu)性困境確實(shí)存在,而且它比表面上看起來更深,更準(zhǔn)確的理解是,動作數(shù)據(jù)的單位價值和文本數(shù)據(jù)完全不在一個量級。一段10分鐘的高質(zhì)量手部操作數(shù)據(jù),訓(xùn)練出的抓取技能可以驅(qū)動真實(shí)機(jī)器人完成工業(yè)任務(wù);而同等時長的文字內(nèi)容,它的訓(xùn)練價值遠(yuǎn)沒有這么直接和可度量。

因?yàn)閯幼鲾?shù)據(jù)分兩大類。第一類是“能力數(shù)據(jù)”(ability data):跑、跳、蹲、起、捏、抓、轉(zhuǎn),這些是寫在人體基因里的基礎(chǔ)運(yùn)動能力,大約140個動作類型。這類數(shù)據(jù)相對容易標(biāo)準(zhǔn)化,采集一次可以在多個場景復(fù)用,也是現(xiàn)在行業(yè)里數(shù)據(jù)采集最活躍的區(qū)域。

第二類是“技能數(shù)據(jù)”(skill data):理發(fā)、炒菜、做手術(shù)、裝配精密零件、護(hù)理病人,這些是嵌入在具體產(chǎn)業(yè)場景里的專業(yè)技能。聯(lián)合國的職業(yè)分類里有大約12.5萬個不同的崗位,每一個崗位背后都有一套機(jī)器人需要學(xué)習(xí)的技能數(shù)據(jù)集。這才是真正意義上的長尾。

這個長尾問題的本質(zhì)是,沒有任何單一公司能獨(dú)立完成這種覆蓋,它必然是整個產(chǎn)業(yè)分工協(xié)作的結(jié)果。做醫(yī)療機(jī)器人的公司會率先掌握手術(shù)數(shù)據(jù);做家政機(jī)器人的公司會積累清潔和護(hù)理數(shù)據(jù);做工業(yè)機(jī)器人的公司會沉淀裝配和焊接數(shù)據(jù)。數(shù)據(jù)會在各自深耕的場景里自然生長,而不是靠某家公司集中采集覆蓋所有場景。

我們感受到的行業(yè)變化是,客戶的采購邏輯在快速升級。2024年以前,主要是單個實(shí)驗(yàn)室采購一兩套設(shè)備做研究驗(yàn)證;2025年開始出現(xiàn)公司級采購,用于搭建規(guī)模化數(shù)據(jù)采集管線;到今年,頭部機(jī)器人公司開始把數(shù)據(jù)手套列入常規(guī)硬件標(biāo)配清單,而不是實(shí)驗(yàn)性工具。這個變化背后的邏輯是,具身智能的技術(shù)瓶頸已經(jīng)明確地從算法轉(zhuǎn)移到了數(shù)據(jù),行業(yè)進(jìn)入了數(shù)據(jù)基礎(chǔ)設(shè)施的投資周期。

更深的變化是行業(yè)開始理解“數(shù)據(jù)是長期資產(chǎn)”。三年前,大家對數(shù)據(jù)的態(tài)度是“夠用就行”;現(xiàn)在,越來越多的機(jī)器人公司在問:我們的動作數(shù)據(jù)資產(chǎn)是否具備跨硬件的復(fù)用能力?我們的數(shù)據(jù)采集標(biāo)準(zhǔn)能不能接入下一代訓(xùn)練框架?這種問法本身說明行業(yè)成熟了。因?yàn)槲覀冏龅氖腔A(chǔ)設(shè)施:提供采集工具、制定數(shù)據(jù)標(biāo)準(zhǔn)、實(shí)現(xiàn)跨硬件復(fù)用,能讓每家機(jī)器人公司都能用我們的設(shè)備采集自己場景里的數(shù)據(jù),而且這些數(shù)據(jù)格式統(tǒng)一、可以在不同品牌硬件上流通。我們的價值不在于擁有所有數(shù)據(jù),而在于成為所有數(shù)據(jù)的通用。


(人類手部的原始數(shù)據(jù)可以成為任何一款靈巧手的通用語言)


大講堂:智元的Genie Sim 3.0用2萬幀仿真數(shù)據(jù)就實(shí)現(xiàn)了機(jī)械臂抓取100%成功率。如果仿真路徑真的跑通,真機(jī)數(shù)據(jù)的價值是否會被稀釋?就像電話接線員這個職業(yè),不是慢慢衰退,而是在某個技術(shù)拐點(diǎn)之后一夜消失?

熊鵬航:這個問題我經(jīng)常被問到,但我不認(rèn)為它的答案是會消失,更準(zhǔn)確的答案是“會重新定位”。仿真解決的是從零到有的問題,真機(jī)數(shù)據(jù)解決的是從有到精的問題,兩者的分工正在走向清晰,而不是零和。

先說為什么2萬幀仿真數(shù)據(jù)實(shí)現(xiàn)100%抓取成功率不是終局。那個任務(wù)的物理復(fù)雜度相對低:目標(biāo)物體是剛性的,抓取點(diǎn)是確定的,環(huán)境是高度受控的。這是一個仿真和真實(shí)之間差距最小的任務(wù)類型。換成軟體操作,例如捏一顆草莓判斷成熟度、取出一個軟包裝里的物品、給硅膠管道裝配接頭,仿真的表現(xiàn)就會急劇下降,因?yàn)檐涹w的形變力學(xué)、多指的觸覺協(xié)同,仿真器目前的建模精度根本支撐不了這類任務(wù)的遷移。

仿真做得再好,它永遠(yuǎn)是一個封閉的物理引擎對真實(shí)世界的近似——近似永遠(yuǎn)有偏差,偏差在安全關(guān)鍵場景里可以是致命的。工業(yè)機(jī)器人在真實(shí)流水線上遇到的螺絲尺寸公差、表面油污、光線反射,這些細(xì)節(jié)是仿真引擎無法枚舉的。消除這個偏差需要真機(jī)數(shù)據(jù)。

但我更想回答的是你問題里的真正含義:如果仿真到真實(shí)的遷移成本持續(xù)下降,真機(jī)數(shù)據(jù)的量會不會最終可以忽略不計(jì)?我的判斷是,量會大幅壓縮,但它的質(zhì)會要求越來越高。當(dāng)仿真預(yù)訓(xùn)練做好了通識,真機(jī)數(shù)據(jù)就不再承擔(dān)“量”的任務(wù),而是承擔(dān)“精確校準(zhǔn)”的任務(wù),校準(zhǔn)這臺機(jī)器、這個環(huán)境、這個任務(wù)的邊界條件。這類高質(zhì)量定向采集數(shù)據(jù),未來可能是每次任務(wù)只需要幾十到幾百條,但每一條都必須精度極高、保真度極高、注釋完整。這對數(shù)據(jù)采集工具的要求不是降低,而是提高了。

關(guān)于比例,行業(yè)現(xiàn)在沒有共識,但從當(dāng)前的工程實(shí)踐來看,仿真數(shù)據(jù)可能占整個訓(xùn)練數(shù)據(jù)體量的90%以上,真機(jī)數(shù)據(jù)只占5%到10%。但這5%到10%是決定模型能否真正在不受控的物理環(huán)境中穩(wěn)定運(yùn)行的臨界因子。它的作用不是量的填充,而是錨定,也就是把仿真里學(xué)到的物理直覺,與真實(shí)世界的摩擦系數(shù)、材料特性、環(huán)境噪聲對齊。沒有這層錨定,仿真預(yù)訓(xùn)練的泛化能力就是空中樓閣。

所以我們的判斷是,一旦仿真預(yù)訓(xùn)練的規(guī)模效應(yīng)跑通,行業(yè)對高質(zhì)量真機(jī)數(shù)據(jù)的需求不會縮小,而是會更加精準(zhǔn)和剛性。每推出一款新機(jī)型,每進(jìn)入一個新的操作場景,都需要一批高保真真機(jī)數(shù)據(jù)來完成對齊微調(diào)。這個需求是結(jié)構(gòu)性的,不會因?yàn)榉抡孀儚?qiáng)而消失。

04.

商業(yè)模式的真實(shí)邏輯

大講堂:外界看來,你們不是硬件廠商,不是數(shù)據(jù)服務(wù)商,而是一個跨品牌的中間商,這種定位的商業(yè)變現(xiàn)邏輯是什么?因?yàn)橘u硬件的商業(yè)模式很清晰,賣“操作系統(tǒng)”這種企業(yè)的商業(yè)模式需要生態(tài)規(guī)模,而生態(tài)建設(shè)是最耗時的事情。現(xiàn)在你們的收入主要來自哪里,五年后的收入結(jié)構(gòu)會是什么樣的?

熊鵬航:現(xiàn)階段,我們最直接、最清晰的收入來自硬件,數(shù)據(jù)手套、全身動態(tài)捕捉系統(tǒng),以及基于這些硬件的定制化服務(wù)。這是實(shí)實(shí)在在的產(chǎn)品收入,不是平臺故事。

但我們在構(gòu)建的,是一個三層的收入結(jié)構(gòu)。第一層是硬件層,現(xiàn)在已經(jīng)跑通:銷售精度和性能行業(yè)領(lǐng)先的數(shù)據(jù)采集設(shè)備,客戶包括機(jī)器人公司、科研院所、海外團(tuán)隊(duì)。這一層的市場隨著具身智能產(chǎn)業(yè)的擴(kuò)張會持續(xù)增長,而且我們在這一層有明確的技術(shù)壁壘。

第二層是數(shù)據(jù)服務(wù)層,現(xiàn)在處于早期建設(shè)階段,這個階段不只是賣工具,而是幫助客戶建立數(shù)據(jù)資產(chǎn),提供標(biāo)準(zhǔn)化的數(shù)據(jù)集、數(shù)據(jù)注釋服務(wù)、跨硬件的數(shù)據(jù)遷移方案。你用我們的工具采集數(shù)據(jù),同時可以訪問我們積累的通用動作數(shù)據(jù)集作為預(yù)訓(xùn)練基礎(chǔ),你只需要采集你的特定場景數(shù)據(jù),不需要從零開始。這對中小規(guī)模的機(jī)器人公司是很大的效率提升。

第三層是操作系統(tǒng)層,這是三到五年后的目標(biāo),讓我們的運(yùn)動神經(jīng)中樞成為行業(yè)標(biāo)準(zhǔn)接口,不管哪家機(jī)器人公司的硬件,只要接入我們的系統(tǒng),就能自動繼承行業(yè)積累的全部動作數(shù)據(jù)生態(tài),就像手機(jī)廠商接入Android,就能訪問所有Android應(yīng)用一樣。這一層的變現(xiàn)模式可能是授權(quán)費(fèi)、API調(diào)用費(fèi)或者數(shù)據(jù)生態(tài)的分成機(jī)制。

短期內(nèi),第一層支撐公司運(yùn)營,第二層建立差異化,第三層是長期護(hù)城河。這三層不是互相替代,是疊加的。

大講堂:可以理解為,你們把自己的長期目標(biāo)定位為“小腦”,負(fù)責(zé)運(yùn)動執(zhí)行和動作控制。但從產(chǎn)業(yè)發(fā)展的軌跡來看,大腦(決策層)和小腦(執(zhí)行層)最終會整合進(jìn)同一套端到端系統(tǒng)。如果大模型公司決定把運(yùn)動控制層自研或者收購,你們的獨(dú)立性怎么保證?

熊鵬航:這是一個值得深想的問題,我不想給一個回避性的答案。大腦和小腦的整合是確定性的趨勢,沒有疑問。當(dāng)具身智能進(jìn)入成熟期,端到端的控制模型會把語義理解、物理預(yù)測、動作生成整合在一套框架里,到那時候大腦公司和小腦公司這種分類就不再成立。問題是那個整合什么時候發(fā)生,以及當(dāng)它發(fā)生時,我們處于什么位置。

我的判斷這個整合點(diǎn)在五年后的可能性很低,在十年后的可能性開始顯著上升。在這個窗口期里,我們需要做的是讓自己的技術(shù)積累深到“整合時不能繞開”的程度。大腦公司自研運(yùn)動控制的成本,比收購或者合作要高得多。因?yàn)檫\(yùn)動控制需要大量硬件測試、跨品牌適配、傳感器工程積累,這些不是算法團(tuán)隊(duì)能短期補(bǔ)上的。

更重要的是,我們在主動靠近大腦層。我們現(xiàn)在研究如何把關(guān)節(jié)角度數(shù)據(jù)接入世界模型的訓(xùn)練管線,讓模型不只是預(yù)測像素變化,還能預(yù)測關(guān)節(jié)狀態(tài)變化;我們在探索如何讓我們的數(shù)據(jù)格式成為多模態(tài)訓(xùn)練框架的標(biāo)準(zhǔn)輸入。如果我們能在技術(shù)上成為大腦公司“必須兼容的一層”,我們就有了談判資本,而不是等著被收購或者被替代。

這也是為什么我一直說我們是小腦而不是傳感器硬件公司——這個定位的意義在于,我們在認(rèn)知層面已經(jīng)把自己放在了大腦之下、硬件之上這個不可或缺的中間層,而不是某一臺設(shè)備的配件供應(yīng)商。

大講堂:2026年一季度灝存科技拿下近10個海外訂單,意大利考察團(tuán)直接沖到辦公室。海外客戶為什么現(xiàn)在主動找上門?他們買的到底是什么?是參數(shù)上的領(lǐng)先,還是國內(nèi)產(chǎn)業(yè)鏈積累下來的成本優(yōu)勢?

熊鵬航:兩個原因都有,但不是簡單疊加,是乘法效應(yīng)。

海外客戶買的首先是我們解決了一個他們在本土解決不了的問題:同時滿足高精度和跨平臺泛化。其次是我們的方案有極高的性價比優(yōu)勢——全套國產(chǎn)供應(yīng)鏈的IMU方案比歐洲光學(xué)方案成本低了一個數(shù)量級,部署門檻也低得多。

另一個不能忽視的因素是2025年底到2026年初,全球具身智能產(chǎn)業(yè)的手部數(shù)據(jù)采集業(yè)務(wù)需求集中爆發(fā),灝存的出現(xiàn)恰好填補(bǔ)了供給缺口,而且產(chǎn)品效果經(jīng)過傳播和不少客戶驗(yàn)證,海外客戶自然就找上門了。

05.

產(chǎn)業(yè)終局的推演

大講堂:Jim Fan給出了2040年實(shí)現(xiàn)物理AGI的時間表。具身智能領(lǐng)域公認(rèn)的幾個難題——從語義理解到精細(xì)操作,從單場景到跨場景泛化,你認(rèn)為哪一個是最后倒下的那個?換句話說,具身智能系統(tǒng)會在哪個環(huán)節(jié)上,在最后一刻仍然需要人類幫忙?

熊鵬航:我認(rèn)為最后倒下的是觸覺。視覺問題在大規(guī)模數(shù)據(jù)和強(qiáng)模型的加持下,泛化能力會持續(xù)提升;語義理解已經(jīng)基本解決;運(yùn)動控制隨著數(shù)據(jù)積累和WAM這類新范式的成熟,會在五到十年內(nèi)達(dá)到工業(yè)可用的水平。但觸覺是一個獨(dú)特的感知通道,它的問題不只是技術(shù)難度,而是數(shù)據(jù)采集的內(nèi)在困難。

人類的指尖有大約2500個觸覺感受器,能感知壓力、振動、溫度、紋理、形變——這些信號的時空分辨率極高,而且高度依賴于具體的物理接觸情境,很難在實(shí)驗(yàn)室里大規(guī)模標(biāo)準(zhǔn)化采集。視覺數(shù)據(jù)可以從互聯(lián)網(wǎng)上挖掘;語言數(shù)據(jù)更是以PB級存量存在;但“擰開一個瓶蓋時手指接觸瓶蓋的力學(xué)分布”這類數(shù)據(jù),目前沒有規(guī)模化的采集基礎(chǔ)設(shè)施。

這也是我們在數(shù)據(jù)手套上集成觸覺傳感的核心動機(jī),如果我們能在采集關(guān)節(jié)角度的同時采集指尖接觸力,就是在填補(bǔ)這個感知缺口。當(dāng)機(jī)器人拿起一顆草莓,它需要知道的不只是手指彎到了什么角度,還有那顆草莓有沒有開始變形、接觸壓力是否超過閾值,這是視覺和運(yùn)動學(xué)都無法單獨(dú)提供的信息。

Jim Fan的2040年時間表在整體方向上我認(rèn)為是合理的,但實(shí)現(xiàn)路徑不會是線性的。會有某個領(lǐng)域在某個特定時間點(diǎn)出現(xiàn)范式突破,然后帶動整體躍升。現(xiàn)在我們看到的大模型 + 世界模型 + 高質(zhì)量動作數(shù)據(jù)這個三層架構(gòu),很可能就是那個突破的前序形態(tài)。

大講堂:你自己在法國研發(fā)機(jī)器人時的那個判斷是“十年之內(nèi)機(jī)器人產(chǎn)業(yè)一定爆發(fā)”。這個預(yù)測在2024年提前三年實(shí)現(xiàn)了?現(xiàn)在回頭看,那段時間做對了什么,又錯過了什么?

熊鵬航:錯過的是在具身智能爆發(fā)前沒有更快建立與機(jī)器人行業(yè)的直接連接。

2019年到2022年那段時間,機(jī)器人市場根本不夠大,沒有足夠多的客戶能支撐一家專注做機(jī)器人數(shù)據(jù)采集的公司的運(yùn)營,就算我們當(dāng)時選擇死守機(jī)器人方向,也養(yǎng)不活一個有足夠研發(fā)深度的團(tuán)隊(duì)。我們當(dāng)時只能用同一套傳感器技術(shù)把現(xiàn)金流做起來,同時保持核心團(tuán)隊(duì)的穩(wěn)定和技術(shù)迭代的節(jié)奏。這是對的。

錯過的是,在2022年到2023年,具身智能的信號已經(jīng)相當(dāng)清晰了,特斯拉發(fā)布Optimus,波士頓動力拿到新融資,國內(nèi)第一批人形機(jī)器人公司成立。那時候如果我們更快地把資源向機(jī)器人端轉(zhuǎn)移,在行業(yè)爆發(fā)之前提前建立更多的客戶關(guān)系和硬件適配,2024年的爆發(fā)期會更快把我們帶起來,而不是需要用Demo視頻來讓行業(yè)重新認(rèn)識我們是誰。

但回頭看,這不是一個可以完全避免的錯配。新產(chǎn)業(yè)爆發(fā)的時間節(jié)點(diǎn)本來就很難精確預(yù)判,提前三年布局意味著在這三年里要用非主營業(yè)務(wù)養(yǎng)主營業(yè)務(wù),這種模式本身有它的惰性。我們確實(shí)分散了一部分精力,但也保住了技術(shù)積累沒有斷。

大講堂:最后一個問題。25歲時你定下“20年造出鋼鐵俠”的目標(biāo),現(xiàn)在預(yù)計(jì)推遲到60歲退休時。這個目標(biāo)是一種激勵機(jī)制,還是一個嚴(yán)肅的工程規(guī)劃?換句話說,你認(rèn)為自己這代人,能不能親眼看到一臺真正意義上的具身AGI?

熊鵬航:兩者都是。說它是激勵機(jī)制,是因?yàn)椤颁撹F俠”這個意象很具體、很有畫面感,對團(tuán)隊(duì)和自己都是一個可以持續(xù)參照的北極星。說它是嚴(yán)肅的工程規(guī)劃,是因?yàn)槲覀兇_實(shí)按照三個階段來拆解它——運(yùn)動感知系統(tǒng)、數(shù)據(jù)操作系統(tǒng)、大小腦融合,每一個階段都有具體的技術(shù)里程碑。

但我不覺得推遲是挫敗,因?yàn)楝F(xiàn)在是對產(chǎn)業(yè)節(jié)奏更準(zhǔn)確的理解。技術(shù)本身可能只需要十年,但我低估了產(chǎn)業(yè)生態(tài)成熟所需要的時間。技術(shù)進(jìn)入真實(shí)場景、建立完整供應(yīng)鏈、形成市場標(biāo)準(zhǔn)、被大規(guī)模使用,需要的時間比技術(shù)攻關(guān)要長得多。這是所有基礎(chǔ)設(shè)施類產(chǎn)業(yè)的共同規(guī)律。成立灝存這些年也讓我真正理解了一件事,產(chǎn)業(yè)爆發(fā)等的是整個生態(tài)鏈條的成熟,不只是技術(shù)本身。等待不是浪費(fèi),是在替整個行業(yè)把那些沒人愿意先做的基礎(chǔ)工作做完。

至于能不能親眼看到真正的具身AGI,我個人更在意的不是最終時間表,而是自己這批人做的事情,在人類技術(shù)史上或許都有著無與倫比的價值。就像蔡倫造紙、畢昇活字,他們在做這件事的時候,不知道這件事會影響幾百年。我們現(xiàn)在做的,是讓機(jī)器人學(xué)會怎么動,這是具身智能整個產(chǎn)業(yè)鏈上最底層的那塊磚。如果最終那座大樓建起來,這塊磚要在里面。這已經(jīng)夠了。

06.

尾聲

今天,Jim Fan宣布“VLA已死”,Genesis AI把控制延遲壓到3毫秒,Sharpa的靈巧手開始打乒乓球。整個具身智能的戰(zhàn)場,正在從大腦的語義空間遷移到肢體的物理空間。熊鵬航等了快十年的那個時刻,終于來了。

有人問他,這十年是不是浪費(fèi)了?他說,等待不是浪費(fèi)。十年前他從手部數(shù)據(jù)出發(fā),因?yàn)槟鞘俏ㄒ粵]有捷徑可走的路。十年后,行業(yè)繞了一大圈,發(fā)現(xiàn)脖子以下才是硬仗,而打贏這場硬仗的第一批彈藥,就藏在那顆傳感器的0.001度中。

熊鵬航?jīng)]有等風(fēng)口,他只是比所有人早出發(fā)了十年。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
現(xiàn)貨黃金失守4200美元/盎司,刷新兩個半月新低

現(xiàn)貨黃金失守4200美元/盎司,刷新兩個半月新低

澎湃新聞
2026-06-10 09:04:07
廣東一名考生高考時發(fā)現(xiàn) 考場里只有自己一個人!

廣東一名考生高考時發(fā)現(xiàn) 考場里只有自己一個人!

看看新聞Knews
2026-06-09 23:21:20
葉一茜談23歲巔峰期嫁人原因,不是沖動,是普通人最頂級的清醒

葉一茜談23歲巔峰期嫁人原因,不是沖動,是普通人最頂級的清醒

觀魚聽雨
2026-06-09 23:44:50
美軍正對伊朗進(jìn)行第3輪空襲,伊朗多個港口被炸,國際油價直線拉升!超160艘油輪被困波斯灣,國際海事組織警告:勿涉險闖關(guān)

美軍正對伊朗進(jìn)行第3輪空襲,伊朗多個港口被炸,國際油價直線拉升!超160艘油輪被困波斯灣,國際海事組織警告:勿涉險闖關(guān)

每日經(jīng)濟(jì)新聞
2026-06-10 09:18:10
1夜4大官宣-穆帥二進(jìn)宮皇馬,奧里吉退役,吉魯續(xù)約,格羅索簽約

1夜4大官宣-穆帥二進(jìn)宮皇馬,奧里吉退役,吉魯續(xù)約,格羅索簽約

田先生籃球
2026-06-09 08:45:23
一念之間:那個本來可以成為中國華盛頓的人,為何偏要跳進(jìn)火坑?

一念之間:那個本來可以成為中國華盛頓的人,為何偏要跳進(jìn)火坑?

浪子說
2026-06-08 01:10:03
算力租賃概念快速拉升 美利云、拓維信息雙雙漲停

算力租賃概念快速拉升 美利云、拓維信息雙雙漲停

每日經(jīng)濟(jì)新聞
2026-06-10 10:14:02
官方:尼克斯球迷賽后尋釁滋事,共21人遭拘留,5名警察受傷

官方:尼克斯球迷賽后尋釁滋事,共21人遭拘留,5名警察受傷

懂球帝
2026-06-10 09:32:31
注意了!國內(nèi)印度人數(shù)量飆升,網(wǎng)友涌進(jìn)國務(wù)院留言,評論區(qū)太支持

注意了!國內(nèi)印度人數(shù)量飆升,網(wǎng)友涌進(jìn)國務(wù)院留言,評論區(qū)太支持

譚談社會
2026-06-09 22:07:27
王家烈交出軍權(quán),蔣介石贈五千元銀元安撫,轉(zhuǎn)身下了第二道密令

王家烈交出軍權(quán),蔣介石贈五千元銀元安撫,轉(zhuǎn)身下了第二道密令

磊子講史
2026-06-08 17:11:25
明日開幕!全網(wǎng)吹梅西吹到離譜!老球迷直言:C羅真的太冤了!

明日開幕!全網(wǎng)吹梅西吹到離譜!老球迷直言:C羅真的太冤了!

晚霧空青
2026-06-10 11:28:07
這位阿里員工爆料內(nèi)部即將大裁員,不怕被開除么

這位阿里員工爆料內(nèi)部即將大裁員,不怕被開除么

螞蟻大喇叭
2026-06-09 13:05:18
預(yù)測市場交易員:霍爾木茲海峽航運(yùn)2026年大概率無法恢復(fù)正常 2027年1月前無法恢復(fù)正常的概率為65.5%

預(yù)測市場交易員:霍爾木茲海峽航運(yùn)2026年大概率無法恢復(fù)正常 2027年1月前無法恢復(fù)正常的概率為65.5%

財(cái)聯(lián)社
2026-06-09 20:54:19
炸了!中國突然扔出王炸,直接改寫 200 年工業(yè)史!

炸了!中國突然扔出王炸,直接改寫 200 年工業(yè)史!

安安說
2026-06-09 11:35:34
B站更懂“崩年輕人”

B站更懂“崩年輕人”

藍(lán)鯨新聞
2026-06-09 10:01:12
我賣掉深圳的房子回縣城,卡里躺著1000萬卻跟親戚說我負(fù)債了。沒兩天,借給我錢的3個發(fā)小就上門來要錢了

我賣掉深圳的房子回縣城,卡里躺著1000萬卻跟親戚說我負(fù)債了。沒兩天,借給我錢的3個發(fā)小就上門來要錢了

黎兜兜
2026-06-06 14:35:15
梁安琪奚夢瑤逛商場,全程面露不悅,疑婆媳不和對毛燥兒媳不滿

梁安琪奚夢瑤逛商場,全程面露不悅,疑婆媳不和對毛燥兒媳不滿

八卦王者
2026-06-08 10:50:29
聯(lián)盟將審查文班對布朗森惡犯 被質(zhì)疑規(guī)避文班停賽

聯(lián)盟將審查文班對布朗森惡犯 被質(zhì)疑規(guī)避文班停賽

體壇周報(bào)
2026-06-10 09:18:16
外媒:中國準(zhǔn)備公開殲-36并震驚世界?全球最大第六代重型戰(zhàn)斗機(jī)

外媒:中國準(zhǔn)備公開殲-36并震驚世界?全球最大第六代重型戰(zhàn)斗機(jī)

零度Military
2026-06-08 14:56:01
WTT連爆大冷!國乒三人出局,兩大名將輸外協(xié),秦志戩王皓遭重?fù)?>
    </a>
        <h3>
      <a href=等等talk
2026-06-10 08:05:20
2026-06-10 12:32:49
機(jī)器人大講堂 incentive-icons
機(jī)器人大講堂
立德機(jī)器人平臺,是一個集媒體品牌、智庫咨詢、投資孵化、引智招商為一體的機(jī)器人垂直領(lǐng)域服務(wù)平臺
6683文章數(shù) 4589關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!Anthropic神級模型向你開放

頭條要聞

一家三口養(yǎng)1.2萬只蠶寶寶 耗時17天終于變成2床蠶絲被

頭條要聞

一家三口養(yǎng)1.2萬只蠶寶寶 耗時17天終于變成2床蠶絲被

體育要聞

2026世界杯,我們看什么?

娛樂要聞

850萬請跑男,公款追星肥了誰的口袋

財(cái)經(jīng)要聞

大盤股IPO終結(jié)行情盛宴?背后真相來了

汽車要聞

賽豆科技發(fā)布AIVA品牌 首款概念車亮相/量產(chǎn)版新車今年內(nèi)發(fā)布

態(tài)度原創(chuàng)

旅游
藝術(shù)
教育
手機(jī)
公開課

旅游要聞

準(zhǔn)考證別丟!河南這些景區(qū)免門票啦!

藝術(shù)要聞

2026年中國美術(shù)學(xué)院,研究生畢業(yè)油畫作品選(四)

教育要聞

出身中國物理世家!華人富豪巨額捐贈普林斯頓大學(xué),本科畢業(yè)于復(fù)旦大學(xué)

手機(jī)要聞

頂級拍照效果旗艦手機(jī)推薦:長焦遠(yuǎn)攝與超長續(xù)航手機(jī)選購指南

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版