Jay 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
近日,中國(guó)具身智能史上最高單輪融資紀(jì)錄,誕生了。
4月16日,成立僅一年的它石智航,宣布完成Pre-A輪融資,金額4.55億美金。
![]()
一年前,它石斬獲了行業(yè)最大天使輪融資的標(biāo)簽;
一年后,這家公司的Pre-A輪,刷新中國(guó)具身最高單輪融資。
更引人矚目的,是此次堪稱(chēng)頂配的投資方陣容:
高瓴創(chuàng)投,與紅杉中國(guó)本次聯(lián)合領(lǐng)投它石智航。
與此同時(shí),美團(tuán)戰(zhàn)投重額加注并繼續(xù)領(lǐng)投,北京機(jī)器人產(chǎn)業(yè)發(fā)展投資基金、上海國(guó)投先導(dǎo)等國(guó)資聯(lián)合入局……
共20余家機(jī)構(gòu),橫跨財(cái)務(wù)、戰(zhàn)略、產(chǎn)業(yè)、國(guó)資四大維度。
而且據(jù)了解,這個(gè)投資方陣容完全是它石主動(dòng)設(shè)計(jì)的結(jié)果。
因?yàn)榧夹g(shù)已經(jīng)交卷了,它石很清楚自己想要什么,只有那些有長(zhǎng)期價(jià)值、有明確產(chǎn)業(yè)訴求、賦能清晰的投資方,才能上桌。
30億,怎么花?
據(jù)悉,主要投往兩個(gè)方向:大腦和人才。
大腦方面,它石的戰(zhàn)略重心在預(yù)訓(xùn)練,這部分算力消耗極大。
人才方面,它石將持續(xù)推進(jìn)「TARS STAR」全球頂尖人才引進(jìn)計(jì)劃,提供行業(yè)TOP級(jí)待遇。
用它石自己的話(huà)說(shuō)就是:
已經(jīng)準(zhǔn)備好「有格局地用大錢(qián)」了。
![]()
這是家有能力、有野心、有潛力不斷「創(chuàng)紀(jì)錄」的公司。
豪華的創(chuàng)始人團(tuán)隊(duì),技術(shù)斬獲吉尼斯,全球首個(gè)能干活的具身大模型,全球首創(chuàng)「以人為中心」的數(shù)采范式……
如今,潛心鉆研具身大腦一年有余的它石智航,用最大單輪融資額,又一次刷新了紀(jì)錄。
在兩輪融資和技術(shù)首次交卷后,它石已經(jīng)不僅僅是穩(wěn)坐具身智能第一梯隊(duì)——
更是國(guó)產(chǎn)具身大腦賽道的頭號(hào)玩家。
沒(méi)有大腦的本體,就只是一具軀殼
具身智能正在經(jīng)歷一場(chǎng)劇變。
過(guò)去兩年,行業(yè)熱鬧非凡。市場(chǎng)的喜好出奇統(tǒng)一,只要哪家公司的機(jī)器人能上臺(tái)翻個(gè)跟頭、跳段舞,展臺(tái)瞬間就會(huì)被圍得水泄不通。
包括春晚也是一群機(jī)器人在上面熱熱鬧鬧地跳舞。
本體形態(tài)是否酷炫、關(guān)節(jié)是否靈活、運(yùn)控是否流暢……這些最「前端」的指標(biāo),搶走了所有聚光燈。
然而,自去年年中開(kāi)始,一個(gè)更尖銳的問(wèn)題開(kāi)始反復(fù)出現(xiàn):
機(jī)器人到底啥時(shí)候能進(jìn)廠干活??到底有什么價(jià)值?
風(fēng)向,開(kāi)始不可逆地轉(zhuǎn)變了。
到了今年年初,這股「務(wù)實(shí)主義」的風(fēng),同樣刮到了資本市場(chǎng)的最前沿。
相比本體和小腦,以Skild AI、Sunday、Generalist等一批專(zhuān)攻智能上限的大腦玩家,開(kāi)始成為新的資本寵兒。
資本市場(chǎng)的嗅覺(jué)永遠(yuǎn)是最靈敏的。
當(dāng)頂級(jí)基金集體掉頭轉(zhuǎn)向,便釋放了一個(gè)清晰的信號(hào):?jiǎn)渭兓蛑攸c(diǎn)比拼本體硬件和底層運(yùn)動(dòng)控制(小腦)的競(jìng)賽,或許已經(jīng)基本結(jié)束了。
下半場(chǎng)的勝負(fù)手,是大腦。
而這個(gè)大腦要解決的,正是具身智能必須跨越的下一個(gè)階段——
真干活,而不是披著干活外衣的表演。
這同樣也是它石對(duì)其大腦的期許:能干活的具身通用大模型,
那么,它石的大腦,到底長(zhǎng)什么樣?
答案是:AWE 3.0,全稱(chēng)AI World Engine,即「AI世界引擎」。
![]()
是的,不是VLA,也不是3D資產(chǎn)生成模型。
這是一個(gè)從底層架構(gòu)就統(tǒng)一了感知、決策與行動(dòng)的原生具身大模型,并搭配了全球首個(gè)視觸覺(jué)世界模型OmniVTA。
視覺(jué)、語(yǔ)言、動(dòng)作,三種模態(tài)天然對(duì)齊,訓(xùn)練時(shí)可以在任意模態(tài)之間互相轉(zhuǎn)換——
「視覺(jué)」到「視覺(jué)」就是視頻預(yù)測(cè),「視覺(jué)-語(yǔ)言」到「動(dòng)作」就是端到端,「視覺(jué)-語(yǔ)言」到「視覺(jué)-動(dòng)作」就是世界模型。
更直觀一點(diǎn)來(lái)說(shuō),這個(gè)模型擁有一項(xiàng)叫Faliure Recovery(自我糾錯(cuò))的能力。
面對(duì)柔性操作中層出不窮的突發(fā)狀況,模型不再簡(jiǎn)單模仿動(dòng)作軌跡,而是在隱空間里持續(xù)推演未來(lái)的多種可能,再據(jù)此做出決策。
當(dāng)插接的力度或角度出現(xiàn)異常,機(jī)器人會(huì)主動(dòng)把線(xiàn)拔出來(lái),換個(gè)角度再試一次。
正如人類(lèi)的做法一樣。
對(duì)于真實(shí)工業(yè)場(chǎng)景而言,這是一個(gè)象征著應(yīng)用成熟度的關(guān)鍵信號(hào):
「機(jī)器人會(huì)反思了」。
這大概是2026年具身大腦浮出水面后,為行業(yè)送上的第一份厚禮。
更關(guān)鍵的是,這一切的實(shí)現(xiàn)沒(méi)有用到一秒鐘的遙操數(shù)據(jù)。
長(zhǎng)期以來(lái),關(guān)于具身訓(xùn)練數(shù)據(jù),行業(yè)有個(gè)共識(shí):遙操數(shù)據(jù)精度最高 。
它石卻覺(jué)得,這個(gè)結(jié)論完全站不住腳。
遙操作根本干不了亞毫米級(jí)的事。
在此前與量子位的對(duì)話(huà)中,它石首席科學(xué)家丁文超直言,在對(duì)精度有極高要求的場(chǎng)景下,人工遙操過(guò)程中的猶豫、抖動(dòng),反而會(huì)變成訓(xùn)練數(shù)據(jù)中的「噪聲」。
這也是它石反復(fù)強(qiáng)調(diào)Human-centric的真正原因。
線(xiàn)束這個(gè)場(chǎng)景實(shí)在太恐怖了。孔位極窄,容錯(cuò)性非常低。
但人能完成這個(gè)任務(wù)。
雖然不能百分百零偏差,但人的糾錯(cuò)能力極強(qiáng),所以可以在操作中感受阻力并據(jù)此迅速調(diào)整角度和力度。
從第一性原理出發(fā),丁文超指出,想要習(xí)得這種局部微調(diào)的能力,唯一的方式就是從真人身上采集數(shù)據(jù)。
如今,這個(gè)想法已完全落地,并且凝練成一整套以人為本的數(shù)據(jù)采集套件——SenseHub。
![]()
僅需一雙輕便的數(shù)采手套,加上一枚第一視角攝像頭,佩戴即開(kāi)工。勞動(dòng)者在日常作業(yè)中,便能順手完成數(shù)據(jù)采集。
回過(guò)頭來(lái)看它石的布局,邏輯就非常清晰了:
數(shù)據(jù)-本體-模型全棧自研,不是為了生態(tài),而是遵循「第一性原理」設(shè)計(jì)出來(lái)的。
在行業(yè)蠻荒期,技術(shù)路線(xiàn)尚未收斂,既無(wú)標(biāo)桿案例,亦無(wú)成熟的橫向分工。
而產(chǎn)業(yè)的每個(gè)變量又都會(huì)直接影響大腦能力。
所以必須有一定程度的完美主義,全棧自研,抓緊每個(gè)細(xì)節(jié)。
這是從第一性原理推導(dǎo)出的必然。
全棧大腦這個(gè)概念,最有魅力的地方也在于此。
做大腦的每家公司都在圍繞自身的哲學(xué)思考,從數(shù)據(jù)-本體-模型三個(gè)維度全線(xiàn)出發(fā),將各自的信念極致化。
這注定是一場(chǎng)極為精彩,同時(shí)也極為殘酷的淘汰賽。
吉尼斯紀(jì)錄背后,是落地的領(lǐng)先
具身大腦這條賽道上,所有玩家,無(wú)論從哪條路徑出發(fā),最終都會(huì)不可避免地交叉在一起。
因?yàn)檫@場(chǎng)比賽,大家都是奔著泛化去的。
真實(shí)世界是混沌且極度復(fù)雜的。如果一個(gè)機(jī)器人只能像復(fù)讀機(jī)一樣執(zhí)行預(yù)設(shè)的單一腳本,那它與傳統(tǒng)自動(dòng)化產(chǎn)線(xiàn)上的機(jī)械臂并無(wú)本質(zhì)區(qū)別。
LLM讓人興奮的原因正是如此,我們第一次擁有了具備泛化可能的智能。
雖然它在特定單一任務(wù)上可能不如硬編碼的腳本極致,但真實(shí)世界中那些無(wú)法用腳本邏輯描述的種種長(zhǎng)尾任務(wù),必須依靠智能的「涌現(xiàn)」來(lái)解決。
但這也意味著——贏家通吃。
具身智能之所以被視為下一個(gè)萬(wàn)億級(jí)賽道,其核心前提正是泛化能力、跨場(chǎng)景復(fù)制能力以及成本可控的規(guī)模化能力。
而它石智航從成立的第一天起,所有的戰(zhàn)略重心都在為這個(gè)前提做準(zhǔn)備,所以他們選擇了線(xiàn)束。
線(xiàn)束裝配,工業(yè)自動(dòng)化界的「哥德巴赫猜想」。長(zhǎng)程操作、柔性操作、亞毫米精度,「不可能三角」全部集齊于此……堪稱(chēng)「地獄」級(jí)別的工廠場(chǎng)景。
它石選擇這個(gè)高價(jià)值x高難度場(chǎng)景作為交卷的技術(shù),本身就極具深意。
大多數(shù)具身智能公司在選擇落地場(chǎng)景時(shí),往往會(huì)遵循「易落地、快見(jiàn)效」的路徑,比如疊毛巾、搬箱子、擺貨架。
這些任務(wù)實(shí)打?qū)嵈嬖谥A啃枨螅瑫r(shí)對(duì)精度的要求也沒(méi)那么恐怖。
但它石,偏要反其道而行之。要打,就打最難的仗。
對(duì)此,丁文超曾表示:
沒(méi)有Plan B。
畢竟,如果連最柔軟、最易變形的線(xiàn)束都能實(shí)現(xiàn)精準(zhǔn)裝配,那么工廠里其他那些常規(guī)裝配任務(wù),則無(wú)異于降維打擊。
而事實(shí)證明,它石不僅做到了,更是直接把這個(gè)場(chǎng)景徹底「打爆」——
1小時(shí)內(nèi),完成百余次亞毫米級(jí)柔性線(xiàn)束完整裝配任務(wù),一舉刷新吉尼斯世界紀(jì)錄。
![]()
甚至,還在高速裝配的過(guò)程中,保證了擬人的「觀賞性」。
在它石發(fā)起的業(yè)內(nèi)首個(gè)「機(jī)器人柔性操作圖靈測(cè)試」,超過(guò)50%的投票者竟然分不清:究竟哪個(gè)是機(jī)器人。
![]()
其中,Human-centric的重要性不言而喻。
這種數(shù)據(jù)采集方式,天然具備全場(chǎng)景覆蓋的基因。因?yàn)樗蹲降氖侨嗽谡鎸?shí)環(huán)境中的工作流,不再受限于特定硬件或封閉的數(shù)采中心。
這意味著,AWE 3.0從誕生之初,便是具備跨場(chǎng)景遷移潛力的。
在它石看來(lái),模型層的過(guò)擬合只是技術(shù)瑕疵,但方法論的過(guò)擬合是致命的。
因此,從成立第一天開(kāi)始,它石就拒絕了走捷徑,全力押注Human-centric這條路。
一年過(guò)去,它石曾經(jīng)許諾的BP現(xiàn)在正一一化為現(xiàn)實(shí),并且他們?nèi)匀辉趫?jiān)持最初的理念。
在AI這個(gè)技術(shù)日新月異的賽道,敢于「不變」,或許比「求變」需要更大的定力。
如今,這份對(duì)初心的堅(jiān)守終于迎來(lái)了回響。它石智航憑借線(xiàn)束場(chǎng)景一戰(zhàn)成名。
但事實(shí)上,聚光燈之外,它石智航從創(chuàng)立之初便同步啟動(dòng)了工廠、物流、倉(cāng)儲(chǔ)、洗衣房、酒店等多場(chǎng)景的數(shù)據(jù)采集。
從一開(kāi)始,它石就是奔著泛化去的。
目前,它石已手握超十萬(wàn)小時(shí)Human-centric數(shù)據(jù),并正式發(fā)起「具身數(shù)據(jù)星火計(jì)劃」,并邀請(qǐng)生態(tài)伙伴共建產(chǎn)業(yè)級(jí)數(shù)據(jù)共享生態(tài),直指1億小時(shí)級(jí)別的數(shù)據(jù)共享。
而基于這些可遷移的訓(xùn)練數(shù)據(jù),它石內(nèi)部已有多個(gè)落地場(chǎng)景在并發(fā)推進(jìn),蓄勢(shì)待發(fā)。
一顆足夠優(yōu)秀的大腦,能夠填平從工業(yè)到家庭的泛化鴻溝。
這,正是具身智能從實(shí)驗(yàn)室走向千行百業(yè)的關(guān)鍵。
資本下半場(chǎng)風(fēng)向標(biāo):大腦強(qiáng),則具身強(qiáng)
具身智能,正在從「百花齊放」的喧囂,走向百川歸海。
踏入2026年,資本不再普降甘霖,而是開(kāi)始精準(zhǔn)滴灌。
而滴灌的靶心,正是全棧布局、大腦為核的公司——這個(gè)糧草先行、兵家必爭(zhēng)的戰(zhàn)略高地。
沒(méi)有大腦的本體公司,本質(zhì)上是一具精致的軀殼,只能等待別人來(lái)注入靈魂,上限從一開(kāi)始就被鎖死了;
而不做本體的純算法團(tuán)隊(duì),無(wú)法打通數(shù)據(jù)反饋的商業(yè)閉環(huán),最終就會(huì)淪為技術(shù)外包商。
在殘酷的淘汰賽里,技術(shù)收斂后,市場(chǎng)只會(huì)需要第一名。
這也是垂直整合在這個(gè)行業(yè)早期的必要性所在。想把技術(shù)做到極致,唯一的解法,只有把變量全部握在自己手里。
核心零部件和硬件供應(yīng)鏈固然會(huì)有專(zhuān)業(yè)化分工,但整個(gè)產(chǎn)業(yè)的定價(jià)權(quán)與標(biāo)準(zhǔn)制定權(quán),必將向擁有「最強(qiáng)大腦」的全棧企業(yè)高度集中。
贏家,一定是全棧大腦公司。
高瓴與紅杉的聯(lián)手押注,正是對(duì)這一終局判斷最有力的印證。
對(duì)于長(zhǎng)期主義機(jī)構(gòu)而言,不怕投得晚,但一旦押注,就說(shuō)明對(duì)其已經(jīng)有了篤定的未來(lái)畫(huà)像。
這也是兩家頂級(jí)機(jī)構(gòu)經(jīng)歷了對(duì)它石超過(guò)一年的跟蹤深度調(diào)研后,最終決定聯(lián)合出手的原因。
因?yàn)?strong>具身大腦,就是那個(gè)正在逐漸收斂的確定性。
而在這條新賽道上,它石無(wú)疑是當(dāng)下最具競(jìng)爭(zhēng)力的頭號(hào)玩家之一。
4.55億美金,是資本對(duì)這個(gè)終局判斷的搶先投票。
在下半場(chǎng),全棧大腦會(huì)成為具身智能下一階段競(jìng)賽的勝負(fù)手。
槍響了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.