4月21日,自變量機(jī)器人舉辦新品發(fā)布會(huì),正式推出新一代家庭機(jī)器人落地計(jì)劃。會(huì)上發(fā)布自研具身智能基礎(chǔ)模型WALL?B——這是全球首個(gè)基于世界統(tǒng)一模型(WUM)架構(gòu)的具身智能大模型,標(biāo)志著具身基礎(chǔ)模型從傳統(tǒng)VLA架構(gòu),邁向原生多模態(tài)統(tǒng)一融合的全新階段。
![]()
自變量創(chuàng)始人兼CEO王潛、聯(lián)合創(chuàng)始人兼CTO王昊,現(xiàn)場(chǎng)詳解WALL?B技術(shù)架構(gòu)、數(shù)據(jù)體系與訓(xùn)練機(jī)制,并宣布:35天后,搭載WALL?B的新一代機(jī)器人將首批入駐真實(shí)家庭,開(kāi)啟具身智能服務(wù)家庭生活的規(guī)模化落地。
家庭,才是具身智能的終極考場(chǎng)
![]()
“鬧鐘響起、拖鞋不見(jiàn)、碗筷未洗、玩具散落、寵物打翻水杯……”王潛用一段日常場(chǎng)景,點(diǎn)破家庭環(huán)境的核心特質(zhì):隨機(jī)、碎片、動(dòng)態(tài)不可控。
當(dāng)前行業(yè)機(jī)器人多停留在預(yù)設(shè)軌跡、遙控操作的“表演階段”,工業(yè)機(jī)器人更是依賴(lài)固定環(huán)境重復(fù)執(zhí)行。二者均無(wú)法應(yīng)對(duì)家庭里每時(shí)每刻都在變化的真實(shí)狀況。硬件已成熟,但智能才是最大瓶頸——機(jī)器人缺少能理解物理世界、自主應(yīng)對(duì)突發(fā)狀況的“大腦”。
從WALL?A到WALL?B:打破VLA架構(gòu)天花板
![]()
自成立之初,自變量便聚焦于構(gòu)建端到端的具身智能基礎(chǔ)模型。2024年底,公司曾發(fā)布基于 VLA 架構(gòu)的 WALL-A,隨后在25年9月開(kāi)源了輕量化版本 WALL-OSS,并與58同城合作,將搭載 WALL-AS 模型的機(jī)器人送入真實(shí)家庭與保潔協(xié)同作業(yè)。但在真實(shí)的 C 端復(fù)雜環(huán)境中,團(tuán)隊(duì)觸碰到了傳統(tǒng)架構(gòu)的“天花板”。
VLA 架構(gòu)的局限性:視覺(jué)、語(yǔ)言、動(dòng)作三個(gè)獨(dú)立模塊拼接,導(dǎo)致數(shù)據(jù)在跨越模塊邊界時(shí)產(chǎn)生嚴(yán)重的信息損耗與延遲。更重要的是,VLA 模型只能模仿訓(xùn)練數(shù)據(jù)的軌跡,無(wú)法真正理解物理世界的規(guī)律。
![]()
WUM 架構(gòu)的破局: WALL-B 是一次從底層架構(gòu)到訓(xùn)練范式的全面重寫(xiě)。類(lèi)似于蘋(píng)果芯片的統(tǒng)一內(nèi)存架構(gòu),WUM 將所有能力放在同一個(gè)網(wǎng)絡(luò)中從零開(kāi)始聯(lián)合訓(xùn)練,徹底消除了模塊間的邊界和數(shù)據(jù)搬運(yùn)損耗。
三大關(guān)鍵能力,定義新一代機(jī)器人“大腦”
基于WUM架構(gòu),WALL-B展現(xiàn)出三項(xiàng)關(guān)鍵能力:
1. 原生多模態(tài)融合
模型從訓(xùn)練初期即同時(shí)處理視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)與動(dòng)作信息,實(shí)現(xiàn)“所見(jiàn)即所想即所做”。
同時(shí)具備“本體感”——無(wú)需外部測(cè)量即可感知自身空間尺寸與動(dòng)作范圍。
![]()
2. 具備物理世界“常識(shí)”
能夠理解重力、摩擦力、慣性等基礎(chǔ)規(guī)律。例如看到桌邊懸空的盤(pán)子,可以主動(dòng)預(yù)測(cè)其掉落風(fēng)險(xiǎn)并采取行動(dòng)。
3. 可在真實(shí)環(huán)境中持續(xù)進(jìn)化
不同于傳統(tǒng)機(jī)器人遇錯(cuò)即停,WALL-B可以在失敗后自主調(diào)整策略,并將成功經(jīng)驗(yàn)直接寫(xiě)入模型,實(shí)現(xiàn)持續(xù)學(xué)習(xí)。
![]()
這意味著機(jī)器人不再依賴(lài)反復(fù)人工訓(xùn)練,而是在現(xiàn)實(shí)世界中不斷成長(zhǎng)。
“牛奶數(shù)據(jù)”筑底與嚴(yán)守隱私紅線(xiàn)
為了讓機(jī)器人真正適應(yīng)復(fù)雜的家庭生活,自變量深入數(shù)百個(gè)志愿者家庭,采集充滿(mǎn)隨機(jī)性與嘈雜元素的真實(shí)數(shù)據(jù)。
數(shù)據(jù)飛輪策略: 摒棄僅用干凈可控的實(shí)驗(yàn)室“糖水?dāng)?shù)據(jù)”,而是用實(shí)驗(yàn)數(shù)據(jù)打底建立基礎(chǔ)能力,用真實(shí)家庭的“牛奶數(shù)據(jù)”提質(zhì),讓模型學(xué)會(huì)在不確定環(huán)境中生存。
![]()
三大隱私安全保障:
視覺(jué)脫敏:原始圖像在設(shè)備端實(shí)時(shí)打碼,絕不離開(kāi)設(shè)備。
透明授權(quán):拒絕“默認(rèn)同意”,用戶(hù)主動(dòng)按下同意鍵后方可開(kāi)機(jī)。
用途限定:數(shù)據(jù)絕不共享給第三方;機(jī)器人只認(rèn)一個(gè)主人,發(fā)現(xiàn)可疑指令立即鎖定設(shè)備。
![]()
目前,自變量已明確商業(yè)化時(shí)間表:35天后,經(jīng)過(guò)硬件升級(jí)并搭載 WALL-B 的新一代機(jī)器人將正式入駐首批用戶(hù)家庭。即日起,官方渠道已開(kāi)始招募首進(jìn)家庭機(jī)器人的“家長(zhǎng)”。
CEO王潛坦言,當(dāng)前的機(jī)器人仍處于“實(shí)習(xí)生”階段,會(huì)犯錯(cuò)并需要遠(yuǎn)程協(xié)助。“人類(lèi)從嬰兒時(shí)期邁出的第一步也是如此。如今,機(jī)器人已經(jīng)在最復(fù)雜的地方開(kāi)始了它學(xué)習(xí)和進(jìn)化的征程。”
未來(lái)展望
![]()
從實(shí)驗(yàn)室到真實(shí)生活,從“展示能力”到“解決問(wèn)題”,具身智能正在跨越關(guān)鍵門(mén)檻。
WALL-B的發(fā)布,不只是一次技術(shù)升級(jí),更是一次方向性的轉(zhuǎn)變——
讓機(jī)器人真正理解世界,并在世界中成長(zhǎng)。
而35天后的家庭落地,或許正是這一變革的起點(diǎn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.