![]()
![]()
4月21日,自變量機器人舉行發布會,推出新一代機器人進家庭計劃。
作者|栗子
“35天后,機器人進入家庭。”自變量CEO王潛,在發布會現場做出了一個分量極重的承諾。
4月21日,自變量機器人發布新一代具身基礎模型WALL-B,并宣布35天后,搭載該模型的新一代機器人將首批入駐真實家庭。與其說這是一場模型發布會,不如說,這更像是自變量第一次把“機器人進家”這件說了很久的事,壓縮成了一個清晰的倒計時。
![]()
機器人進入家庭,一直是具身智能行業最誘人的一句話。它所對應的,不只是一個新場景,也不只是一個新的商業想象,而是具身智能終極的落點:一個真正能走進客廳、廚房和臥室,與人共同生活、共同勞作的機器人,才算得上具身智能從概念走向現實的真正跨越。
但所有人也都知道,家庭始終是機器人最難進入的地方。
舞臺、展廳和實驗室可以制造驚嘆的動作,家庭卻不會配合表演。那里沒有標準工位,沒有固定流程,沒有一萬次重復后仍然不變的工況,甚至沒有哪一分鐘是完全可預測的。地上的拖鞋、沒收拾的書包、隨時會打翻水杯的貓、狹窄的過道、光照變化的廚房、材質各異的桌椅和地毯,這些對于人類來說是生活的紋理,對機器人來說卻是最復雜的變量。
王潛在發布會上說得很直白:工廠里,一個動作可以重復一萬次;家庭里,一萬個動作,每個可能都只做一次,每次條件都不一樣。
也正因此,家庭不是機器人最后才去的地方,反而很可能是盡早必須面對的地方。因為那里不是展示區,而是真正的考場。自變量這場發布會,真正回答的也不是“我們又做出了什么新模型”,而是把家庭從概念口號拉回到產業進程里。它的意義在于,它把具身一個長期懸而未決的問題提前擺上桌面:模型究竟應該先在相對確定的場景里追求完美,還是應該盡早進入最復雜、最真實、最不受控的生活現場,在問題中成長、在反饋中進化。
某種意義上,這不是一次單純的產品發布,而更像是一次路線表態——家庭,不再只是終局想象,而開始成為推動行業繼續往前走的現實引擎。
![]()
1.這個時間點進家庭,節奏剛好
關于機器人何時進入家庭,行業里其實一直存在兩種思路。
一種思路認為,只有等模型真正具備足夠成熟的通用性或者說泛化能力后,家庭場景才值得考慮;另一種思路則更激進,認為終局場景恰恰應該盡早進入,因為只有真正進到最復雜的現實中,模型和產品才會暴露出真正的問題。你的機器人到底理解世界到什么程度,實驗室不會完全告訴你,家庭才會。這個判斷,在自變量的選擇上體現得非常明顯。
從表面看,自變量是在“提速”機器人進家。但從更深一層看,它其實是在承認一個現實,家庭并不是等模型完全成熟以后才值得去的終點,而是推動模型繼續成長的沃土。
這也是自變量一再強調,家庭與工業是兩類“極端相反”的場景的核心原因。工業場景相對封閉、固定,對速度和準確率要求極高。而家庭場景則開放、碎片、極度復雜,對泛化性的要求近乎苛刻,后者才是模型能力真正的用武之地。換句話說,家庭才是基礎能力的鍛造場。
這種判斷,并不是紙面推演出來的,是研發與應用端共同得出的結論。
作為國內具身智能模型派的代表企業,自變量始終致力于讓模型在真實環境中處理復雜問題。前不久,自變量與58同城合作,將搭載WALL-AS模型的機器人真正送入家庭,與保潔阿姨協同作業。在真實部署中,自變量看到了VLA架構的“局限性”——它可以模仿訓練數據中的軌跡,卻無法真正理解物理世界的規律;它在看似標準的任務里還能完成動作,但當環境、光照、材質、空間結構稍微發生變化,能力就會快速衰減。
真實場景暴露出一個模型之外非常重要的問題--訓練數據。
限制機器人進家的,不只是模型結構的局限,還包括數據這一模型認識這個世界的基礎。實驗室數據干凈、穩定、可控,適合建立基本能力,卻和真實生活有著天然的距離。王昊把這類數據比喻為“糖水數據”——可以吃飽,但不夠有營養;而真正讓機器人生長出泛化能力的,是來自真實家庭、真實擾動、真實混亂中的“牛奶數據”。
這個視角與知名的家庭機器人廠商1X technologies一致,其CEO Bernt ?ivind多次在公開場合表示“智能需要多樣性”“如果你在汽車工廠,你基本上是在一遍又一遍地做同樣的事情。你沒有在學習新東西”。
從這個角度看,自變量此時宣布“35天后進入家庭”,節奏并不冒進,反而恰好踩在了一個關鍵節點上:模型已經沉淀出最基礎的能力,可以支撐機器人開始在家庭里做事;而家庭這個場景本身,又恰恰能為模型提供最有價值、最難替代的數據回流。它既是目標,也是訓練場;既是應用場景,也是數據礦場。
所以,自變量此時選擇進入家庭,沒有一味的試圖證明機器人可以進家了,而是為了更徹底地回答另一個問題:機器人怎樣才能真的學會在家里生活。一言蔽之,家庭場景為真正的模型成長提供了必要的“數據導入”。
![]()
目前自變量團隊已進入數百個志愿者的真實家庭進行訓練,這些真實家庭場景數據的任務的豐富程度、復雜度與數據價值是絕對優勢。模型架構可以copy,論文可以復現,但這些實打實進入真實家庭的數據是臟活累活,必須要用這種笨方法去“采集”。
尤其重要的是,他們并不把數據采集、模型訓練、部署評測割裂成幾個線性環節,而是在機器人進入真實環境后,通過人機協作、在線回流,讓部署、評估、學習幾乎在同一時刻發生。這意味著,自變量所謂的“進家庭”,并不是等一個完美產品定型后再推向市場,而更像是讓一個已經具備基礎能力的機器人,正式進入一個能持續反饋、持續打磨、持續學習的系統里。
換句話說,自變量的底氣是形成并夯實數據飛輪閉環:從真實環境中獲取數據,在真實任務中暴露問題,再通過真實回流不斷修正模型。模型、數據、部署和迭代,不再是割裂的,而是被拉成了一整條鏈路。王潛在媒體采訪中提到,他們希望在未來兩到三年里,實現物理世界里的“Aha moment”。如果說語言模型的轉折點發生在ChatGPT那一刻,那么機器人進入家庭,也許正是具身智能尋找這個“Aha moment”的必要路徑之一。
2.自變量的底氣,來自于重寫“大腦”
“機器人進入家庭”這件事,過去常常更像一種愿景,像一種寫在PPT里的終局想象。真正能把它說成明確日期、明確動作、明確計劃的企業,并不多。
這也是王潛那句“35 天后進家庭”之所以分量極重的原因。它不是一個模糊的“敬請期待”,而是一個明確的交付節點。自變量敢把時間表說得這么硬,背后的底氣,來自于兩層:一層是模型架構的改寫,一層是長期沉淀下來的家庭數據。
先說模型。自變量這次發布的WALL-B最大的特點,是它不再沿用VLA視覺、語言、動作相對分層、相對拼接的處理方式,而是用“世界統一模型”架構,把視覺、語言、動作、物理預測等能力,從第一天起放在同一個網絡里聯合訓練。王昊在發布會上用了一個很形象的比喻:這有點像蘋果從傳統分離式架構轉向統一內存架構,不是讓數據搬運得更快,而是干脆減少“搬運”本身。
這套架構,可以概括為三項能力:
第一,是原生多模態。過去的機器人往往更像在做“傳話游戲”:視覺先看見,語言再描述,動作最后執行,信息在模塊之間一層層傳遞,也在一層層損耗。自變量希望WALL-B從一開始就把視覺、聽覺、語言、觸覺、動作等多模態信息同步訓練,讓它不再靠“轉述”理解世界,而是原生地、多通道地感知世界。
進一步說,這還帶來一種他們強調的“原生本體感”——機器人不必時時依賴外部建模,就能內在地感知自己多高、多寬、手能伸多遠、能不能通過一扇門、能不能夠到一個物體。對家庭場景來說,這種能力非常重要,因為家庭里的空間限制、家具尺度、物體擺放本身就是動態變化的。
第二,是物理世界的“世界觀”。過去的機器人可以識別一個盤子,卻未必理解“盤子懸在桌邊會掉下去”這件事;可以看見杯子,卻未必理解杯子里有水、拿取時需要調整力度。這種差別,看似細微,實則是“會識別”和“會理解”之間的分界線。
自變量的WALL-B就是讓機器人第一次真正對重力、慣性、摩擦力、速度等物理規律建立內生理解。也正因為物理規律是跨場景穩定存在的,這也是機器人零樣本泛化真正的基礎,不用每到一個新家都要重訓,而是在任何一個陌生家庭里,都能利用相同的物理常識去應對新場景。
第三,是與世界交互并自我進化。這或許是最具想象力的一點。當前多數機器人在任務失敗后會直接停止,等待工程師或遠程操作員接管;而WALL-B,則更像一個能在失敗中調整策略、在真實環境中繼續嘗試的智能體。
王昊把它類比成小孩學騎自行車、學用筷子的過程:不是先等所有規則都學會了再進入現實,而是在現實中不斷摔、不斷試,再把成功的經驗內化成能力。對一個要進入家庭的機器人來說,這意味著它不能只是“執行命令”,而要開始具備一種長期生長的能力。
![]()
歸根結底,WALL-B帶來的底氣,在于它開始讓機器人學著原生多模態數據,多維度感知世界,也感知本體,進而真正去理解物理世界的規律。最終,在持續理解世界、適應變化、并在交互中不斷變得更聰明。
3.進入家庭是一次全方位的挑戰
機器人進家庭,從來不是一個純技術問題。
技術只是門票,決定機器人能不能留下來成為家庭成員的重要原因之一,是對用戶隱私的保護。
這幾乎是所有家庭機器人都會面對的一個基本問題:當一個會看、會聽、會動、甚至會不斷學習的機器進入私密空間——“家”,人們最自然的顧慮,是它會不會泄露隱私,會不會在不該執行的時候執行,在不該看見的時候看見。
“承諾是便宜的,用戶信任才是最貴的”,王潛給出了三重方案:
第一,視覺脫敏。機器人在設備端對原始圖像進行實時打碼處理,原始圖像不離開設備,機器人“看到”的已經是去除個人特征后的場景數據;
第二,透明授權。用戶必須主動按下同意鍵后方可開機,不存在默認同意。自變量沒有那種互聯網式的“霸王條約”;
第三,用途限定。數據絕不共享第三方,機器人只認一個主人,發現可疑指令立即鎖定。
這些設計看上去像是隱私合規條款,但放在家庭場景里,它們其實更像一種產品哲學:機器人必須默認克制、必須先獲得許可,再開始工作。進入家庭的特殊性,就是讓一個“知道邊界”的機器被生活接納。
![]()
當然,即便能夠解決用戶隱私泄露的擔憂,自變量還會面臨不少現實障礙。但正如王潛所說,機器人確實不能滿足所有期待,也確實存在弊端,但不能因為恐懼出錯就不敢前行。在真實場景直面問題,才是解決問題的第一步。
這一點在媒體采訪里也得到了更坦白的補充。當被問到機器人5月進入家庭是否意味著它已經能完全靠AI自主完成所有任務時,王潛的回答并不回避現實。他承認,這并不是一個百分之百全都能靠 AI 來做的過程,必要時仍需要人的兜底、接管和安全保障。這種務實的表態,反而是有價值的。他沒有把“進家庭”包裝成一個已經徹底圓滿的童話,相反遠程協作和人為兜底反而確保了那些corner case能夠得到及時收集與解決。
總之,機器人進入家庭這條路不會輕松。但自變量卻正在一點點推動它開始邁向“一個家庭成員的誕生”新階段。
從行業視角看,這場發布會真正值得記住的,并不是WALL-B某一個具體的技術名詞,而是自變量把家庭這個最復雜的場景,重新擺回了具身智能的正中央。而當一個行業開始認真討論機器人如何進入家庭、如何被家庭接受、如何在家庭里邊做邊學的時候,某種意義上,真正的比賽才剛剛開始。
(封面圖及文中配圖來源:自變量)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.