當下,具身智能賽道正面臨一個尷尬的現實:舞臺上的機器人后空翻大放異彩,但它可能連自主把地上的拖鞋放回鞋架都做不到。
數據是制約機器人進化的瓶頸已然成為行業共識。
要打破這一瓶頸,行業亟需向真實的物理世界尋找交互數據。
在眾多應用場景中,家庭生活所能產生的數據無疑是足具復雜性與訓練價值的場景之一。家庭環境的本質是隨機、碎片和不斷變化的,例如貓隨時會跳上桌子,地毯的摩擦力各不相同,散落的玩具毫無規律。
這種充滿噪音和不確定性的數據恰是具身智能實現泛化的關鍵訓練場。但該場景也是獲取數據難度較高的陣地,核心壁壘在于隱私邊界。讓一臺滿載攝像頭和傳感器的設備進入私域空間,無異于挑戰公眾信任的底線。
但家庭場景也是獲取數據難度較高的陣地,核心壁壘在于隱私邊界。讓一臺滿載攝像頭和傳感器的設備進入私域空間,無異于挑戰公眾信任的底線。
盡管面臨較高的信任門檻,但為了獲取真實的物理世界交互數據,已有機器人公司開始探索“入戶”破局。
近日,自變量機器人宣布其搭載新一代具身智能基礎模型WALL-B的機器人,將在5月25日后進入真實家庭。
在此之前,自變量機器人已與58同城合作,將搭載WALL-AS模型的機器人送入真實家庭,與保潔阿姨協同作業。
針對市場關注的隱私問題,自變量機器人給出的解法是進行端側圖像脫敏、授權機制以及數據用途限制。
據自變量創始人兼CEO王潛介紹:
一是視覺脫敏,機器人在設備端對原始圖像進行實時打碼處理,原始圖像不離開設備,機器人看到的已經是去除個人特征的場景數據;
二是透明授權,用戶主動按下同意鍵后方可開機,不存在“默認同意”,用戶不同意則不開機;
三是用途限定,絕不共享第三方,機器人只認一個主人,發現可疑指令立即鎖定。
新一代機器人所搭載的WALL-B模型采用基于世界統一模型(WUM)架構,將視覺、語言、聽覺、動作放在同一個網絡中從零開始聯合訓練,實現“多模態進、多模態出”。
如此設計的初衷是為了消除模塊間的傳輸損耗,讓模型原生具備感知重力、摩擦力等物理世界的“世界觀”,并在真實的失敗交互中實現自我迭代。
從進入家庭采集數據到數據反哺模型,這個商業邏輯閉環在理論上已經打通。
但客觀來看,自變量機器人目前展現出的能力距離真正的“家庭服務”仍有落差。據全天候科技現場觀察,該機器人的動作非常緩慢,例如完成插3朵花的動作需要耗時兩分半鐘。
王潛坦言,當前模型仍處于“實習生”階段,會犯錯,需要遠程協助,有時可能把拖鞋放到廚房、擦桌子擦到一半停下來“思考”。但其能夠實現24小時不間斷工作,且每工作一天都會因新數據的產生而變得更“聰明”。
支撐這場漫長“實習期”的是資本推力。
自變量近期剛完成由小米戰投領投的近20億元的B輪融資,此前更是在融資中集齊了美團、阿里和字節。
在豪華股東陣容的加持下,自變量機器人能否跑通“數據飛輪”,正受到關注。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.