兄弟們,這個數字我反復看了三遍:8040萬參數,2萬小時人類動作數據,20億幀訓練。這不是新游戲引擎的參數,這是今天剛發布的一個機器人“小腦”模型。
銀河通用機器人剛剛把AstraBrain-WBC 0.5掛了出來。說它是“小腦”不是比喻——這玩意兒確實只干一件事:讓機器人全身協調地動起來。但跟此前所有同類方案最大的區別在于,它走到GPT-1這個量級了,而且開源的。
![]()
咱先別急著“科幻照進現實”,我把技術細節拆開說一下。
這次AstraBrain-WBC 0.5最核心的變動是架構思路。團隊選了因果Transformer這套東西,把機器人全身實時運控重新定義成一個“連續序列預測”問題。翻譯一下就是:他們不準備一筆一劃地告訴機器人“手抬多少度、膝蓋彎多少度”,而是讓模型像預測下一個token一樣,去預測下一幀全身關節該處于什么狀態。官方管這個叫“首個GPT-1量級的人形機器人全身實時運控大模型”,原文也是這么標的。
訓練數據這邊更夸張。他們攢了2萬小時的人類動作數據,號稱是目前行業最大規模的人形機器人運動語料庫。然后實驗組搞了個對照:當訓練數據從200萬幀推到20億幀的時候,被測模型的零樣本追蹤成功率從83.26%直接拉到92.58%。這可不是微調上去的那種緩慢爬坡,是加了兩個數量級之后硬跳上去的。
什么叫零樣本?就是這些復雜動作壓根沒在訓練集里出現過,模型純靠泛化能力自己“悟”出來的。AstraBrain-WBC 0.5在這塊交出來的作業清單包括籃球、拳擊、舞蹈、翻身起立、協作搬運。我特別想看看那個“翻身起立”的執行效果——一個機器人仰面朝天然后自己翻起來站好,這畫面放三年前我肯定以為是動畫師的功勞。
當然,咱也得說一句:這些目前都是研究階段的成果展示。論文放出來了,代碼放出來了,技術成果也已經全面向生態開放。說白了,這是給整個行業鋪了一條路,誰想在機器人全身運控上做點東西,現在有個現成的基座可以調。
我的直觀感受是,8040萬參數放到大語言模型里只能算迷你版,但放在機器人運動控制這個賽道上,確實是把天花板捅了一個窟窿。之前大家還在幾百小時數據量級上互相較勁,銀河通用直接干到了“萬小時俱樂部”。
最后補一句:別問我這東西能不能量產、什么時候能買到。咱現在聊的是基座模型剛發布,離你家里能跑能跳還會打籃球的人形機器人,中間還隔著工程化、成本、安全驗證這些鴻溝。但至少,小腦這部分,今天有人給出了一個GPT思路的版本號。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.