近日,特斯拉CEO埃隆·馬斯克在社交平臺X上分享了一段人形機器人Optimus學習中國功夫的視頻,引發(fā)廣泛關注。視頻中,這臺人形機器人并非簡單照搬教練的動作,而是能夠精準識別每一招式的意圖,做出自衛(wèi)與反擊動作,展現(xiàn)出環(huán)境感知和實時反應能力。馬斯克還特意澄清,這并不是人工遙控表演,而是由AI自主驅(qū)動的結果。
這樣流暢的武術動作表明,Optimus并非按照預先腳本表演,而是真正做到了一定程度的見招拆招。這背后究竟隱藏著怎樣的技術呢?
讓一個雙足人形機器人完成揮拳、弓步、轉身等高難度動作,并在對抗中保持平衡,這遠非簡單的程序控制所能實現(xiàn)。傳統(tǒng)工業(yè)機器人執(zhí)行固定軌跡尚且容易,但像功夫這樣動態(tài)多變的動作,需要機器人具備接近人類的環(huán)境理解、協(xié)調(diào)控制和學習能力。Optimus此次功夫演示提出了兩個關鍵問題:視覺感知與平衡控制、AI模仿學習與強化訓練
視覺感知與平衡控制:機器人如何通過視覺看懂周圍環(huán)境和對手動作,并實時調(diào)整自己的運動路徑與重心,保證動作協(xié)調(diào)且不失衡?
AI模仿學習與強化訓練:機器人的大腦如何利用大量視頻和示范數(shù)據(jù)學會這些復雜招式?在模仿人類動作的過程中,如何通過強化學習來進一步優(yōu)化動作?
特斯拉近來公開的兩項關鍵技術專利正對應了解決上述問題的思路:WO2024073088A1提出了“視覺路徑建模與平衡控制系統(tǒng)”,而US20240185445A1則涉及“模仿學習結合強化訓練的AI建模技術”。
要讓機器人像人一樣靈活地動起來,首先要解決看和站穩(wěn)這兩個基本問題。WO2024073088A1專利聚焦于基于視覺的路徑建模和平衡控制,為機器人提供了類似人類的環(huán)境感知和動態(tài)平衡能力。
Maxipat解讀
特斯拉為Optimus配備了多攝像頭視覺系統(tǒng),機器人通過攝像頭獲取周圍空間的圖像數(shù)據(jù),并借助專利中的AI模型將這些圖像即時轉換成立體的三維環(huán)境模型。這種模型被稱為“占用網(wǎng)絡”,它將空間劃分為無數(shù)體素,預測每個體素是空曠還是被物體占據(jù)。換句話說,Optimus獲得了類似3D透視圖的視覺能力,可在純視覺條件下感知周圍地形、障礙物和動態(tài)物體的位置。即使在室內(nèi)沒有GPS的場景下,機器人也能基于視覺特征來定位自身位置,理解所處環(huán)境的布局。例如,當對手出拳或移動時,Optimus的攝像頭捕捉這一動態(tài),并在其內(nèi)部3D模型中映射出對手肢體的運動軌跡,為下一步反應做好準備。
在感知環(huán)境的基礎上,該專利還提出了視覺驅(qū)動的路徑規(guī)劃算法。Optimus的大腦會將目標動作分解為可執(zhí)行的運動路徑,包括行進軌跡、轉身角度、步伐速度等參數(shù)。特斯拉采用了迭代線性二次調(diào)節(jié)器等優(yōu)化控制算法來生成這些運動軌跡。這種算法相當于給機器人規(guī)劃一條在物理和動力學約束下“最平穩(wěn)、最穩(wěn)定”的路徑:既能實現(xiàn)目標動作,又避免關節(jié)過載或重心偏移太多。例如,當Optimus準備側身轉移躲避攻擊時,ILQR會幫助計算一個平滑的轉身軌跡和速度,使動作連貫且不失衡。
雙足機器人的一大難點在于平衡。WO2024073088A1專利特別強調(diào)了通過多傳感器融合來監(jiān)控和調(diào)整機器人姿態(tài)。Optimus機身內(nèi)置了慣性測量單元(IMU)、力矩傳感器等,用于感知身體的傾斜、加速度以及各關節(jié)受力情況。專利設計了一個實時姿態(tài)分析與反饋系統(tǒng):當檢測到機器人重心偏離安全范圍,或外力干擾時,控制器會迅速計算出補償動作,通過驅(qū)動器調(diào)整各關節(jié)姿勢,把重心拉回穩(wěn)定區(qū)域。這就好比人站立時腳踝和膝蓋在不斷微調(diào),保持身體不摔倒。
有了硬件上的眼睛和平衡感,機器人還需要大腦來學會如何打功夫。US20240185445A1專利關注的正是如何利用模仿學習和強化學習相結合,讓人工智能快速掌握人類的高難度動作技巧。這種模仿學習過程類似于人類徒弟跟隨師父練功,AI通過神經(jīng)網(wǎng)絡觀看人類的視頻示范,不斷調(diào)整自身策略來逼近人類動作。例如,Optimus看了教練如何出拳、站馬步,便在模擬環(huán)境中嘗試復現(xiàn)這些動作軌跡。多視角的視頻數(shù)據(jù)提供了豐富的信息,使AI能捕捉每個動作的關鍵肢體運動模式和節(jié)奏。正因如此,Optimus才能看懂教練的出拳與步伐,并初步學會相應的動作組合。特斯拉Optimus項目負責人曾透露,他們“用視頻示范來擴展機器人靈巧度”,讓機器人從中學習人類的靈活技巧。
Maxipat解讀
然而,僅靠模仿,人形機器人往往只能做到形似,未必神似。畢竟,人類動作搬到機器人身上,需要考慮不同的重心、關節(jié)極限等物理因素。為此,特斯拉讓Optimus的AI進入了強化學習的特訓階段。在模擬仿真的虛擬環(huán)境中,成千上萬個Optimus機器人可以高速并行反復練習武術動作。AI在這個過程中以獎賞機制不斷自我改進:比如成功完成一個動作且站穩(wěn)不倒就給予獎勵,失去平衡或動作偏差則受到懲罰。在不斷的試錯中,AI逐漸學會調(diào)整細節(jié)動作來獲得更高的累積獎勵,這意味著動作變得更穩(wěn)、更快、更高效。
將模仿學習與強化學習相結合,可以說讓Optimus的AI既有師傅帶,又有自身練,兩條腿走路。模仿學習提供了一個良好的起點,讓AI快速掌握動作的基本輪廓;隨后強化學習在模擬試煉中對這些動作精雕細琢,突破物理限制并增強穩(wěn)健性。
可見,這套模仿結合強化的AI訓練框架已經(jīng)成為特斯拉人形機器人項目的核心策略,使機器人能不斷自我進化,掌握越來越復雜的技能。
傳統(tǒng)機器人如果按預設腳本,只會機械地重復固定動作。而Optimus在視頻中的表現(xiàn)更像一個有思考的武者:它并非死板地復制教練動作,而是能夠隨機應變、以招破招。例如,當教練直拳來襲時,Optimus選擇格擋;而一旦對手露出破綻,機器人又能立即切換到進攻動作,揮拳反擊。這種連貫的招式切換,源自其AI決策網(wǎng)絡對不同動作策略的靈活組合。
可以預見的是,隨著視覺建模更精準、強化學習更高效,機器人將不僅會武術表演,更能勝任各種實用任務。
未來,這些具備高度靈活性和自主學習能力的機器人,有望走進制造業(yè)車間搬運裝配,進入倉儲物流中心挑揀貨物,甚至在醫(yī)療護理、家庭助理等領域大顯身手。
Maxipat致力于作為成為科技創(chuàng)新和知識產(chǎn)權工作的AI加速器,主要包括輔助創(chuàng)新:提高研發(fā)的科技創(chuàng)新效率;智能搜索與分析:將專利搜索和報告制作借助AI實現(xiàn)智能化,包括智能查新、無效、FTO、Landscaping報告;投資助手:快速生成投資賽道報告、專利購買篩選、專利轉化評估。目前開放注冊中。輔助科技創(chuàng)新和知識產(chǎn)權工作的AI智能體
感興趣的朋友可以通過以下三種方式填寫申請信息:
1. 請發(fā)郵件到郵箱:info@maxipat.com
2. 點擊文末閱讀全文;
3. 掃描以下二維碼
感興趣的朋友可以加筆者微信patentlight
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.