人形機器人競爭正在改變。從本體參數(shù)到Physical AI,特斯拉、Figure、1X代表了三條不同路線,也揭示了中美機器人競爭的新差距。
作者丨溫特斯
編輯丨鐘清遠
“中國機器人和美國機器人之間的差距,不是越來越小,反而越來越大了。”一位機器人本體廠商的產(chǎn)品負責人對「具身商業(yè)前哨」表示。
這句話聽起來有些刺耳,但并非沒有道理。
就在國內(nèi)還在討論融資、量產(chǎn)和價格時,特斯拉、Figure和1X已經(jīng)把問題推進到另一個層面:機器人的競爭正在走向“Physical AI”。
近期,我們梳理了特斯拉、Figure和1X在技術路線、核心部件、制造體系以及商業(yè)化落地上的信息。一個明顯變化是:海外頭部機器人公司正在弱化單純的本體參數(shù),更加強調(diào)AI大腦、世界模型、VLA模型、端側推理、真實數(shù)據(jù)閉環(huán),以及規(guī)模化制造能力。
![]()
這是一個明顯的信號,人形機器人不再只是一個會動的機器,而正在成為“AI進入物理世界的入口”。
01
特斯拉:打造人形機器人的基礎設施
特斯拉正在把自身能力,從電動車制造延伸到Physical AI平臺。其最大的優(yōu)勢,不是Optimus V3的本體,而是它背后那套已經(jīng)被自動駕駛驗證過的AI基礎設施,正在開始落地到機器人領域。
馬斯克最近在財報會上也提到,Optimus V3不愿意過早公開展示,因為競爭對手可能會逐幀分析并復制。特斯拉最新計劃在7月底或8月初啟動Optimus的量產(chǎn)。
![]()
今年4月,特斯拉下一代AI推理芯片AI5受到持續(xù)關注。按照特斯拉的長期規(guī)劃,這類AI芯片不只服務汽車,也會服務Optimus以及未來更大規(guī)模的AI計算需求。
行業(yè)人士分析:特斯拉做機器人,并不是只做一個機械本體,而是在圍繞“AI如何進入物理世界”搭建底層基礎設施。
“別人是在訓練機器人,特斯拉更像是在訓練Physical AI。”行業(yè)人士分析,特斯拉的優(yōu)勢包括數(shù)十億英里的FSD真實道路數(shù)據(jù)、長期積累的視覺感知和世界模型訓練經(jīng)驗、自研AI芯片和端側推理體系、超算和訓練基礎設施、軟件棧和制造體系協(xié)同能力。
在核心部件層面,雖然外界很難獲得Optimus V3的完整參數(shù),但從目前曝光的信息和官方的公開表述來看,至少有幾個方向值得關注。
第一,Optimus V3的整體身高仍在173cm左右,但體重有望進一步減輕20%,姿態(tài)和運動方式會更接近真人,總自由度預計超過50個。
第二,觸覺傳感、皮膚材料、零部件集成度和電池續(xù)航能力,都會繼續(xù)升級。這些變化是為了更方便量產(chǎn)、更穩(wěn)定工作。
第三,新一代靈巧手可能擁有22個自由度,更接近真人手掌比例,并具備力反饋和指尖觸覺傳感能力。
靈巧手也是特斯拉反復推遲Optimus展示和量產(chǎn)節(jié)奏的重要原因之一。行業(yè)人士表示,人形機器人最難的部分,往往不是讓它走起來,而是讓它穩(wěn)定、可靠、低成本地完成真實工作。
在商業(yè)落地上,特斯拉是為數(shù)不多同時造汽車和機器人的超級平臺,所以這也是馬斯克敢于提出要把Optimus的售價壓低在2萬美元的底氣之一。
據(jù)公開報道,弗里蒙特相關產(chǎn)線的遠期目標年產(chǎn)能可達100萬臺;德州超級工廠后續(xù)也被規(guī)劃為更大規(guī)模的機器人產(chǎn)線,長期目標年產(chǎn)能高達1000萬臺。
按照長期規(guī)劃,Optimus初期將重點滿足特斯拉內(nèi)部工廠需求,大幅替代人工完成重復性和危險性任務。摩根士丹利發(fā)布的一份報告指出,如果特斯拉用Optimus機器人替換其10%的員工,將節(jié)省高達25億美元的成本。
這也是為什么,馬斯克會把Optimus視為特斯拉未來最重要的增長曲線之一。特斯拉做Optimus是在搭建一套AI進入物理世界的基礎設施。
02
Figure:讓 AI Agent在真實世界落地
如果說特斯拉的優(yōu)勢來自自動駕駛、芯片和制造體系,那么Figure AI的特點,是它更像一家原生的Physical AI公司,而不是傳統(tǒng)機器人公司。
Figure的目標是交付一款真正通用的人形機器人:一種能夠執(zhí)行類人任務,并直接向人類學習的機器人。
它很少把傳播重點放在關節(jié)參數(shù)、扭矩、自由度、負載這些硬件指標上。Figure更愿意講 Helix、VLA 模型、多任務泛化、自然語言理解、推理能力,以及機器人如何完成連續(xù)任務。
美國科技媒體分析:Figure的野心是把 AI Agent落地到真實世界中。
![]()
據(jù)了解,Helix模型依賴超過100萬小時的模擬與實地數(shù)據(jù)訓練,試圖把視覺、語言和動作打通。人說一句話,機器人看見環(huán)境,理解任務,再把理解轉化為動作。
在技術路線層面,F(xiàn)igure堅信自研VLA模型以及神經(jīng)網(wǎng)絡端到端控制,可以讓機器人具備更強的sim-to-real泛化能力。
它采用的是“快慢腦”的雙系統(tǒng)架構。慢腦負責“思考”,理解自然語言指令和復雜場景語義;快腦負責“行動”,將慢腦的意圖轉化為毫秒級的精準動作,控制機器人完成全身運動和手部操作。
更重要的是,F(xiàn)igure還在嘗試機器人之間的協(xié)作能力。兩臺機器人可以通過觀察對方動作,實時推斷意圖并配合完成任務。多機器人協(xié)作開始進入Physical AI的訓練范疇。
在核心部件層面,F(xiàn)igure 03專門圍繞Helix、家庭場景以及規(guī)模化制造重新設計。它配備了重新設計的傳感套件和手部系統(tǒng),以更好地支持各類復雜任務。
Figure 03身高約173cm,整機約61kg,全身擁有35個自由度。外部采用織物材料和軟泡沫包裹,這一設計明顯更適合家庭環(huán)境。
在斷網(wǎng)或部分關節(jié)輕微損毀的情況下,F(xiàn)igure 03仍具備一定工作能力。整體續(xù)航約4到5小時,采用腳部無線感應充電方式。靈巧手加入攝像頭和觸覺傳感器,目標是進一步接近人類水平的靈巧操作能力。
在商業(yè)化層面。Figure官方披露,BotQ工廠已將Figure 03的生產(chǎn)效率從每天1臺提升到每小時1臺,未來四年累計生產(chǎn)目標為 10 萬臺。
同時,F(xiàn)igure沒有完全依賴外部制造商,而是將電機、電池、關節(jié)等關鍵部件納入內(nèi)部生產(chǎn),以便降低成本、控制質(zhì)量、加快迭代速度和提升效率。
對于Figure來說,每一臺出貨的機器人,也是一臺數(shù)據(jù)采集終端。機器人在不同家庭、不同商業(yè)場景中遇到的新任務,都可能成為下一版Helix的訓練素材。
通過先進感知、觸覺智能、家庭設計和大規(guī)模制造準備能力的結合,F(xiàn)igure正在構建一個能夠在家庭和商業(yè)環(huán)境中學習、適應并工作的機器人平臺。
03
1X:讓家庭成為Physical AI的訓練場
相比特斯拉和Figure AI,1X的路線更激進。NEO機器人不是先去工廠搬箱子,而是進入真實家庭,完成整理衣物、收拾廚房、整理沙發(fā)、遞送物品等任務。它更堅決地把家庭當成訓練 Physical AI的真實場景。
更加值得注意的是,1X可以被視為OpenAI在具身智能和人形機器人方向的重要外部押注之一。
![]()
在技術路線上,1X發(fā)布的1XWM,是一個基于互聯(lián)網(wǎng)視頻預訓練的生成式世界模型。它的核心不只是讓機器人識別物體,而是讓機器人形成對世界的理解,并在此基礎上持續(xù)學習與行動,以推動NEO的規(guī)模化部署。
這就是1X路線里最有意思的地方。它試圖讓機器人通過看視頻學會新動作。比如,你給它看一段疊衣服的視頻,它就有機會學習類似動作。之后,NEO還可以通過OTA更新獲得新能力。
如果遇到不會做的事,1X 的操作員可以遠程接管,手把手教它。等它學會之后,下次就有機會自己完成。這套機制的本質(zhì),是把家庭變成一個持續(xù)生成數(shù)據(jù)、持續(xù)訓練模型、持續(xù)迭代能力的真實環(huán)境。
在核心部件上,NEO身高約168cm,體重約30kg,采用柔性3D晶格外殼包裹全身。它的噪聲控制被設計得很低,續(xù)航約4小時,能夠識別人類手勢和表情。靈巧手擁有22個自由度,同樣采用腱驅動系統(tǒng)。它比其他機器人更輕,也更適合家庭環(huán)境。
再看商業(yè)落地。根據(jù)1X官方披露,海沃德工廠正在向年產(chǎn)1萬臺NEO爬坡。隨著自動化更新推進以及圣卡洛斯新工廠逐步投用,公司目標是在2027年底達到年產(chǎn)10萬臺。
NEO的價格方案包括2萬美元買斷,或者每月499美元訂閱。據(jù)媒體報道,1X首年1萬臺計劃產(chǎn)能在預售開啟后短時間內(nèi)售罄。
AI的智能來自多樣性,不是來自重復。這句話幾乎可以概括1X的路線。它不是先把機器人訓練到完美,再送進家庭;而是讓機器人進入真實家庭,用真實家庭環(huán)境反過來推動 AI 能力突破。
04
機器人競爭走向“誰更懂現(xiàn)實世界”
人形機器人的競爭,正在變成三件事:誰能把AI大腦和機器人身體真正打通?誰能獲得足夠多、足夠真實、足夠多樣的數(shù)據(jù)?誰能把機器人從 demo 推向可制造、可交付、可持續(xù)迭代的產(chǎn)品?
特斯拉、Figure、1X這三家公司路徑不同,但都指向同一個判斷:人形機器人未來的核心,是AI能不能通過這副身體理解現(xiàn)實世界、適應現(xiàn)實世界,并最終改變現(xiàn)實世界。
這也是中國機器人公司接下來必須面對的問題。中國機器人行業(yè)過去幾年跑得很快,供應鏈、成本、工程化和量產(chǎn)速度都有優(yōu)勢。
但如果競爭維度從“本體能力”升級到“Physical AI”,雙方的差距就會體現(xiàn)在模型、數(shù)據(jù)、芯片、算力、軟件棧和真實場景閉環(huán)等層面。
如果沒有這一層能力,量產(chǎn)越快,可能越像是在更快地把自己推向硬件代工的位置。
THE END
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.