文 | 具身商業前哨
“中國機器人和美國機器人之間的差距,不是越來越小,反而越來越大了。”一位機器人本體廠商的產品負責人對「具身商業前哨」表示。
這句話聽起來有些刺耳,但并非沒有道理。
就在國內還在討論融資、量產和價格時,特斯拉、Figure和1X已經把問題推進到另一個層面:機器人的競爭正在走向“Physical AI”。
近期,我們梳理了特斯拉、Figure和1X在技術路線、核心部件、制造體系以及商業化落地上的信息。一個明顯變化是:海外頭部機器人公司正在弱化單純的本體參數,更加強調AI大腦、世界模型、VLA模型、端側推理、真實數據閉環,以及規模化制造能力。
![]()
這是一個明顯的信號,人形機器人不再只是一個會動的機器,而正在成為“AI進入物理世界的入口”。
特斯拉:打造人形機器人的基礎設施
特斯拉正在把自身能力,從電動車制造延伸到Physical AI平臺。其最大的優勢,不是Optimus V3的本體,而是它背后那套已經被自動駕駛驗證過的AI基礎設施,正在開始落地到機器人領域。
馬斯克最近在財報會上也提到,Optimus V3不愿意過早公開展示,因為競爭對手可能會逐幀分析并復制。特斯拉最新計劃在7月底或8月初啟動Optimus的量產。
![]()
今年4月,特斯拉下一代AI推理芯片AI5受到持續關注。按照特斯拉的長期規劃,這類AI芯片不只服務汽車,也會服務Optimus以及未來更大規模的AI計算需求。
行業人士分析:特斯拉做機器人,并不是只做一個機械本體,而是在圍繞“AI如何進入物理世界”搭建底層基礎設施。
“別人是在訓練機器人,特斯拉更像是在訓練Physical AI。”行業人士分析,特斯拉的優勢包括數十億英里的FSD真實道路數據、長期積累的視覺感知和世界模型訓練經驗、自研AI芯片和端側推理體系、超算和訓練基礎設施、軟件棧和制造體系協同能力。
在核心部件層面,雖然外界很難獲得Optimus V3的完整參數,但從目前曝光的信息和官方的公開表述來看,至少有幾個方向值得關注。
第一,Optimus V3的整體身高仍在173cm左右,但體重有望進一步減輕20%,姿態和運動方式會更接近真人,總自由度預計超過50個。
第二,觸覺傳感、皮膚材料、零部件集成度和電池續航能力,都會繼續升級。這些變化是為了更方便量產、更穩定工作。
第三,新一代靈巧手可能擁有22個自由度,更接近真人手掌比例,并具備力反饋和指尖觸覺傳感能力。
靈巧手也是特斯拉反復推遲Optimus展示和量產節奏的重要原因之一。行業人士表示,人形機器人最難的部分,往往不是讓它走起來,而是讓它穩定、可靠、低成本地完成真實工作。
在商業落地上,特斯拉是為數不多同時造汽車和機器人的超級平臺,所以這也是馬斯克敢于提出要把Optimus的售價壓低在2萬美元的底氣之一。
據公開報道,弗里蒙特相關產線的遠期目標年產能可達100萬臺;德州超級工廠后續也被規劃為更大規模的機器人產線,長期目標年產能高達1000萬臺。
按照長期規劃,Optimus初期將重點滿足特斯拉內部工廠需求,大幅替代人工完成重復性和危險性任務。摩根士丹利發布的一份報告指出,如果特斯拉用Optimus機器人替換其10%的員工,將節省高達25億美元的成本。
這也是為什么,馬斯克會把Optimus視為特斯拉未來最重要的增長曲線之一。特斯拉做Optimus是在搭建一套AI進入物理世界的基礎設施。
Figure:讓 AI Agent在真實世界落地
如果說特斯拉的優勢來自自動駕駛、芯片和制造體系,那么Figure AI的特點,是它更像一家原生的Physical AI公司,而不是傳統機器人公司。
Figure的目標是交付一款真正通用的人形機器人:一種能夠執行類人任務,并直接向人類學習的機器人。
它很少把傳播重點放在關節參數、扭矩、自由度、負載這些硬件指標上。Figure更愿意講 Helix、VLA 模型、多任務泛化、自然語言理解、推理能力,以及機器人如何完成連續任務。
美國科技媒體分析:Figure的野心是把 AI Agent落地到真實世界中。
![]()
據了解,Helix模型依賴超過100萬小時的模擬與實地數據訓練,試圖把視覺、語言和動作打通。人說一句話,機器人看見環境,理解任務,再把理解轉化為動作。
在技術路線層面,Figure堅信自研VLA模型以及神經網絡端到端控制,可以讓機器人具備更強的sim-to-real泛化能力。
它采用的是“快慢腦”的雙系統架構。慢腦負責“思考”,理解自然語言指令和復雜場景語義;快腦負責“行動”,將慢腦的意圖轉化為毫秒級的精準動作,控制機器人完成全身運動和手部操作。
更重要的是,Figure還在嘗試機器人之間的協作能力。兩臺機器人可以通過觀察對方動作,實時推斷意圖并配合完成任務。多機器人協作開始進入Physical AI的訓練范疇。
在核心部件層面,Figure 03專門圍繞Helix、家庭場景以及規模化制造重新設計。它配備了重新設計的傳感套件和手部系統,以更好地支持各類復雜任務。
Figure 03身高約173cm,整機約61kg,全身擁有35個自由度。外部采用織物材料和軟泡沫包裹,這一設計明顯更適合家庭環境。
在斷網或部分關節輕微損毀的情況下,Figure 03仍具備一定工作能力。整體續航約4到5小時,采用腳部無線感應充電方式。靈巧手加入攝像頭和觸覺傳感器,目標是進一步接近人類水平的靈巧操作能力。
在商業化層面。Figure官方披露,BotQ工廠已將Figure 03的生產效率從每天1臺提升到每小時1臺,未來四年累計生產目標為 10 萬臺。
同時,Figure沒有完全依賴外部制造商,而是將電機、電池、關節等關鍵部件納入內部生產,以便降低成本、控制質量、加快迭代速度和提升效率。
對于Figure來說,每一臺出貨的機器人,也是一臺數據采集終端。機器人在不同家庭、不同商業場景中遇到的新任務,都可能成為下一版Helix的訓練素材。
通過先進感知、觸覺智能、家庭設計和大規模制造準備能力的結合,Figure正在構建一個能夠在家庭和商業環境中學習、適應并工作的機器人平臺。
1X:讓家庭成為Physical AI的訓練場
相比特斯拉和Figure AI,1X的路線更激進。NEO機器人不是先去工廠搬箱子,而是進入真實家庭,完成整理衣物、收拾廚房、整理沙發、遞送物品等任務。它更堅決地把家庭當成訓練 Physical AI的真實場景。
更加值得注意的是,1X可以被視為OpenAI在具身智能和人形機器人方向的重要外部押注之一。
在技術路線上,1X發布的1XWM,是一個基于互聯網視頻預訓練的生成式世界模型。它的核心不只是讓機器人識別物體,而是讓機器人形成對世界的理解,并在此基礎上持續學習與行動,以推動NEO的規模化部署。
這就是1X路線里最有意思的地方。它試圖讓機器人通過看視頻學會新動作。比如,你給它看一段疊衣服的視頻,它就有機會學習類似動作。之后,NEO還可以通過OTA更新獲得新能力。
如果遇到不會做的事,1X 的操作員可以遠程接管,手把手教它。等它學會之后,下次就有機會自己完成。這套機制的本質,是把家庭變成一個持續生成數據、持續訓練模型、持續迭代能力的真實環境。
在核心部件上,NEO身高約168cm,體重約30kg,采用柔性3D晶格外殼包裹全身。它的噪聲控制被設計得很低,續航約4小時,能夠識別人類手勢和表情。靈巧手擁有22個自由度,同樣采用腱驅動系統。它比其他機器人更輕,也更適合家庭環境。
再看商業落地。根據1X官方披露,海沃德工廠正在向年產1萬臺NEO爬坡。隨著自動化更新推進以及圣卡洛斯新工廠逐步投用,公司目標是在2027年底達到年產10萬臺。
NEO的價格方案包括2萬美元買斷,或者每月499美元訂閱。據媒體報道,1X首年1萬臺計劃產能在預售開啟后短時間內售罄。
AI的智能來自多樣性,不是來自重復。這句話幾乎可以概括1X的路線。它不是先把機器人訓練到完美,再送進家庭;而是讓機器人進入真實家庭,用真實家庭環境反過來推動 AI 能力突破。
機器人競爭走向“誰更懂現實世界”
人形機器人的競爭,正在變成三件事:誰能把AI大腦和機器人身體真正打通?誰能獲得足夠多、足夠真實、足夠多樣的數據?誰能把機器人從 demo 推向可制造、可交付、可持續迭代的產品?
特斯拉、Figure、1X這三家公司路徑不同,但都指向同一個判斷:人形機器人未來的核心,是AI能不能通過這副身體理解現實世界、適應現實世界,并最終改變現實世界。
這也是中國機器人公司接下來必須面對的問題。中國機器人行業過去幾年跑得很快,供應鏈、成本、工程化和量產速度都有優勢。
但如果競爭維度從“本體能力”升級到“Physical AI”,雙方的差距就會體現在模型、數據、芯片、算力、軟件棧和真實場景閉環等層面。
如果沒有這一層能力,量產越快,可能越像是在更快地把自己推向硬件代工的位置。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.