網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

美國機器人三巨頭特斯拉、Figure、1X，正在把競爭帶向“Physical AI”

2026-05-14 11:32:46　來源: 具身商業(yè)前哨

北京舉報

分享至

人形機器人競爭正在改變。從本體參數(shù)到Physical AI，特斯拉、Figure、1X代表了三條不同路線，也揭示了中美機器人競爭的新差距。

作者丨溫特斯

編輯丨鐘清遠

“中國機器人和美國機器人之間的差距，不是越來越小，反而越來越大了。”一位機器人本體廠商的產(chǎn)品負責人對「具身商業(yè)前哨」表示。

這句話聽起來有些刺耳，但并非沒有道理。

就在國內(nèi)還在討論融資、量產(chǎn)和價格時，特斯拉、Figure和1X已經(jīng)把問題推進到另一個層面：機器人的競爭正在走向“Physical AI”。

近期，我們梳理了特斯拉、Figure和1X在技術路線、核心部件、制造體系以及商業(yè)化落地上的信息。一個明顯變化是：海外頭部機器人公司正在弱化單純的本體參數(shù)，更加強調(diào)AI大腦、世界模型、VLA模型、端側推理、真實數(shù)據(jù)閉環(huán)，以及規(guī)模化制造能力。

這是一個明顯的信號，人形機器人不再只是一個會動的機器，而正在成為“AI進入物理世界的入口”。

特斯拉：打造人形機器人的基礎設施

特斯拉正在把自身能力，從電動車制造延伸到Physical AI平臺。其最大的優(yōu)勢，不是Optimus V3的本體，而是它背后那套已經(jīng)被自動駕駛驗證過的AI基礎設施，正在開始落地到機器人領域。

馬斯克最近在財報會上也提到，Optimus V3不愿意過早公開展示，因為競爭對手可能會逐幀分析并復制。特斯拉最新計劃在7月底或8月初啟動Optimus的量產(chǎn)。

今年4月，特斯拉下一代AI推理芯片AI5受到持續(xù)關注。按照特斯拉的長期規(guī)劃，這類AI芯片不只服務汽車，也會服務Optimus以及未來更大規(guī)模的AI計算需求。

行業(yè)人士分析：特斯拉做機器人，并不是只做一個機械本體，而是在圍繞“AI如何進入物理世界”搭建底層基礎設施。

“別人是在訓練機器人，特斯拉更像是在訓練Physical AI。”行業(yè)人士分析，特斯拉的優(yōu)勢包括數(shù)十億英里的FSD真實道路數(shù)據(jù)、長期積累的視覺感知和世界模型訓練經(jīng)驗、自研AI芯片和端側推理體系、超算和訓練基礎設施、軟件棧和制造體系協(xié)同能力。

在核心部件層面，雖然外界很難獲得Optimus V3的完整參數(shù)，但從目前曝光的信息和官方的公開表述來看，至少有幾個方向值得關注。

第一，Optimus V3的整體身高仍在173cm左右，但體重有望進一步減輕20%，姿態(tài)和運動方式會更接近真人，總自由度預計超過50個。

第二，觸覺傳感、皮膚材料、零部件集成度和電池續(xù)航能力，都會繼續(xù)升級。這些變化是為了更方便量產(chǎn)、更穩(wěn)定工作。

第三，新一代靈巧手可能擁有22個自由度，更接近真人手掌比例，并具備力反饋和指尖觸覺傳感能力。

靈巧手也是特斯拉反復推遲Optimus展示和量產(chǎn)節(jié)奏的重要原因之一。行業(yè)人士表示，人形機器人最難的部分，往往不是讓它走起來，而是讓它穩(wěn)定、可靠、低成本地完成真實工作。

在商業(yè)落地上，特斯拉是為數(shù)不多同時造汽車和機器人的超級平臺，所以這也是馬斯克敢于提出要把Optimus的售價壓低在2萬美元的底氣之一。

據(jù)公開報道，弗里蒙特相關產(chǎn)線的遠期目標年產(chǎn)能可達100萬臺；德州超級工廠后續(xù)也被規(guī)劃為更大規(guī)模的機器人產(chǎn)線，長期目標年產(chǎn)能高達1000萬臺。

按照長期規(guī)劃，Optimus初期將重點滿足特斯拉內(nèi)部工廠需求，大幅替代人工完成重復性和危險性任務。摩根士丹利發(fā)布的一份報告指出，如果特斯拉用Optimus機器人替換其10%的員工，將節(jié)省高達25億美元的成本。

這也是為什么，馬斯克會把Optimus視為特斯拉未來最重要的增長曲線之一。特斯拉做Optimus是在搭建一套AI進入物理世界的基礎設施。

Figure：讓 AI Agent在真實世界落地

如果說特斯拉的優(yōu)勢來自自動駕駛、芯片和制造體系，那么Figure AI的特點，是它更像一家原生的Physical AI公司，而不是傳統(tǒng)機器人公司。

Figure的目標是交付一款真正通用的人形機器人：一種能夠執(zhí)行類人任務，并直接向人類學習的機器人。

它很少把傳播重點放在關節(jié)參數(shù)、扭矩、自由度、負載這些硬件指標上。Figure更愿意講 Helix、VLA 模型、多任務泛化、自然語言理解、推理能力，以及機器人如何完成連續(xù)任務。

美國科技媒體分析：Figure的野心是把 AI Agent落地到真實世界中。

據(jù)了解，Helix模型依賴超過100萬小時的模擬與實地數(shù)據(jù)訓練，試圖把視覺、語言和動作打通。人說一句話，機器人看見環(huán)境，理解任務，再把理解轉化為動作。

在技術路線層面，F(xiàn)igure堅信自研VLA模型以及神經(jīng)網(wǎng)絡端到端控制，可以讓機器人具備更強的sim-to-real泛化能力。

它采用的是“快慢腦”的雙系統(tǒng)架構。慢腦負責“思考”，理解自然語言指令和復雜場景語義；快腦負責“行動”，將慢腦的意圖轉化為毫秒級的精準動作，控制機器人完成全身運動和手部操作。

更重要的是，F(xiàn)igure還在嘗試機器人之間的協(xié)作能力。兩臺機器人可以通過觀察對方動作，實時推斷意圖并配合完成任務。多機器人協(xié)作開始進入Physical AI的訓練范疇。

在核心部件層面，F(xiàn)igure 03專門圍繞Helix、家庭場景以及規(guī)模化制造重新設計。它配備了重新設計的傳感套件和手部系統(tǒng)，以更好地支持各類復雜任務。

Figure 03身高約173cm，整機約61kg，全身擁有35個自由度。外部采用織物材料和軟泡沫包裹，這一設計明顯更適合家庭環(huán)境。

在斷網(wǎng)或部分關節(jié)輕微損毀的情況下，F(xiàn)igure 03仍具備一定工作能力。整體續(xù)航約4到5小時，采用腳部無線感應充電方式。靈巧手加入攝像頭和觸覺傳感器，目標是進一步接近人類水平的靈巧操作能力。

在商業(yè)化層面。Figure官方披露，BotQ工廠已將Figure 03的生產(chǎn)效率從每天1臺提升到每小時1臺，未來四年累計生產(chǎn)目標為 10 萬臺。

同時，F(xiàn)igure沒有完全依賴外部制造商，而是將電機、電池、關節(jié)等關鍵部件納入內(nèi)部生產(chǎn)，以便降低成本、控制質(zhì)量、加快迭代速度和提升效率。

對于Figure來說，每一臺出貨的機器人，也是一臺數(shù)據(jù)采集終端。機器人在不同家庭、不同商業(yè)場景中遇到的新任務，都可能成為下一版Helix的訓練素材。

通過先進感知、觸覺智能、家庭設計和大規(guī)模制造準備能力的結合，F(xiàn)igure正在構建一個能夠在家庭和商業(yè)環(huán)境中學習、適應并工作的機器人平臺。

1X：讓家庭成為Physical AI的訓練場

相比特斯拉和Figure AI，1X的路線更激進。NEO機器人不是先去工廠搬箱子，而是進入真實家庭，完成整理衣物、收拾廚房、整理沙發(fā)、遞送物品等任務。它更堅決地把家庭當成訓練 Physical AI的真實場景。

更加值得注意的是，1X可以被視為OpenAI在具身智能和人形機器人方向的重要外部押注之一。

在技術路線上，1X發(fā)布的1XWM，是一個基于互聯(lián)網(wǎng)視頻預訓練的生成式世界模型。它的核心不只是讓機器人識別物體，而是讓機器人形成對世界的理解，并在此基礎上持續(xù)學習與行動，以推動NEO的規(guī)模化部署。

這就是1X路線里最有意思的地方。它試圖讓機器人通過看視頻學會新動作。比如，你給它看一段疊衣服的視頻，它就有機會學習類似動作。之后，NEO還可以通過OTA更新獲得新能力。

如果遇到不會做的事，1X 的操作員可以遠程接管，手把手教它。等它學會之后，下次就有機會自己完成。這套機制的本質(zhì)，是把家庭變成一個持續(xù)生成數(shù)據(jù)、持續(xù)訓練模型、持續(xù)迭代能力的真實環(huán)境。

在核心部件上，NEO身高約168cm，體重約30kg，采用柔性3D晶格外殼包裹全身。它的噪聲控制被設計得很低，續(xù)航約4小時，能夠識別人類手勢和表情。靈巧手擁有22個自由度，同樣采用腱驅動系統(tǒng)。它比其他機器人更輕，也更適合家庭環(huán)境。

再看商業(yè)落地。根據(jù)1X官方披露，海沃德工廠正在向年產(chǎn)1萬臺NEO爬坡。隨著自動化更新推進以及圣卡洛斯新工廠逐步投用，公司目標是在2027年底達到年產(chǎn)10萬臺。

NEO的價格方案包括2萬美元買斷，或者每月499美元訂閱。據(jù)媒體報道，1X首年1萬臺計劃產(chǎn)能在預售開啟后短時間內(nèi)售罄。

AI的智能來自多樣性，不是來自重復。這句話幾乎可以概括1X的路線。它不是先把機器人訓練到完美，再送進家庭；而是讓機器人進入真實家庭，用真實家庭環(huán)境反過來推動 AI 能力突破。

機器人競爭走向“誰更懂現(xiàn)實世界”

人形機器人的競爭，正在變成三件事：誰能把AI大腦和機器人身體真正打通？誰能獲得足夠多、足夠真實、足夠多樣的數(shù)據(jù)？誰能把機器人從 demo 推向可制造、可交付、可持續(xù)迭代的產(chǎn)品？

特斯拉、Figure、1X這三家公司路徑不同，但都指向同一個判斷：人形機器人未來的核心，是AI能不能通過這副身體理解現(xiàn)實世界、適應現(xiàn)實世界，并最終改變現(xiàn)實世界。

這也是中國機器人公司接下來必須面對的問題。中國機器人行業(yè)過去幾年跑得很快，供應鏈、成本、工程化和量產(chǎn)速度都有優(yōu)勢。

但如果競爭維度從“本體能力”升級到“Physical AI”，雙方的差距就會體現(xiàn)在模型、數(shù)據(jù)、芯片、算力、軟件棧和真實場景閉環(huán)等層面。

如果沒有這一層能力，量產(chǎn)越快，可能越像是在更快地把自己推向硬件代工的位置。

THE END

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.