網易首頁 > 網易號 > 正文申請入駐

機器狗翻了個身，國產GPU往前走了堅實一步｜甲子光年

2026-05-20 14:24:07　來源: 甲子光年

北京舉報

分享至

具身智能讓GPU重新回到它最完整的形態：既要算AI，也要算圖形，還要算物理。

作者｜王博

5月18日晚，一臺名為“小飛”的機器狗走上了摩爾線程年度產品發布會的舞臺，表演了一個側空翻。

機器狗表演側空翻，今天已經不算一件稀奇事。但這一次，“小飛”的側空翻有一個特殊之處：這是業內首次在基于國產硬件的仿真平臺中實現模型訓練，并在國產端側芯片上部署，最終實現Sim-to-Real（仿真到現實）真機驗證。

換句話說，這不只是一次機器狗動作展示，而是一次國產具身智能基礎設施的閉環驗證：從云端訓練，到仿真驗證，再到端側部署，一條原本高度依賴海外軟硬件生態的鏈路，開始在國產平臺上跑通。

對國內具身智能行業來說，這比一次漂亮的動作演示更重要。

表面上看，摩爾線程在這場主題為“詞元時代，萬物智能”的年度產品發布會上，展示的是一套“云-邊-端”全棧智算矩陣：從萬卡級夸娥（KUAE）智算集群，到自研“長江”SoC驅動的智能終端MTT AICUBE、MTT AIBOOK，再到首個全棧具身智能仿真平臺MT Lambda，以及持續進化的MUSA生態。

摩爾線程創始人、董事長兼CEO 張建中

但放到具身智能產業里看，「甲子光年」看到的是，摩爾線程這樣一家采用全功能GPU路線的國產芯片公司，正在試圖把AI計算、圖形渲染、物理仿真和端側部署連接起來，打造機器人進入真實世界之前的國產基礎設施。

他們想證明的一件事：國產算力平臺可以進入具身智能的核心訓練與部署環節。

1.完全形態的“全功能GPU”，才能勝任具身智能

要理解摩爾線程為什么要講具身智能，先要理解它為什么反復強調“全功能GPU”。

全功能GPU（Universal GPU），是指基于統一系統架構，同時具備功能完備性與精度完整性的GPU。它并不只是AI加速器，而是同時覆蓋AI計算、通用計算和圖形渲染等能力的通用算力平臺。全功能GPU在工作效率、生態完整多樣性以及兼容性等方面更具有優勢，能夠更好地適應未來新興及前沿計算加速應用場景的需求。

它和TPU、NPU的本質區別是通用性與專用性。打個比方，TPU、NPU更像“專才”，通常圍繞AI計算、深度學習推理或特定模型任務做定制優化，在目標場景下可以獲得更高能效和性價比，但能力邊界相對明確；全功能GPU更像“通才”，優勢在于能在同一架構內同時承載AI、圖形、物理和視頻等多類計算任務。

在AI大模型時代，GPU最容易被理解為訓練和推理芯片，評價標準也集中在矩陣計算、訓練吞吐、推理效率、顯存容量和互聯能力上。但具身智能處理的不僅是單純的文本和圖像，而是一個多模態的物理世界，這就對芯片提出了更高的要求。

一個機器人要學會行動，至少需要三類核心能力。

第一，是AI計算能力。具身智能需要訓練VLA模型、世界模型、強化學習策略、模仿學習模型，以及面向復雜任務的具身大模型。

第二，是圖形渲染能力。機器人需要在足夠真實的虛擬環境中訓練和評測，仿真環境的光照、材質、遮擋、紋理和幾何細節，會直接影響感知模型的效果。

第三，是物理仿真能力。機器人不只“看”世界，還要和世界發生接觸。抓取、跳躍、行走、碰撞、摩擦、柔性物體變形，這些都需要大量物理計算支撐。

這也是全功能GPU路線在具身智能時代獲得新解釋的地方。

摩爾線程是國內為數不多堅持全功能GPU路線的公司。摩爾線程基于自研MUSA架構的全功能GPU，可以在單顆芯片上同時支持AI計算、圖形渲染、物理仿真、科學計算和超高清視頻編解碼，為具身智能提供“渲染+仿真+AI訓推”一體化的通用算力底座。

這可以解決具身智能研發中的一個問題——“割裂感”。

對比傳統架構來看，物理仿真可能運行在專門的物理引擎上，圖形渲染依賴圖形顯卡，AI訓練依賴AI加速芯片。開發者需要在不同平臺之間反復遷移數據、轉換格式、適配框架。這種割裂不僅拖慢研發效率，也會進一步拉大仿真和現實之間的差距。

而具身智能恰恰需要高同步性。

一只機器狗在虛擬環境里學習側空翻，背后同時發生的是物理計算、圖形渲染和AI訓練。物理引擎要模擬它的重心、關節、落地沖擊和姿態調整；渲染引擎要生成足夠真實的視覺環境；AI訓練引擎要在一次次試錯中優化策略。

機器狗“小飛”現場演示

如果這些環節還在割裂的系統中，數據流動和系統調度都會成為瓶頸。

全功能GPU路線試圖解決的正是這個問題：在同一套架構內，統一支撐AI計算、圖形渲染和物理仿真，讓具身智能的訓練、仿真和部署更接近一個連續工作流。

這也是摩爾線程切入具身智能的合理性。它并不是從機器人本體切入，也不是要成為一家機器人公司，它進入的是機器人背后的基礎設施層：算力、仿真、訓練、數據生成和端側部署。

具身智能讓GPU重新回到它最完整的形態：既要算AI，也要算圖形，還要算物理。

2.MT Lambda解決了哪些問題

MT Lambda是摩爾線程具身智能敘事里的關鍵產品。

這次發布會，摩爾線程將MT Lambda定義為全棧具身智能仿真平臺，旨在賦能用戶構建數據合成、策略訓練、仿真驗證的高效工作流，MT Lambda也成為了首個全棧國產化具身智能仿真平臺。

MT Lambda構建了從底層算力、核心引擎到上層框架及工具的完整解決方案：其底層基于摩爾線程全功能GPU，實現渲染、物理、AI計算在同一芯片中完成，數據“零拷貝”；中間層深度融合自研物理、渲染、AI三大引擎；上層則提供MT Lambda-Lab具身策略開發與訓練平臺以及MT Lambda-Sim高保真物理仿真與渲染平臺。

首個全棧國產化具身智能仿真平臺MT Lambda

對比英偉達體系，MT Lambda最接近NVIDIA Isaac Sim與Isaac Lab的組合：前者負責機器人仿真、測試和合成數據生成，后者服務強化學習、模仿學習和策略訓練。

但從摩爾線程這次披露的能力看，MT Lambda并不只停留在具身智能仿真和策略訓練層面，它還把圖形渲染、3DGS、生成式渲染和世界模型能力納入同一套工作流，因此又帶有Omniverse和Cosmos的部分影子。

換句話說，MT Lambda不能被簡單理解為一個仿真平臺，這是摩爾線程試圖基于國產全功能GPU和MUSA生態，搭建的一套物理AI軟件棧。

它要解決的核心問題，可以拆成三個層次：世界如何運動，世界如何被看見，機器人如何學會行動。

第一是物理引擎。

物理引擎決定虛擬世界是否可信。對于機器人來說，虛擬環境不能只是視覺上像現實，更要在物理規律上接近現實。如果虛擬世界里的接觸、碰撞、摩擦、重力、關節反饋不可信，機器人在里面學到的策略，到了真實世界就很容易失效。

MT Lambda在物理引擎層面，集成MuJoCo Warp MUSA、Newton MUSA等開源后端，以及摩爾線程自研AlphaCore物理引擎，基于MUSA架構實現并行求解，支持高精度、可微分的物理計算。在典型仿真負載下，整體仿真吞吐效率可達約30倍的提升。

其中MuJoCo Warp MUSA為廣泛用于機器人訓練的MuJoCo物理引擎增加對MUSA架構的原生支持。在四足機器狗訓練任務中，相較CPU方案可實現最高40倍訓練加速；在宇樹G1人形機器人動作跟蹤任務中，MTT S5000單卡約4.8天完成模仿學習收斂。分布式擴展方面，8卡訓練收斂加速達8倍以上，32卡最快約3.6小時完成訓練。

這意味著，國產全功能GPU開始進入機器人強化學習、模仿學習和物理仿真訓練的底層環節。

MT Lambda Lab 具身智能高效開發與訓練

第二是渲染引擎。

機器人需要依賴視覺、深度、語義等信息理解環境。如果仿真環境的視覺真實度不夠，模型在虛擬世界中學到的感知能力，遷移到真實世界時就可能出現偏差。

MT Lambda搭載MT Photon光子引擎，融合光線追蹤與混合渲染能力，同時引入3DGS（三維高斯濺射）和自研MTAGR（AI生成式渲染），以提升仿真畫面的真實感、渲染幀率和實時渲染能力。

這一層能力對于具身智能尤其重要。

過去，機器人仿真更像是在虛擬世界里“搭積木”；未來，具身智能仿真要越來越接近“生成世界”。通過3DGS、光線追蹤和生成式渲染，開發者可以更快構建高真實感環境，生成海量合成數據，用于訓練、評測和驗證。

合成數據正在從真實數據的補充，變成具身智能訓練基礎設施的一部分。

第三是AI計算與訓練引擎。

MT Lambda集成深度適配PyTorch的Torch MUSA框架，支持VLA模型開發部署，并融合強化學習與模仿學習訓練范式，為人形機器人、具身智能體的感知決策、自主學習和行為迭代提供AI訓練與推理底層支撐。

這里的技術鏈路可以理解為：VLA模型負責把視覺、語言和動作連接起來；模仿學習讓機器人學習人類或專家軌跡；強化學習讓機器人在仿真環境中通過反復試錯優化策略；世界模型則幫助智能體形成對環境變化的預測能力。

“小飛”的側空翻，正是這一套鏈路的一個現場化展示，可以說這是“仿真—訓練—部署”的可視化結果。

3.國產GPU平臺進入具身智能核心

MT Lambda并不是單獨存在，它被放在摩爾線程“云—邊—端”全棧智算矩陣中。

在云側，夸娥智算集群負責大規模訓練、強化學習訓練、大規模并行仿真和模型迭代。夸娥萬卡級智算集群已落地，在Dense大模型訓練中的模型算力利用率（MFU）達60%，在MoE大模型上達40%，有效訓練時長達90%，訓練線性擴展效率達95%。

在中間層，MT Lambda負責數據合成、仿真、策略訓練，把虛擬訓練和真實部署連接起來。

在端側，基于“長江”SoC的MTT E300 AI模組負責低延遲、高可靠的本地推理與實時響應。E300可提供50TOPS本地算力，可直接部署于機器人終端，實現感知、決策、執行的本地化閉環。

這三者合在一起，才構成摩爾線程在具身智能中的真正位置：它不在臺前制造一臺機器人，而是在后臺搭建機器人所需的國產算力與仿真底座。

摩爾線程賦能具身智能

如果說英偉達已經把物理AI變成一套從數據中心到機器人端側的系統敘事，那么摩爾線程正在嘗試以國產全功能GPU為底座，補上中國具身智能產業所需的算力、仿真和部署閉環。

這也是這場發布會的真正信號。

過去，國產GPU的競爭更多圍繞AI訓推展開。但具身智能把競爭維度重新拉寬了，誰能同時支撐大模型訓練、物理仿真、圖形渲染和端側部署等，誰才有可能成為物理AI時代的底座公司。

同時，摩爾線程積極拓展具身生態“朋友圈”，通過與光輪智能在合成數據等關鍵領域共筑國產具身智能仿真底座，以及與光線云聯合打造RaysTwins具身仿真平臺等深度合作，共同推動技術成果加速轉化落地。

“小飛”的側空翻只是一個開始。

當AI從數字世界走向物理世界，算力要處理的不再只是文字和圖片，還包括空間、碰撞、摩擦、重力和行動。對國產GPU來說，真正的挑戰或許并非某一款芯片，而是要看其能否支撐一個新的產業范式：從云端訓練、物理仿真到端側執行等，都在自己的軟硬件體系里完成。

具身智能的新一階段競爭，正在機器人背后發生。

（封面圖及文中配圖來源：摩爾線程）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.