![]()
![]()
具身智能讓GPU重新回到它最完整的形態:既要算AI,也要算圖形,還要算物理。
作者|王博
5月18日晚,一臺名為“小飛”的機器狗走上了摩爾線程年度產品發布會的舞臺,表演了一個側空翻。
機器狗表演側空翻,今天已經不算一件稀奇事。但這一次,“小飛”的側空翻有一個特殊之處:這是業內首次在基于國產硬件的仿真平臺中實現模型訓練,并在國產端側芯片上部署,最終實現Sim-to-Real(仿真到現實)真機驗證。
換句話說,這不只是一次機器狗動作展示,而是一次國產具身智能基礎設施的閉環驗證:從云端訓練,到仿真驗證,再到端側部署,一條原本高度依賴海外軟硬件生態的鏈路,開始在國產平臺上跑通。
對國內具身智能行業來說,這比一次漂亮的動作演示更重要。
表面上看,摩爾線程在這場主題為“詞元時代,萬物智能”的年度產品發布會上,展示的是一套“云-邊-端”全棧智算矩陣:從萬卡級夸娥(KUAE)智算集群,到自研“長江”SoC驅動的智能終端MTT AICUBE、MTT AIBOOK,再到首個全棧具身智能仿真平臺MT Lambda,以及持續進化的MUSA生態。
![]()
摩爾線程創始人、董事長兼CEO 張建中
但放到具身智能產業里看,「甲子光年」看到的是,摩爾線程這樣一家采用全功能GPU路線的國產芯片公司,正在試圖把AI計算、圖形渲染、物理仿真和端側部署連接起來,打造機器人進入真實世界之前的國產基礎設施。
他們想證明的一件事:國產算力平臺可以進入具身智能的核心訓練與部署環節。
1.完全形態的“全功能GPU”,才能勝任具身智能
要理解摩爾線程為什么要講具身智能,先要理解它為什么反復強調“全功能GPU”。
全功能GPU(Universal GPU),是指基于統一系統架構,同時具備功能完備性與精度完整性的GPU。它并不只是AI加速器,而是同時覆蓋AI計算、通用計算和圖形渲染等能力的通用算力平臺。全功能GPU在工作效率、生態完整多樣性以及兼容性等方面更具有優勢,能夠更好地適應未來新興及前沿計算加速應用場景的需求。
它和TPU、NPU的本質區別是通用性與專用性。打個比方,TPU、NPU更像“專才”,通常圍繞AI計算、深度學習推理或特定模型任務做定制優化,在目標場景下可以獲得更高能效和性價比,但能力邊界相對明確;全功能GPU更像“通才”,優勢在于能在同一架構內同時承載AI、圖形、物理和視頻等多類計算任務。
在AI大模型時代,GPU最容易被理解為訓練和推理芯片,評價標準也集中在矩陣計算、訓練吞吐、推理效率、顯存容量和互聯能力上。但具身智能處理的不僅是單純的文本和圖像,而是一個多模態的物理世界,這就對芯片提出了更高的要求。
一個機器人要學會行動,至少需要三類核心能力。
第一,是AI計算能力。具身智能需要訓練VLA模型、世界模型、強化學習策略、模仿學習模型,以及面向復雜任務的具身大模型。
第二,是圖形渲染能力。機器人需要在足夠真實的虛擬環境中訓練和評測,仿真環境的光照、材質、遮擋、紋理和幾何細節,會直接影響感知模型的效果。
第三,是物理仿真能力。機器人不只“看”世界,還要和世界發生接觸。抓取、跳躍、行走、碰撞、摩擦、柔性物體變形,這些都需要大量物理計算支撐。
這也是全功能GPU路線在具身智能時代獲得新解釋的地方。
摩爾線程是國內為數不多堅持全功能GPU路線的公司。摩爾線程基于自研MUSA架構的全功能GPU,可以在單顆芯片上同時支持AI計算、圖形渲染、物理仿真、科學計算和超高清視頻編解碼,為具身智能提供“渲染+仿真+AI訓推”一體化的通用算力底座。
這可以解決具身智能研發中的一個問題——“割裂感”。
對比傳統架構來看,物理仿真可能運行在專門的物理引擎上,圖形渲染依賴圖形顯卡,AI訓練依賴AI加速芯片。開發者需要在不同平臺之間反復遷移數據、轉換格式、適配框架。這種割裂不僅拖慢研發效率,也會進一步拉大仿真和現實之間的差距。
而具身智能恰恰需要高同步性。
一只機器狗在虛擬環境里學習側空翻,背后同時發生的是物理計算、圖形渲染和AI訓練。物理引擎要模擬它的重心、關節、落地沖擊和姿態調整;渲染引擎要生成足夠真實的視覺環境;AI訓練引擎要在一次次試錯中優化策略。
![]()
機器狗“小飛”現場演示
如果這些環節還在割裂的系統中,數據流動和系統調度都會成為瓶頸。
全功能GPU路線試圖解決的正是這個問題:在同一套架構內,統一支撐AI計算、圖形渲染和物理仿真,讓具身智能的訓練、仿真和部署更接近一個連續工作流。
這也是摩爾線程切入具身智能的合理性。它并不是從機器人本體切入,也不是要成為一家機器人公司,它進入的是機器人背后的基礎設施層:算力、仿真、訓練、數據生成和端側部署。
具身智能讓GPU重新回到它最完整的形態:既要算AI,也要算圖形,還要算物理。
2.MT Lambda解決了哪些問題
MT Lambda是摩爾線程具身智能敘事里的關鍵產品。
這次發布會,摩爾線程將MT Lambda定義為全棧具身智能仿真平臺,旨在賦能用戶構建數據合成、策略訓練、仿真驗證的高效工作流,MT Lambda也成為了首個全棧國產化具身智能仿真平臺。
MT Lambda構建了從底層算力、核心引擎到上層框架及工具的完整解決方案:其底層基于摩爾線程全功能GPU,實現渲染、物理、AI計算在同一芯片中完成,數據“零拷貝”;中間層深度融合自研物理、渲染、AI三大引擎;上層則提供MT Lambda-Lab具身策略開發與訓練平臺以及MT Lambda-Sim高保真物理仿真與渲染平臺。
![]()
首個全棧國產化具身智能仿真平臺MT Lambda
對比英偉達體系,MT Lambda最接近NVIDIA Isaac Sim與Isaac Lab的組合:前者負責機器人仿真、測試和合成數據生成,后者服務強化學習、模仿學習和策略訓練。
但從摩爾線程這次披露的能力看,MT Lambda并不只停留在具身智能仿真和策略訓練層面,它還把圖形渲染、3DGS、生成式渲染和世界模型能力納入同一套工作流,因此又帶有Omniverse和Cosmos的部分影子。
換句話說,MT Lambda不能被簡單理解為一個仿真平臺,這是摩爾線程試圖基于國產全功能GPU和MUSA生態,搭建的一套物理AI軟件棧。
它要解決的核心問題,可以拆成三個層次:世界如何運動,世界如何被看見,機器人如何學會行動。
第一是物理引擎。
物理引擎決定虛擬世界是否可信。對于機器人來說,虛擬環境不能只是視覺上像現實,更要在物理規律上接近現實。如果虛擬世界里的接觸、碰撞、摩擦、重力、關節反饋不可信,機器人在里面學到的策略,到了真實世界就很容易失效。
MT Lambda在物理引擎層面,集成MuJoCo Warp MUSA、Newton MUSA等開源后端,以及摩爾線程自研AlphaCore物理引擎,基于MUSA架構實現并行求解,支持高精度、可微分的物理計算。在典型仿真負載下,整體仿真吞吐效率可達約30倍的提升。
其中MuJoCo Warp MUSA為廣泛用于機器人訓練的MuJoCo物理引擎增加對MUSA架構的原生支持。在四足機器狗訓練任務中,相較CPU方案可實現最高40倍訓練加速;在宇樹G1人形機器人動作跟蹤任務中,MTT S5000單卡約4.8天完成模仿學習收斂。分布式擴展方面,8卡訓練收斂加速達8倍以上,32卡最快約3.6小時完成訓練。
這意味著,國產全功能GPU開始進入機器人強化學習、模仿學習和物理仿真訓練的底層環節。
![]()
MT Lambda Lab 具身智能高效開發與訓練
第二是渲染引擎。
機器人需要依賴視覺、深度、語義等信息理解環境。如果仿真環境的視覺真實度不夠,模型在虛擬世界中學到的感知能力,遷移到真實世界時就可能出現偏差。
MT Lambda搭載MT Photon光子引擎,融合光線追蹤與混合渲染能力,同時引入3DGS(三維高斯濺射)和自研MTAGR(AI生成式渲染),以提升仿真畫面的真實感、渲染幀率和實時渲染能力。
這一層能力對于具身智能尤其重要。
過去,機器人仿真更像是在虛擬世界里“搭積木”;未來,具身智能仿真要越來越接近“生成世界”。通過3DGS、光線追蹤和生成式渲染,開發者可以更快構建高真實感環境,生成海量合成數據,用于訓練、評測和驗證。
合成數據正在從真實數據的補充,變成具身智能訓練基礎設施的一部分。
第三是AI計算與訓練引擎。
MT Lambda集成深度適配PyTorch的Torch MUSA框架,支持VLA模型開發部署,并融合強化學習與模仿學習訓練范式,為人形機器人、具身智能體的感知決策、自主學習和行為迭代提供AI訓練與推理底層支撐。
這里的技術鏈路可以理解為:VLA模型負責把視覺、語言和動作連接起來;模仿學習讓機器人學習人類或專家軌跡;強化學習讓機器人在仿真環境中通過反復試錯優化策略;世界模型則幫助智能體形成對環境變化的預測能力。
“小飛”的側空翻,正是這一套鏈路的一個現場化展示,可以說這是“仿真—訓練—部署”的可視化結果。
3.國產GPU平臺進入具身智能核心
MT Lambda并不是單獨存在,它被放在摩爾線程“云—邊—端”全棧智算矩陣中。
在云側,夸娥智算集群負責大規模訓練、強化學習訓練、大規模并行仿真和模型迭代。夸娥萬卡級智算集群已落地,在Dense大模型訓練中的模型算力利用率(MFU)達60%,在MoE大模型上達40%,有效訓練時長達90%,訓練線性擴展效率達95%。
在中間層,MT Lambda負責數據合成、仿真、策略訓練,把虛擬訓練和真實部署連接起來。
在端側,基于“長江”SoC的MTT E300 AI模組負責低延遲、高可靠的本地推理與實時響應。E300可提供50TOPS本地算力,可直接部署于機器人終端,實現感知、決策、執行的本地化閉環。
這三者合在一起,才構成摩爾線程在具身智能中的真正位置:它不在臺前制造一臺機器人,而是在后臺搭建機器人所需的國產算力與仿真底座。
![]()
摩爾線程賦能具身智能
如果說英偉達已經把物理AI變成一套從數據中心到機器人端側的系統敘事,那么摩爾線程正在嘗試以國產全功能GPU為底座,補上中國具身智能產業所需的算力、仿真和部署閉環。
這也是這場發布會的真正信號。
過去,國產GPU的競爭更多圍繞AI訓推展開。但具身智能把競爭維度重新拉寬了,誰能同時支撐大模型訓練、物理仿真、圖形渲染和端側部署等,誰才有可能成為物理AI時代的底座公司。
同時,摩爾線程積極拓展具身生態“朋友圈”,通過與光輪智能在合成數據等關鍵領域共筑國產具身智能仿真底座,以及與光線云聯合打造RaysTwins具身仿真平臺等深度合作,共同推動技術成果加速轉化落地。
“小飛”的側空翻只是一個開始。
當AI從數字世界走向物理世界,算力要處理的不再只是文字和圖片,還包括空間、碰撞、摩擦、重力和行動。對國產GPU來說,真正的挑戰或許并非某一款芯片,而是要看其能否支撐一個新的產業范式:從云端訓練、物理仿真到端側執行等,都在自己的軟硬件體系里完成。
具身智能的新一階段競爭,正在機器人背后發生。
(封面圖及文中配圖來源:摩爾線程)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.