6月2日,星海圖發布了雙足人形機器人行客Kengo。
消息本身不算意外,但時間節點耐人尋味。
因為就在這前后,星海圖推出了新一代具身基礎大模型G0.5,并在七項獨立評測中全面領先,在業界公認最難的長程任務基準BEHAVIOR-1K上,以單一模型權重擊敗了多模型集成的冠軍方案。
![]()
兩件事同時發生,很難把它解讀成單純的產品節奏巧合。
因為大講堂注意到,星海圖是一家從創立起就把具身大模型放在核心位置的公司,因此雙足整機的推出,對他們來說,或許就不是常規的產品線延伸,這更像是一次戰略表態,意思是:我的大腦已經做到足夠的厚度,現在要讓它去驅動真正能進入生產力市場的身體了。
行客Kengo,就是這個判斷的產物。
01.
先做大腦,再做硬件
機器人行業的主流開發邏輯是硬件先行——先把本體做出來,跑起來再說,大腦的事慢慢補。
這條路走了很多年,結果是市場上有很多能展示特定動作的機器人,但幾乎沒有能在新環境里自主干活的機器人。
星海圖走的是反方向。幾乎眾所周知的是,公司以輪式機器人R1系列起步,把大量精力投入大模型的預訓練架構設計,在工廠和商業場所里真實部署,用落地數據持續反哺G系列模型的迭代。
這條路在品牌曝光度上不如雙足搶眼,但積累的是更扎實的底層能力。這使得如今,當大模型跨越零樣本泛化的能力門檻時,公司已經有完整的技術工具鏈,可以把大腦能力遷移到新的硬件平臺上,而不是從頭開始。
這也使得G0.5的發布,意味著這家公司的場景落地關鍵節點已經來臨了。
![]()
02.
為什么是現在?
因為星海圖從成立第一天起,瞄準的就是用具身智能真正解決生產力的問題。
生產力問題意味著什么?意味著機器人不能只在實驗室里表演,不能只在一張桌子上抓方塊,不能只在一個房間里認路。它要走進工廠、倉庫、商場、家庭。
而這些場景的共同點是,環境非結構化,地形復雜,任務多變。需要面臨的是樓梯、門檻、狹窄通道、高低錯落的操作面、濕滑地面、碎石路……
因此,為了滿足這些場景的落地作業需求,G0.5的核心能力大講堂認為可以梳理成三條,每一條其實都在解決機器人能不能在真實環境里不挑活、不挑地、不挑人地干活的這個問題。
![]()
第一,零樣本泛化。傳統機器人換個房間、換個物體、換個指令,就要重新采集數據、重新微調。
但G0.5不一樣。在DROID評測中,沒有任何該機器人的微調,10個桌面操作任務平均成功率超過80%。這意味著機器人第一次進入一個工業新場景,不需要停下來訓練,直接就能上手干活。
![]()
第二,自然語言調行為。在場景切換最麻煩的就是代碼重復編寫,但G0.5因為的推理和動作走的是同一條路,語言指令可以直接影響動作輸出,不需要重新訓練,這就大幅加快了進入場景的時間。
![]()
第三,長程任務穩定。真實世界的任務很少是單步的。例如“收拾桌子”這個任務,就包含識別、抓取、移動、放置多個步驟。
G0.5在BEHAVIOR-1K這個目前規模最大、任務最真實的長程操作評測上,卻只訓練了一個周期就超過了訓練四個周期的行業模型,這意味著未來機器人部署時間的大幅減少。
這三條合在一起,指向一個結論,星海圖的大腦已經具備了在真實場景中干活的基礎能力,并且還在不斷升級優化。這也使得在場景的需求下,大模型的迭代本質上可以看作是星海圖一個又一個新的起點,而不是終點。
但恰恰因為星海圖恰好擁有一顆強大的大腦,這讓它的雙足從一開始就和其他雙足不一樣。
![]()
03.
Kengo:為干活設計的雙足
那么,有了這樣的大腦,星海圖選擇的身體是什么樣的?如何能讓大腦的能力去覆蓋更多、更通用的真實場景?
我們先來看看行客Kengo的核心參數:身高1,396mm,整機重量約40kg(含電池),總自由度23+,單膝關節最大扭矩超過130N·m,手臂最大負載2kg,續航2小時,支持OTA升級和二次開發,對外開放控制接口。
![]()
理解這款產品的各項參數,其實需要把為真實場景設計作為前提。
身高1,396mm,是圍繞人類工作場所的物理規格選擇的結果。標準操作臺高度在750至850mm之間,門洞凈高通常為2,000mm。這個身高讓Kengo能操作大多數人類設計的工作臺和設備,同時自由穿越建筑內通道,不需要對任何存量環境做改造——輪式平臺處理不了的高差和狹窄空間,雙足可以自然應對。
130N·m的膝關節扭矩,對應的是邊走邊干的硬件基礎。雙足機器人在執行上肢任務的同時,下肢需要持續維持動態平衡,任何操作引發的重心偏移都要求關節在毫秒級內做出補償。高扭矩關節,是行走與操作同步進行的物理前提。
![]()
倒地跌落10次完好無損,線束折彎壽命超20萬次,全身關節僅由兩款核心模組覆蓋,這三個參數瞄準的是商業部署里最容易被忽視的可靠性和可維護性問題。因為機器人在真實環境里難免碰撞和重復動作,每次意外都需要停機維修,綜合運營成本會迅速超出預算。高標準化的模組設計,是從供應鏈和維修體系倒推出來的工程約束。
開放性是Kengo另一個值得關注的設計取向。支持二次開發、OTA升級,對外開放控制接口,這意味著Kengo的目標用戶不只是最終客戶,也包括在這個平臺上開發行業應用的開發者。一個開放的硬件平臺,意味著更多可能的落地路徑,這是推動具身智能走向規模化應用的必要條件之一。
04.
全棧閉環的價值閉環
星海圖把自己的技術路徑定義為大腦×小腦×本體的全棧自研閉環,這意味著具身基礎大模型、運動控制系統、硬件整機,三層能力均自主研發。
這三層之間的耦合比表面看起來更深。因為其大模型的訓練數據來自輪足本體平臺的真實操作記錄,運動控制系統的調參依賴大模型對任務的理解,本體的傳感器布局和關節配置又需要圍繞模型的感知接口來設計。任何一層外包,耦合成本就轉移到集成界面上,迭代速度和控制精度都會打折扣。
![]()
全棧自研最直接的工程收益是低延遲。大模型推理結果需要在毫秒級內轉化為關節控制指令,三層同一軟件棧內的深度優化,把這個延遲下限壓到跨系統方案難以實現的水平。更深層的價值是迭代速度:硬件數據直接回流到模型訓練,模型改進直接驗證在整機表現上,這套閉環的迭代頻率是分布式系統難以追趕的。
這個判斷正在被越來越多的頭部玩家驗證。2025年,OpenAI密集布局機器人方向,英偉達把Isaac平臺定位為機器人訓練與部署的全棧基礎設施,高通推出專為機器人設計的邊緣AI方案。具身智能的競爭,正在從單點能力轉向系統整合效率。先走完全棧路徑的公司,積累的是越來越難被追趕的工程優勢。
05.
走向生產力市場
雙足機器人行業過去幾年的主線敘事,是站起來,也就是能否保持平衡、能否行走、能否做出讓人印象深刻的運動表現。這個階段的驗收標準是視覺沖擊,是證明技術存在。
這條敘事線已經基本講完了。站起來這件事,頭部公司都做到了。下一個問題是,這些機器人能不能干好活?
干好活意味著什么?能在陌生環境里直接上手,不需要為每個新場景重新采集數據;能聽自然語言指令,不需要專業示教就能部署;能完成有多個步驟的任務,中間出了問題能自我調整;連續工作,壞了能修,成本可控。
![]()
這些要求,硬件側和軟件側缺一不可。Kengo的本體設計解決的是物理側的準入條件,G0.5解決的是智能側的準入條件。在此基礎上,星海圖當前展示了兩條路線的硬實力。一個在七項評測上領先同類的大模型,和一臺為真實場景設計的雙足整機。
未來,當Kengo搭載G0.5,大腦的泛化能力和通用操作能力將賦能雙足本體,讓機器人真正具備在更多真實場景里自主工作的能力。這是星海圖做雙足的長期邏輯,也是具身智能行業從能動走向真正干活的關鍵一步。
行客Kengo的出現,標志著具身智能行業開始認真面對這個問題。從展示運動能力,到具備真正理解現實世界、參與真實任務的潛力,這是通用機器人道路上一個真實的刻度,不是終點,而是新的起點。
技術報告已完整公開:
https://opengalaxea.github.io/G05/
https://opengalaxea.github.io/G05/Galaxea_G0_5.pdf
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.