眼下,具身智能最大的技術分野大概就是VLA路線的可行性。支持者認為,這是具身智能的終極路線,反對者則已經為此“默哀”。
過去兩年,VLA(vision-language-action 視覺-語言-動作)模型幾乎是機器人“大腦”的主流敘事。機器人通過視覺觀察環境,通過語言理解人類指令,再把理解轉化為動作輸出。今年以來,包括英偉達首席研究科學家、具身自主研究團隊負責人范麟熙,以及宇樹科技創始人王興興等行業人士,都曾公開表達對純VLA路線的擔憂。在他們看來,真實世界的數據稀缺、泛化能力不足以及系統穩定性等問題,仍是擺在VLA面前的現實挑戰。
當技術路線尚未收斂,產業界已經開始尋找更務實的答案。
據悉,具身大腦公司星源智即將發布全球速度最快的“具身交互世界模型”,讓機器人不再只是感知環境、執行指令,而開始具備一種面向物理世界的主動推演能力。6月3日,星源智宣布完成最新一輪融資。投資方涵蓋頭部財務投資、國資與產業資本三大維度:松禾資本、創東方、華控基金等知名機構聯合投資;中車資本、北工投資、國君創新投、江西金控等國資加持;產業方埃泰克、恒興集團、奇安投資的深度合作;同時,老股東元生創投連續三輪追加投資。截至目前,成立僅10個月,星源智已累計融資10億元人民幣。
此前,北京智源研究院曾成功孵化出如今最高市值超8000億港元的大語言模型公司智譜。星源智憑借對“世界模型”這一關鍵技術的原創性突破,目標成為具身智能領域下一個“智譜”。據悉,星源智本輪融資將重點投入下一代具身大腦與世界模型的核心技術研發、產品規模化量產落地、以及頂尖人才引進與團隊建設三大方向。
不止于大腦
具身智能的發展,始終面臨兩道繞不開的難題。
一方面,真實世界數據獲取成本極高。機器人需要在復雜環境中不斷試錯、學習,而高質量真機數據的采集效率遠低于互聯網時代的大模型訓練方式,導致純端到端模型難以形成復雜長程任務所需的泛化能力。另一方面,大模型對算力、功耗和實時性的要求極為嚴苛,在機器人本體上實現穩定部署與規模化應用,依然存在不小挑戰。
從創立之初,星源智便沒有選擇單純追逐參數規模,而是走上了一條“軟硬一體、端側部署”的差異化路線。
其核心是一套“具身大小腦”協同架構。其中,“具身大腦”負責語言理解、環境感知、任務規劃以及長程推理,并具備反思與重規劃能力;“具身小腦”則承擔導航、操作等運動控制任務,負責將決策轉化為具體動作執行。
這種分層設計,與國際頭部具身智能公司PI和Figure AI提出的“快慢系統”理念頗為相似:慢系統負責思考和決策,快系統負責實時控制和執行。不同之處在于,星源智堅持全模型端側部署,并自研算力平臺,盡可能擺脫對云端算力的依賴,讓機器人能夠在真實場景中實現更穩定、更低時延的運行。
如果說“大小腦”解決的是機器人如何行動的問題,那么世界模型解決的則是機器人如何理解行動后果的問題。
當前不少世界模型主要依賴視頻生成思路,通過預測未來畫面來模擬世界變化。但在星源智看來,對于機器人而言,更關鍵的問題并非“未來會出現什么畫面”,而是“我的動作將如何改變世界”。
基于這一思路,星源智構建了具身交互世界模型。模型通過學習“當前狀態—動作—未來狀態”之間的動態關系,在潛空間中捕捉運動物體、交互對象以及關鍵狀態變化,并進一步將這些能力用于動作生成、內部預演和動作修正。
這意味著,機器人不再只是感知環境、執行指令,而開始具備一種面向物理世界的主動推演能力。在真正伸手抓取、移動物體或執行任務之前,它會先在內部完成一次“模擬演練”:如果這樣做,環境會發生什么變化;如果失敗,是否存在更優方案;下一步又該如何調整。
該“具身交互世界模型”的核心價值在于,讓機器人從“看見世界”,走向“理解交互”;從“執行動作”,走向“預判后果”。在這一技術框架下,世界模型不再只是一個用于生成畫面的預測模塊,而是成為連接感知、決策與控制的關鍵中樞。它有望幫助機器人以更低的數據成本、更高的推理效率和更泛化的任務執行能力,進入復雜、開放、持續變化的真實物理環境。
劍指物理AI的“智譜”
在業內看來,世界模型正在成為繼大語言模型之后,具身智能領域最重要的技術競爭方向之一。其核心價值在于幫助機器人建立對物理世界運行規律的理解能力,從而降低對海量真實數據的依賴,并提升跨場景泛化能力。
相比許多以工程落地為主的創業團隊,星源智最大的特點在于其兼具科研能力與產業化經驗。
目前,公司已組建起一支國內少有的世界模型復合型團隊。核心成員來自清華大學、北京大學、慕尼黑工業大學、智源研究院等頂尖高校和研究機構,長期深耕世界模型、強化學習和具身智能方向。
早在2024年,核心成員便提出了與JEPA相近的技術思路,相關研究工作也早于LeWorldModel等后續方案,部分理念如今已逐漸成為具身智能世界模型領域的重要技術范式之一。
劉東表示,公司始終堅持“技術深耕”與“量產落地”雙輪驅動的發展路徑,希望成為具身大腦和世界模型領域的全球領先企業。
成立不到一年,星源智的商業化進展已明顯提速。
據了解,公司打造的軟硬一體化解決方案已深度服務頭部機器人本體廠商,客戶覆蓋超過70%的頭部具身智能企業,并成為英偉達Jetson Thor平臺全球最大的出貨合作伙伴之一。
此外,星源智還在持續拓展產業場景落地,已與北京亦莊機器人公司展開戰略合作,在政務服務、智能巡檢、導覽導購等場景推進應用;同時與頭部能源集團、電力集團開展深度協同,在電力巡檢、能源設施運維等高價值場景實現規模化部署。
伴隨本輪融資完成,公司同步宣布:北京智源研究院將持續深度支持星源智世界模型建設,雙方共同成立“具身交互世界模型實驗室”,通過人才導入、資源互補、技術互補等方式,共同開發前沿的具身交互世界模型技術,加速科技成果的轉化與應用。
作為北京智源研究院在具身時代重點孵化與持續支持的核心項目,星源智目標成為具身智能領域下一個“智譜”。
下面是投資機構對星源智的觀點:
松禾資本表示:具身智能是人工智能走向物理世界的終極載體,而‘世界模型’則是突破通用具身智能的核心密碼。星源智團隊不僅擁有前瞻的技術視角,更難得的是具備極強的工程落地能力,能夠將前沿的世界模型技術高效轉化為賦能本體的各種技能。我們非常看好星源智在‘軟硬協同、端側部署’路線上的戰略定力,相信公司將成為具身智能產業發展的關鍵變量。
中車轉型升級基金表示:在軌道交通裝備、新能源裝備等領域,我方看到了星源智帶來的變革潛力。星源智的技術方案打破了傳統工業機器人“只能在既定規則下運行”的局限,其算法模型表現出的泛化能力與環境適應性令人印象深刻。后續中車相關產業公司將積極探索與星源智在產業應用中深度協同,挖掘具身大腦更多可能性,賦能軌道交通及新能源裝備數字化、智能化升級。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.