![]()
ROBOT INDUSTRY
在具身智能領域,智源研究院可謂是“特別”的存在,它不追逐商業藍海、不蹭行業熱點,卻得到了一眾明星企業的擁護。走進智源具身訓練場,我們看見了他們的故事。
![]()
跌倒、沖撞、攙扶,在智源研究院,我們看到了人形機器人日常訓練中的真實一面。“未來兩三年,人形機器人不會進入到家庭滿地跑,我非常確定不會發生。”智源研究院院長王仲遠說道。
當各大廠商爭相卷硬件、卷模型、卷數據時,智源研究院作為一家非營利性的“第三方”,始終冷靜審視著行業邁出的每個腳印。“賽道周期非常長,里面的變數非常多,有可能會出現遇冷甚至低谷的情況,但我認為整個方向沒有問題,產業是螺旋式上升。”在王仲遠看來,發展具身智能已經成為行業共識,但過程離不開產業協同,每一個單點突破都難以形成化學反應。
“我們特別希望,也呼吁越來越多的機器人廠商與我們合作,提供本體的各種數據。”對于大部分創業公司而言,訓練模型的成本非常高,現階段的市場規模難以支撐他們做出這樣冒風險的決定。“我們可以為他們提供大腦,類似于他們造手機,我們提供操作系統,”王仲遠直言,“誰家數據用得多,我們訓練出的模型就會在這家機器人上更好用。”
1
公共底座降低具身智能產業化門檻
![]()
前不久,2025智源具身智能開放日在北京舉行,智元機器人、銀河通用、星海圖、加速進化、自變量等一眾具身智能領域的明星公司,以及中國科學院大學、招商局集團等知名院校和龍頭企業代表悉數到場。
![]()
智源研究院院長 王仲遠
“有這么多學者和企業愿意來到這里,而且大多都是CEO和聯合創始人級別的企業家,說明中國的具身智能生態正在逐步形成,大家愿意聚攏在智源研究院周圍一起討論,相互學習、相互進步,這本身就是一件很好的事情。”
“當前人工智能正處在一個新的拐點,推動機器人從1.0專用機器人時代邁向2.0通用具身智能時代,從專用機器人邁向真正能夠完成多種任務的具身智能機器人時代。”基于這樣的思考,智源研究院在今年6月發布了“悟界”系列大模型,推動人工智能從數字世界邁向物理世界。
![]()
如今,智源研究院已經構建起以具身大腦為核心,自底向上全棧具身智能技術體系,包括能夠跨異構本體數據采集以及標準化一站式平臺,具身大小腦以及VLA等具身基座模型,還有具身智能評測等,為具身技術生態提供一套可復現、可對齊的公共基礎設施,降低從研究到產業化落地的門檻。
2
具身智能技術研發持續破壁
![]()
王仲遠認為,能夠完全自主決策、完成各種任務、與人類自由交互的完全端到端具身大模型,依然有很長的路要走,短期內比較現實的行業解決方案依然是“具身大腦”和“小腦”結合的模型。
![]()
人類通過聽覺、視覺感知世界,在交互中理解世界。智源研究院發布的多模態世界模型Emu3.5同樣遵循這一原理,基于海量視頻數據,訓練對時空狀態的預測能力。”視頻是能夠模擬真實世界最高效的載體,也是唯一包含時間、空間、物理、因果關系以及意圖等各種要素的數據。“王仲遠表示,在實際訓練中發現,隨著多模態視頻數據的增加,大模型的能力得到了顯著提升,未來或將開啟全新的“多模態Scaling”范式。
多模態世界模型無疑將對推進具身智能發展起到重要推進作用,但王仲遠還一針見血地指出,現階段具身大模型仍面臨著“不好用、不通用、不易用”的核心痛點。“不好用”是指雖然具身智能在過去一兩年取得了快速發展,但還沒有到“ChatGPT時刻”。“不通用”是指很多模型依然只適用于一個本體或同品牌的本體。“不易用”則是指大腦、小腦和本體的適配難度仍然較高。
為化解這些困擾行業的痛點難題,智源研究院推出了跨異構本體的具身大小腦協作框架RoboBrain 2.0 Pro,引入RoboBrain-Dopamine和RoboBrain-SpatialTrace,分別提升機器人對動作時序價值和三維空間結構的理解與推理能力。同時,基于RoboBrain構建了通用 VLA 模型族,包括能夠實現零樣本跨本體遷移和長程多步驟操作的RoboBrain-X0 Pro,以及通過使用大量人類演示預訓練即可適配靈巧手操作,大幅降低數據成本并在復雜操控中取得領先表現的RoboBrain-Dex 。此外,智源研究院還發布了貫通仿真訓練到真機部署的泛機器人小腦智能Emu-RobotVerse,以及專為人形機器人設計的全身控制框架BAAI Thor。
![]()
智源研究院具身研究負責人還各自分享了最新研究進展。
在人機交互方面,智源研究院推出了原生全雙工語音大模型RoboBrain-Audio與終身認知記憶系統RoboBrain-Memory,讓機器人能夠記住交互的點滴,更像一個思維敏捷、記憶力超群的老朋友。
在平臺與工具鏈方面,智源研究院開放了“面向異構本體、規范操作流程、提高研發效率”的具身數據軟件框架CoRobot,打造了面向具身智能的多芯片訓練與推理一體化框架FlagOS-Robo,實現大腦模型與小腦模型的高效訓練與推理,以及覆蓋“數據采集-數據標注-數據管理-模型訓練-仿真評測-模型部署”的全流程開發平臺RoboXstudio。
![]()
在數據方面,基于具身數據軟件框架CoRobot,智源研究院聯合多家具身智能公司和海內外高校建設并開源了“全球本體數最多、標注最精細、使用最便捷”的高質量雙臂機器人真機數據集RoboCOIN。
在評測方面,智源研究院推出了面向具身智能的系統化評測服務平臺FlagEval-EmbodiedVerse,開源“難度高、覆蓋廣”的具身推理能力評測基準ERQA+,并聯合北京郵電大學建設面向具身智能物理安全評測基準體系,聯合Dexmal 原力靈機、Hugging Face 等共十家單位,正式成立 RoboChallenge 組委會。
3
打造健康的具身智能產業生態
![]()
”數據非常重要,怎樣形成數據飛輪更加重要。”王仲遠指出,談論數據時不能脫離場景和需求,要關注解決實際問題的能力。“具身機器人創業公司應該聚焦真實需求,把一個場景打磨透,做到7×24小時穩定工作,這才是產品應解決的問題。有些創業公司一開始就想要做萬能具身,這讓人有些擔心。”
![]()
相比于企業,智源研究院沒有營收“枷鎖”的束縛,可以心無旁騖地專注于高泛化性的具身智能研發,打磨通用能力。因此,智源研究院與具身智能企業之間形成了天然的良性分工,“企業共享不涉及用戶隱私的數據,幫助我們訓練具身大模型,訓練出的模型再分享給企業,讓他們不必從零開始。”得益于此,智源研究院的“朋友圈”越來越大。
目前,智源研究院已經開源多款大模型。“我們特別希望通過這樣善意的舉動促進行業互動,并與更多企業共同訓練和提升模型能力。”在一些專業論文和技術報告中,可以在致謝中看到智源研究院的名字,這一簡單的舉動正是王仲遠樂于看到的,它代表著一個健康的產業生態正在形成。
面向短期未來,王仲遠認為具備解決具體任務的專業型具身智能機器人有望在細分領域落地應用,并逐步擴大規模實現商業化,但對于具備通用能力的具身智能產品要保持客觀期待。下一步,智源研究院將持續迭代并同步公布在開源項目、數據集與評測平臺上的進展,同時與產業伙伴推進聯合試點,加速具身智能從實驗室走向生產線。
閱讀更多內容,歡迎訂購《機器人產業》雜志。
點擊跳轉!圈內人都在看的專家觀點
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.