![]()
作者:呂鑫燚 出品:具身研習社
具身智能大模型的排位發生了關鍵轉移。
近日,具身智能大模型全球首個大規模多任務的真機基準測試平臺RoboChallenge榜單發生新變化,千尋智能自研VLA基礎模型Spiritv1.5以66.09分,超50%的成功率超越pi0.5,奪得第一。且在RoboChallenge的Table30榜單上均位列第一。
![]()
為了證明榜單成績來自自研模型且真實有效,Spirit v1.5同步開源了基模權重、推理代碼以及使用樣例,接受公眾檢驗,也方便社區在Spiritv1.5的基礎上創新。
在統一基準線下和pi0.5正面對標,千尋的成績已經遠超于“分數價值”。其不僅標志著具身大模型的驅動下,具身智能機器人在任務操作成功率上取得真實突破,更有力地解決了年初縈繞在產業內的焦慮:具身大腦“國內缺位”的結論,已經成為過去式。
作為具身智能大模型不可忽視的玩家之一,千尋智能的技術迭代與生態布局始終精準發力:從Spiritv1率先突破柔性物體處理難題,攻克復雜長序列任務,實現從疊衣服到辦公室整理的場景落地;到Spiritv1.5升級強大跨任務、跨本體泛化能力,適配真實場景的連續任務執行,同時達成操作目標與結果的穩定精確控制;再到通過開源釋放技術紅利,降低開發者復現與落地門檻,助力產業生態繁榮。
這套“技術突破+開源共享”的組合拳,迅速引發海外知名人士高度關注。英偉達具身智能負責人Jim Fan(范麟熙)主動點贊、Hugging Face官方發文祝賀,多位海外行業大V紛紛轉發。
![]()
更為關鍵的是,千尋智能的模型能力并非是“視頻僅供參考”,而是已經過真實場景中的嚴苛審視,能成為真正的生產力。前不久,寧德時代官宣千尋智能的moz1已經成為生產線一員,在電池生產線上完成相應的工作。
可見,千尋智能在“基礎模型”側的投入,不是在秀“花架子”,而是始終回答外界對于具身智能的靈魂拷問:什么時候才能成為生產力?
而這個答案就藏在千尋智能的蛻變路徑中。
![]()
RoboChallenge榜單由Dexmal原力靈機、Hugging Face等全球知名機構聯合發起。通過全方位還原真實場景的統一測試,檢驗模型處理真實工作任務的能力。這有點像馬拉松之于本體結構設計的極限測驗,RoboChallenge也在一定程度上解決了具身模型難有對比基準線的困境,更直觀地讓外界感受各家模型的真實應用能力。
RoboChallenge榜單除了總分之外,還有30個桌面操作任務的Table30,通過單臂、雙臂的操作表現,多維度考察VLA的實際應用能力。例如長序列復雜任務的完成情況,以及新任務在多構型的遷移效率。
由此可見,這是一個具身模型“拉出來溜溜”的平臺,成績也不是千尋智能的“自說自話”,而是真的在模型能力上超過了最強(過去式)模型Pi0.5。
從桌面插花、清理等任務表現來看,Spirit v1.5都能從容應對精細化操作,也沒有出現失誤導致的宕機情況。(pi0.5抓取紙盒失敗后,不再執行任務,而是轉去和紙盒“玩”)
尤其是在桌面清理任務上,該任務的桌面隨意擺放著不同尺寸、不同形狀、不同材質的極易形變操作物體。透明的塑料瓶、碗碟、亂糟糟的紙巾每一項單獨抓取放置都是對模型的較高難度考驗,而Spirit v1.5并沒有被眼前的陣仗打敗,依舊有條不紊地將桌面垃圾分別收納進垃圾桶或桌面上的整理箱中,還不忘貼心的和人類習慣一樣,把小碗疊起來放置。
![]()
Spirit v1.5執行桌面清潔
從雙臂協同執行來看,這是目前模型能力難度較高的操作,雖然實驗室場景下的固定任務規劃(如預設軌跡的組裝)容易實現,但真實場景中物體的擺放位置、形狀、材質存在不確定性,模型很難泛化出通用的協同策略。此外,連續任務中的子任務銜接(如從“抓取物體” 到“放置物體”的過渡)也容易動作中斷或卡頓。
受限于“感知-決策-執行”全鏈路的高精度協同門檻,雙臂協同類任務是評測榜單最難攻克的賽道。在物品整理任務中,Spirit v1.5做到了一邊固定透明塑料盒的位置,另一邊掀開蓋子,再將盒子中的薯條倒進盤子中。(Pi0.5止步于拆蓋環節)
![]()
Spirit v1.5執行桌面清潔
最考驗極限操作的貼膠帶任務中,由于操作空間非常狹小,且對雙臂協同和觸覺感知反饋要求高,經常出現難以完成的狀況。但Spirit v1.5依舊能完成撕膠、貼盒的雙機械臂精準配合全流程任務。
透過具體執行任務來看,Spirit v1.5在RoboChallenge榜單上的亮眼表現,標志著具身智能模型已實現從“實驗室演示”到“真實場景可用”的關鍵突破。
其在多任務、多場景下的穩定執行,證明千尋智能的模型技術成果并非依賴“溫室環境”的紙面實力,而是具備在辦公室整理、倉儲分揀、電子組裝等多場景落地的潛力。
![]()
Spiritv1.5是已經在多個現實場景中驗證過的,千尋智能Spiritv1基礎上進化而來的“新面孔”。
其創新性意義在于以“做有用的事”為核心原則,走出一條全新范式。將聚光燈陰影下的“非干凈數據”推到臺前,摒棄絕大多數入局者保證數據“干凈”的原則,杜絕“腳本式”數據采集。(技術博客見文末)
聽起來很抽象,但卻是一個值得深思的范式。
首先,千尋智能認為“干凈數據是打造卓越具身基礎模型的敵人”。誠然,將絕對干凈、任務流程操作、客觀環境、操作物體擺放位置都十分完美的數據拿來訓練模型,是模型操作能力穩定性的前置因素。但真實世界的魅力和難點正在于一切都不可預設,無論是光線還是操作物體都存在巨大不可控因。
例如,干凈數據天然受制于多樣性和可擴展性。高度標準化的數據采集模式下,根據腳本走的數據采集員只能遵循既定指令。通過一個具象化案例可更直觀的感受到,在“擦桌子”任務中,這類數據集只會機械收錄標準化的擦桌動作與桌面場景,與桌面關聯任務完全割裂,最終形成的是一個個彼此孤立的經驗孤島,而非能夠映射真實生活的連續經驗流形。自然無法捕捉現實場景的豐富性與復雜性。從可擴展性瓶頸來看,每一個新場景、新任務的數據集構建,都需要工程師團隊從零開始設計任務流程、撰寫詳盡的采集指南,還要投入大量精力進行數據篩選與質量校驗。
可見,吃慣了“細糠數據”的模型,難免在真實世界中出現“有心無力”的操作。
這正是Spiritv1.5突破的關鍵點,其選擇充滿隨機因素的數據訓練,在數據采集階段就開始規避指令式操作,在目標任務之下,由數據采集員自行決定子任務的流程。其帶來的結果是機器人體驗現實生活中的一天,而不是高度腳本化的演示片段。
于是,這便不僅是單一動作的重復,而是記錄了技能的連續流,機器人不再是孤立地學習如何執行特定動作,而是學習整套技能及其連接方式,使模型知識更加通用。(有點像會認字和會寫作文的區別)此外多樣化數據采集讓提高了數據采集員的參與度,有效提升了效率。數據顯示,人均有效采集時長增加了200%,并將對算法專家的干預需求削減了60%。
從結果來看,使用多樣化采集訓練的模型(B組)在微調階段的表現優于演示驅動采集(A組)的模型;多樣化模型達到相同性能所需的迭代次數比基線模型少了40%。
![]()
多樣化的數據采集還帶來了Scaling的涌現,除了比較數據類型外,千尋智能還研究了當擴大多樣化經驗的規模時模型的反應。結果顯示遷移效率隨多樣化數據量的增加呈正相關。隨著數據集的增長,模型在新任務上的驗證誤差持續下降。
![]()
總結來說,模型實際工作的結果表明,任務多樣性比單任務的演示數量更為關鍵。
畢竟,多樣化的數據喂養出來的模型,不再是動作而是通用策略,可以用更少的步驟適應新任務。這是一種范式轉變,也讓我們看到了具身智能成為生產力的充分必要條件,或許不僅僅是技術本身的突破,還有研發團隊的思考轉移。
![]()
模型側推陳出新是千尋智能企業頂層設計的外顯。
透過千尋智能在模型側的進展可見,其似乎有意再走一條深度挖掘模型能力價值的發展道路。
![]()
看起來和千尋智能最開始提出的“全棧自研”有些偏頗,硬件能力好像被模型的光環掩蓋。
但實際上,具身智能的本質是AI驅動,硬件服務于軟件模型。通過產業本質來看,千尋智能的今天并非是軟硬“二選一”,而是選擇一種更聰明的方式,從結果導向倒推資源配置。
畢竟真正落地要的是聰明。
而這條路線也將成為千尋智能完成愿景的重要路徑:十年內讓10%的人擁有自己的機器人。
時至今日,這句愿景仍高頻出現在千尋智能官方公眾號、產業交流論壇、媒體采訪等對外發聲中。千尋智能從未因行業周期波動或技術攻堅難度而動搖。這份對未來的篤定,看似是對具身智能產業發展的樂觀預判,實則并非單純的行業樂觀,而是植根于團隊底層基因與“非經驗主義”發展路徑的必然結論。
這份“非經驗主義”的內核為,千尋智能并沒有單純套用以往的“成功經驗”。其創始人兼CEO韓峰濤曾為珞石機器人聯合創始人&CTO,曾帶領團隊成功交付數十款型號產品超20000臺,具備極強的產品工程化能力,也是具身智能產業中為數不多邁過量產關經驗的領先者。
按照韓峰濤的履歷,千尋智能應該會比現在走得步子更急。但千尋智能并沒有盲目擴大規模,而是深入場景腹地,啃下最難的骨頭,把機器人送上了寧德時代的生產線。
千尋智能聯合創始人高陽也具備極強的模型能力,但其也并沒有躺在“功勞簿”上,而是持續創新。
簡單來說,千尋智能是遵從具身智能產業本身的發展邏輯行事,其每一步都非常扎實。不被過往經驗束縛,不被浮躁裹挾,以模型為核心引擎,以硬件為落地載體,以真實場景為試金石,在工業級應用中打磨技術,在評測中驗證實力,讓模型能力有用武之地,也讓硬件價值得到精準釋放,最終形成“模型引領方向、硬件支撐落地”的正向循環。
而這,正是千尋智能能夠在激烈的行業競爭中脫穎而出,并且有底氣朝著“讓10%的人擁有自己的機器人”愿景穩步邁進的核心原因。用扎實的技術落地,一點點拉近機器人走進大眾生活的距離。
技術博客:
https://www.spirit-ai.com/en/blog/spirit-v1-5
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.