網易首頁 > 網易號 > 正文申請入駐

用冠冕重塑規則：千尋智能開源Spirit v1.5，告別追隨者敘事

2026-01-14 11:00:56　來源: 具身研習社

北京舉報

分享至

作者：呂鑫燚出品：具身研習社

具身智能大模型的排位發生了關鍵轉移。

近日，具身智能大模型全球首個大規模多任務的真機基準測試平臺RoboChallenge榜單發生新變化，千尋智能自研VLA基礎模型Spiritv1.5以66.09分，超50%的成功率超越pi0.5，奪得第一。且在RoboChallenge的Table30榜單上均位列第一。

為了證明榜單成績來自自研模型且真實有效，Spirit v1.5同步開源了基模權重、推理代碼以及使用樣例，接受公眾檢驗，也方便社區在Spiritv1.5的基礎上創新。

在統一基準線下和pi0.5正面對標，千尋的成績已經遠超于“分數價值”。其不僅標志著具身大模型的驅動下，具身智能機器人在任務操作成功率上取得真實突破，更有力地解決了年初縈繞在產業內的焦慮：具身大腦“國內缺位”的結論，已經成為過去式。

作為具身智能大模型不可忽視的玩家之一，千尋智能的技術迭代與生態布局始終精準發力：從Spiritv1率先突破柔性物體處理難題，攻克復雜長序列任務，實現從疊衣服到辦公室整理的場景落地；到Spiritv1.5升級強大跨任務、跨本體泛化能力，適配真實場景的連續任務執行，同時達成操作目標與結果的穩定精確控制；再到通過開源釋放技術紅利，降低開發者復現與落地門檻，助力產業生態繁榮。

這套“技術突破+開源共享”的組合拳，迅速引發海外知名人士高度關注。英偉達具身智能負責人Jim Fan（范麟熙）主動點贊、Hugging Face官方發文祝賀，多位海外行業大V紛紛轉發。

更為關鍵的是，千尋智能的模型能力并非是“視頻僅供參考”，而是已經過真實場景中的嚴苛審視，能成為真正的生產力。前不久，寧德時代官宣千尋智能的moz1已經成為生產線一員，在電池生產線上完成相應的工作。

可見，千尋智能在“基礎模型”側的投入，不是在秀“花架子”，而是始終回答外界對于具身智能的靈魂拷問：什么時候才能成為生產力？

而這個答案就藏在千尋智能的蛻變路徑中。

RoboChallenge榜單由Dexmal原力靈機、Hugging Face等全球知名機構聯合發起。通過全方位還原真實場景的統一測試，檢驗模型處理真實工作任務的能力。這有點像馬拉松之于本體結構設計的極限測驗，RoboChallenge也在一定程度上解決了具身模型難有對比基準線的困境，更直觀地讓外界感受各家模型的真實應用能力。

RoboChallenge榜單除了總分之外，還有30個桌面操作任務的Table30，通過單臂、雙臂的操作表現，多維度考察VLA的實際應用能力。例如長序列復雜任務的完成情況，以及新任務在多構型的遷移效率。

由此可見，這是一個具身模型“拉出來溜溜”的平臺，成績也不是千尋智能的“自說自話”，而是真的在模型能力上超過了最強（過去式）模型Pi0.5。

從桌面插花、清理等任務表現來看，Spirit v1.5都能從容應對精細化操作，也沒有出現失誤導致的宕機情況。（pi0.5抓取紙盒失敗后，不再執行任務，而是轉去和紙盒“玩”）

尤其是在桌面清理任務上，該任務的桌面隨意擺放著不同尺寸、不同形狀、不同材質的極易形變操作物體。透明的塑料瓶、碗碟、亂糟糟的紙巾每一項單獨抓取放置都是對模型的較高難度考驗，而Spirit v1.5并沒有被眼前的陣仗打敗，依舊有條不紊地將桌面垃圾分別收納進垃圾桶或桌面上的整理箱中，還不忘貼心的和人類習慣一樣，把小碗疊起來放置。

Spirit v1.5執行桌面清潔

從雙臂協同執行來看，這是目前模型能力難度較高的操作，雖然實驗室場景下的固定任務規劃（如預設軌跡的組裝）容易實現，但真實場景中物體的擺放位置、形狀、材質存在不確定性，模型很難泛化出通用的協同策略。此外，連續任務中的子任務銜接（如從“抓取物體” 到“放置物體”的過渡）也容易動作中斷或卡頓。

受限于“感知-決策-執行”全鏈路的高精度協同門檻，雙臂協同類任務是評測榜單最難攻克的賽道。在物品整理任務中，Spirit v1.5做到了一邊固定透明塑料盒的位置，另一邊掀開蓋子，再將盒子中的薯條倒進盤子中。（Pi0.5止步于拆蓋環節）

Spirit v1.5執行桌面清潔

最考驗極限操作的貼膠帶任務中，由于操作空間非常狹小，且對雙臂協同和觸覺感知反饋要求高，經常出現難以完成的狀況。但Spirit v1.5依舊能完成撕膠、貼盒的雙機械臂精準配合全流程任務。

透過具體執行任務來看，Spirit v1.5在RoboChallenge榜單上的亮眼表現，標志著具身智能模型已實現從“實驗室演示”到“真實場景可用”的關鍵突破。

其在多任務、多場景下的穩定執行，證明千尋智能的模型技術成果并非依賴“溫室環境”的紙面實力，而是具備在辦公室整理、倉儲分揀、電子組裝等多場景落地的潛力。

Spiritv1.5是已經在多個現實場景中驗證過的，千尋智能Spiritv1基礎上進化而來的“新面孔”。

其創新性意義在于以“做有用的事”為核心原則，走出一條全新范式。將聚光燈陰影下的“非干凈數據”推到臺前，摒棄絕大多數入局者保證數據“干凈”的原則，杜絕“腳本式”數據采集。（技術博客見文末)

聽起來很抽象，但卻是一個值得深思的范式。

首先，千尋智能認為“干凈數據是打造卓越具身基礎模型的敵人”。誠然，將絕對干凈、任務流程操作、客觀環境、操作物體擺放位置都十分完美的數據拿來訓練模型，是模型操作能力穩定性的前置因素。但真實世界的魅力和難點正在于一切都不可預設，無論是光線還是操作物體都存在巨大不可控因。

例如，干凈數據天然受制于多樣性和可擴展性。高度標準化的數據采集模式下，根據腳本走的數據采集員只能遵循既定指令。通過一個具象化案例可更直觀的感受到，在“擦桌子”任務中，這類數據集只會機械收錄標準化的擦桌動作與桌面場景，與桌面關聯任務完全割裂，最終形成的是一個個彼此孤立的經驗孤島，而非能夠映射真實生活的連續經驗流形。自然無法捕捉現實場景的豐富性與復雜性。從可擴展性瓶頸來看，每一個新場景、新任務的數據集構建，都需要工程師團隊從零開始設計任務流程、撰寫詳盡的采集指南，還要投入大量精力進行數據篩選與質量校驗。

可見，吃慣了“細糠數據”的模型，難免在真實世界中出現“有心無力”的操作。

這正是Spiritv1.5突破的關鍵點，其選擇充滿隨機因素的數據訓練，在數據采集階段就開始規避指令式操作，在目標任務之下，由數據采集員自行決定子任務的流程。其帶來的結果是機器人體驗現實生活中的一天，而不是高度腳本化的演示片段。

于是，這便不僅是單一動作的重復，而是記錄了技能的連續流，機器人不再是孤立地學習如何執行特定動作，而是學習整套技能及其連接方式，使模型知識更加通用。（有點像會認字和會寫作文的區別）此外多樣化數據采集讓提高了數據采集員的參與度，有效提升了效率。數據顯示，人均有效采集時長增加了200%，并將對算法專家的干預需求削減了60%。

從結果來看，使用多樣化采集訓練的模型（B組）在微調階段的表現優于演示驅動采集（A組）的模型；多樣化模型達到相同性能所需的迭代次數比基線模型少了40%。

多樣化的數據采集還帶來了Scaling的涌現，除了比較數據類型外，千尋智能還研究了當擴大多樣化經驗的規模時模型的反應。結果顯示遷移效率隨多樣化數據量的增加呈正相關。隨著數據集的增長，模型在新任務上的驗證誤差持續下降。

總結來說，模型實際工作的結果表明，任務多樣性比單任務的演示數量更為關鍵。

畢竟，多樣化的數據喂養出來的模型，不再是動作而是通用策略，可以用更少的步驟適應新任務。這是一種范式轉變，也讓我們看到了具身智能成為生產力的充分必要條件，或許不僅僅是技術本身的突破，還有研發團隊的思考轉移。

模型側推陳出新是千尋智能企業頂層設計的外顯。

透過千尋智能在模型側的進展可見，其似乎有意再走一條深度挖掘模型能力價值的發展道路。

看起來和千尋智能最開始提出的“全棧自研”有些偏頗，硬件能力好像被模型的光環掩蓋。

但實際上，具身智能的本質是AI驅動，硬件服務于軟件模型。通過產業本質來看，千尋智能的今天并非是軟硬“二選一”，而是選擇一種更聰明的方式，從結果導向倒推資源配置。

畢竟真正落地要的是聰明。

而這條路線也將成為千尋智能完成愿景的重要路徑：十年內讓10%的人擁有自己的機器人。

時至今日，這句愿景仍高頻出現在千尋智能官方公眾號、產業交流論壇、媒體采訪等對外發聲中。千尋智能從未因行業周期波動或技術攻堅難度而動搖。這份對未來的篤定，看似是對具身智能產業發展的樂觀預判，實則并非單純的行業樂觀，而是植根于團隊底層基因與“非經驗主義”發展路徑的必然結論。

這份“非經驗主義”的內核為，千尋智能并沒有單純套用以往的“成功經驗”。其創始人兼CEO韓峰濤曾為珞石機器人聯合創始人&CTO，曾帶領團隊成功交付數十款型號產品超20000臺，具備極強的產品工程化能力，也是具身智能產業中為數不多邁過量產關經驗的領先者。

按照韓峰濤的履歷，千尋智能應該會比現在走得步子更急。但千尋智能并沒有盲目擴大規模，而是深入場景腹地，啃下最難的骨頭，把機器人送上了寧德時代的生產線。

千尋智能聯合創始人高陽也具備極強的模型能力，但其也并沒有躺在“功勞簿”上，而是持續創新。

簡單來說，千尋智能是遵從具身智能產業本身的發展邏輯行事，其每一步都非常扎實。不被過往經驗束縛，不被浮躁裹挾，以模型為核心引擎，以硬件為落地載體，以真實場景為試金石，在工業級應用中打磨技術，在評測中驗證實力，讓模型能力有用武之地，也讓硬件價值得到精準釋放，最終形成“模型引領方向、硬件支撐落地”的正向循環。

而這，正是千尋智能能夠在激烈的行業競爭中脫穎而出，并且有底氣朝著“讓10%的人擁有自己的機器人”愿景穩步邁進的核心原因。用扎實的技術落地，一點點拉近機器人走進大眾生活的距離。

技術博客：

https://www.spirit-ai.com/en/blog/spirit-v1-5

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.