![]()
作者|華衛
“過去是人定義機器人,接下來則是 AI 定義機器人。”在星海圖辦的第一屆全球開發者大會上,CEO 高繼揚與 CTO 趙行首次完整披露了公司具身智能技術路線,提出具身智能正經歷“本能智能—作業智能—進化智能”的三重躍遷。
高繼揚認為,今天機器人的身體仍由人類工程師設計,而未來 AI 將圍繞應用場景與任務,去定義和設計機器人自己的身體。本能智能直接作用于本體,讓機器人像人一樣天然學會駕馭身體,保持平衡、行走、奔跑;作業智能建立在本能智能之上,解決像人一樣有序作業和操作的問題,語言是它的重要接口,星海圖的 G 系列模型正是作業智能模型;進化智能則指向更深的問題:AI 能不能定義最優生產力形態。
會上,星海圖發布新一代 VLA 基礎模型 G0.5 并宣布開源,公布世界模型 Fast-WAM 與全身控制基礎模型,自研雙足人形機器人 Kengo(行客)現場首秀。它身高 1.4 米,以高性能運動小腦與具身大腦為核心,既能完成四連踢等高難度全身動作,也能勝任遞物、搬箱、疊衣等貼近真實場景的雙臂作業。
![]()
不同于大部分具身智能大腦企業從智能開始,星海圖第一天就從整機做起,開辟了輪式雙臂品類。做整機后發現制約性能的關鍵在于動力模組,于是自研動力模組,到今天 80% 的動力單元是自研或與產業鏈共研的。再后來發現光做整機不夠,又決定在 2025 年春節前后啟動雙足人形項目。
同時,星海圖聯合北京亦莊共建的數據公司“亦數智能”正式揭牌,啟動“100 萬小時超高質量真實數據計劃”規劃今年完成百萬小時、未來三年邁向千萬小時。星海圖是行業內最早押注真實數據的公司。2025 年 8 月開源的數據集 GOD 是全球第一個開放場景具身操作數據集,下載量接近 60 萬次。
“在百萬小時到千萬小時之間的數據量訓練出來的具身基礎模型,會帶來非常突破性的改變。”高繼揚算了一筆賬:一個人從 0 到 18 歲,醒著和物理世界交互的總時長約 12 萬小時。也就是說,人的大腦用了 12 萬小時學會了怎么駕馭自己的身體。100 萬小時相當于約 8.3 個人的學習總時長,1000 萬小時相當于約 83 個人。而 GPT 等大語言模型的訓練 Token 數,轉換到具身基礎模型訓練上,大概就落在百萬小時到千萬小時之間。
之后他做出一個明確判斷:依托數據供應鏈與整機供應鏈的疊加優勢,未來兩到三年,中國的具身基礎模型能力有望整體超過美國,拿到世界第一的位置。
![]()
整機、模型、數據之外,星海圖打出的第四張牌是生態。數據生態由亦數智能承載,星海圖還聯合凱輝基金發布創業孵化項目“星途計劃”,面向具身智能早期創業團隊提供資本、技術與場景支持,未來 3-5 年計劃投資 30-50 家企業。"沒有任何一家公司能夠獨自定義具身智能。"
而星海圖所做的一切,都圍繞同一個核心:具身智能基礎模型。在他們看來,硬件與數據都服務于模型,而模型最終要回答的,是機器人如何在真實世界里創造生產力。“具身智能的‘GPT 時刻’可能不會像大語言模型那樣明顯,它的落地過程是隨著能力邊界逐個場景解鎖的。若干年之后回頭一看,原來機器人已經無處不在了,但我們已經記不得是哪一年開始。”高繼揚在演講中表示。
他透露,星海圖的商業模式會發生變化,具體分成三個階段:第一階段整機銷售,第二階段方案訂閱,第三階段 Token 銷售。“此時此刻,我們處于整機銷售階段。隨著智能在一個生產力場景里面解鎖,我們就會進入方案訂閱階段,整機會成為我們的收費入口,真正的毛利來源是方案。隨著我們的智能從單一場景有用走向多場景、多任務通用,我們的收費單元就會從方案轉向 Token 銷售。”
有趣的是,這三個階段背后的增長率不同:整機銷售年化自然增長 30%-100%,這是行業規律;參考過去兩年里一些 AI 公司的爆發,方案訂閱是每年 3 倍到 10 倍的增長;Token 銷售是 10 倍到 100 倍的增長。“前期是研發制造型行業,后期是人工智能行業,中后期是人工智能的規模化服務。我們公司并不追求在第一個階段保持特別大的商業化業績,因為我們覺得那意義不大。我們追求的是從第二個階段開始的、真正的智能驅動商業化。”
演講結束后,高繼揚走進采訪間,與我們就數據、模型、本體與商業化展開了更深層的對話,信息密度極高。
以下為本次對話的現場實錄(經整理,略有刪減):
數據的“100 萬小時”賭局:
一兩億元太劃算了
Q:數據在具身智能落地過程中扮演著什么樣的角色,能不能做成一個標品?比如一個數據公司最終提供給每家應用企業,如果能的話,還需要從哪些方面入手?如果不能的話,是為什么?
高繼揚:首先,我們從理論業務模型、業務模式角度來說是可以的,有一些公司專注做數據,然后把數據做成類標品或者做成數據服務。今天有一個嘉賓過來,海天瑞聲 CEO 李總就是 A 股上市公司,做數據標品和數據服務的,所以從商業模型上來說這個是成立的。但是對于具身智能而言會有一個挑戰:具身智能從整機到數據,或者從數采設備到數據再到模型訓練,這幾件事耦合的太緊密了,很多時候我們發現數據采上來之后這兒有問題、那有問題,就需要算法同學跟數采同學、運營同學緊密結合、交流、迭代,才能把數據質量提上來,不然采上來的數據是沒那么有用的數據。
商業模型理論上成立,但真正業務發生過程又是數據模型和采集設備,采集設備可以是整機,也可以是一套 UMI 可穿戴設備,這三環緊密結合在一起。我們投資了一些數采設備企業,第二我們跟亦莊控股、亦莊機器人、亦莊國投聯合發起公司,他們有很多場景,亦莊能夠打開的場景去采集數據。再配合上設備、EDP 整個數據管線,再配合上我們自己對于要什么樣的數據,因為我們就是訓模型的企業,我們要什么樣的數據特別懂,把這些要素湊一塊,才有可能把剛才說的高質量標品數據集這件事給搞定。
Q:預訓練階段會采用少量的仿真數據,大部分用真機數據,成本上會不會有壓力?
高繼揚:坦率地講,現在的預訓練全部都是真實數據,基本沒用仿真數據,這是現在的一個現狀。未來在很長一段時間里面我們會堅持這一點,到 100 萬小時之前,對于我們公司而言看不到用仿真數據的必要性。原因就在于真實數據可以更快地幫助我們鋪滿剛才說的那四個空間,而且更有效。
我之前一直談一個觀點,不應該只關注數據單項成本,應該關注智能總成本,采數據是為了搞智能,得回到我們的目的。而搞智能這件事,智能總成本分三部分:數據成本和算力成本,還有研發團隊工程師成本。我們先第三部分先去掉,數據成本和算力成本,我們的實踐至少是 1:10,1 塊錢的數據至少 10 塊錢去做訓練才能把它訓明白。意味著,搞 AI 有一個俗話 Gabor in,Gabor out。如果你的數據是不那么 work 的數據進來了,那產生的模型一定也沒什么用。這里面,在數據上量之前一定先把數據質量解決掉,而什么是最高質量的數據?真實數據是最高質量的,真實里面再分真機數據和真人數據:human centric data、robot centric data。
這是我第一層邏輯,關注智能總成本。 第二層邏輯,單向的看數據成本,數據成本到底是多少錢,Human centric data 我們實踐下來是 50-100 元人民幣一小時,根據地區差異還有波動和下浮的空間。robot centric data 遙操作數據,算上人工和各種機器折舊大概是 250 塊錢一小時左右。現在市面上,比如 robot centric data 遙操作數據 300-350 都有,有 10%-20% 的毛利,看他們自己的運營能力。綜合去看是 100-150 塊錢一小時,一個小時的成本、價格,意味著 100 萬小時是 1-2 個億的成本。今天做大語言模型訓練,每年算力支出是幾億美金量級,相比于這幾億美金,這一兩億必須得花,而且太劃算了。
Q:您在會上有講到時間點,今年百萬數據,到三年之后是千萬數據,需要做哪些動作達成這個目標?對應這兩個時間點,我們在下面展廳看到它疊衣服、分揀抓取物品,跟人相比還是很慢,有時候觀眾在邊上看著挺著急的,對于這兩個數據采集規劃時間點,這種作業能力相應會達到什么樣的程度?
高繼揚:對于我們而言,整個行業里面含百萬小時甚至更大規模的公司不止我們一家,挺多的,我們是有實實在在的路徑,這個路徑是:第一,我們和亦莊,亦莊幫我們做了很多事,全域開放數據采集場景包括調配各類資源,因為很多場景,我們作為民營企業想進也進不去,必須得有政府的協助和幫助。所以對于我們來說,我們是依托亦數智能平臺鋪開量。數據都是來自于人,數據量想上去,人的數量肯定得上去,所以這里面會是一個外包采集和眾包采集相結合的模式,眾包采集是生產和生活伴隨式采集,大家日常做什么工作的時候就帶上我們的設備,可能此時此刻就有幾百個人帶著我們的設備在采集,他們在作業或者工作當中的數據,這是生產伴隨式采集。外包形式是我們還會雇一些人,就針對性場景和任務做特殊化采集。兩種模式相結合做一個放量。
這些數據采到之后會給模型帶來什么樣的變化?您剛才提到一個很重要的點,速度問題,如果您再仔細觀察,會發現疊衣服速度比分揀速度要快,很多時候我們看快慢不是一個絕對的事,我們得看迭代。三個月之前疊衣服速度跟分揀一樣慢,經過三個月迭代,經濟調數據、模型訓練上調整,變快很多。所以我們看成長速度,我們認為現在具身基模成長速度要快于一個嬰幼兒學習技能成長速度,所以從這個角度來說我們并不認為這事進展的慢。但是數據量的上升,從技術角度來看,并不直接帶來模型直行速度的提升,模型直行速度與后訓練關系很大.
采集的這些數據解決的是預訓練問題,預訓練解決什么問題?是解決泛化性問題,我要去到一個新場景,接受一個新任務,能不能不用新增數據就能做,哪怕做的很慢,但我就能做,我就理解這件事了,這是預訓練解決的問題。后訓練增補一些特定化的數據,就像我這個工人勞動者上崗工作之前總得再培訓培訓,這個培訓過程就是后訓練,經過培訓,執行速度就上去了,就變快了,這是預訓練和后訓練之間的關系。
Q:現在有一個言論,他們覺得把數據賣到國外,其實是把槍支彈藥遞到對方的手上,這個觀點您怎么看?星海圖在未來數據交易方面有什么樣的策略?
高繼揚:首先對于數據賣到海外這件事,我們肯定從來沒做過,對于其他友商情況不是特別了解。確實是,具身智能數據和大語言模型數據未來會有不一樣,大語言模型數據 99% 都是公開可得的,public data。但是具身智能數據 99% 是 private data,都是私有的數據。更重要的是,很多數據從獲取的那一刻都有很多隱私問題,比如說我們去到研發制造型企業,這樣的企業核心資產之一是工藝,老師傅們的活是怎么干的,這些數據恨不得藏在自己手里。所以數據的安全問題、數據的隱私問題肯定是未來幾年,當這個數據量起來之后特別重要的一個事,只不過現在大家還沒關注到這個,因為現在還沒那么多數據,所以現在這個階段沒那么重要,但未來一定會特別重要,而我們對安全問題和隱私問題特別關注,在符合國家法律法規基準之上做一些市場化的活動,這是我們的準則。
Q:今年是數據的規模化元年,是不是對于內里數據的認知,包括大家對于不同數據的側重也能成為一種壁壘?如果形成壁壘的話,是否傳導到模型包括到真機展示、demo 和場景落地的應用也能一到兩年時間內產生一定的差距?
高繼揚:是的,99% 的 data 會是 private data,所以未來具身智能模型的制高點競爭很大程度上取決于你的數據怎么樣,數據好不好,數據的差異傳導到模型能力的差異,再傳導到應用層面效果的差異,再傳導到商業層面價值的差異,所以我覺得是一個鏈路問題。簡而言之,這個事肯定是會發生的。
“VLA 與世界模型是同源共生,
未來會走向融合”
Q:G0.5 模型開始逐漸應用到操作場景中任務中了,大概會在什么時間節點會應用到 Kengo 雙足上?
高繼揚:如果嚴格意義上探討技術,G0.5 模型架構的設計其實是給雙臂智能或者輪式雙臂這樣的品類去準備的,所以會普遍應用在 R1 Lite、R1 Pro,包括新發的單臂 R1Z。基于 Kengo 主力去發展的模型,比如本能智能模型。再稍微講點技術,作業智能現在是什么?無論是 VLA 還是世界模型也好都是模仿學習為主,模仿學習是主線,強化學習是作料是這樣的感覺,本能智能模型,強化學習是主線,是主要的配料,這里面加入模仿成分。
整個行業過去幾年里面已經呈現出這樣的趨勢,包括英偉達搞的 Sonic 包括跳舞用的 Mimic 這類算法都是強化學習框架里加模仿學習,最終具身智能答案現在世界上沒有人知道,但是這個答案配方無論是強化學習 + 模仿學習某種形式的組合,今天我們看到大語言模型企業是這樣,先模仿再強化。這兩條路徑:本能智能和作業智能最終會有一個融合,到那個融合階段才是把 G0.5 一系列能力帶到 Kengo 雙足產品之上,所以我覺得會有一個過程。
Q:現在媒體有一句話評價星海圖“用具身大腦終結行業有趣無智”,您對此是怎么評價的?您認為具身智能產業競爭的關鍵是在于最快的世界模型大小腦協同還是對自然語言的深度理解?
高繼揚:所有做具身大腦的企業都有這樣的一個目標,通過大腦配合身體,真正產生,真正讓具身智能產生生產力。我們創業最早的時候提過兩個詞,具身智能一腦多形,第二個具身智能在腦不在形,核心在這兒,沒有大腦的驅動,形體是一個破銅爛鐵,沒有什么價值。整個行業要突破一定是具身大腦或者具身基礎模型完成突破,然后帶動整個產業鏈的發展。產業鏈往上是整機、是零部件,產業鏈往下是應用,然后是整個分銷體系。
Q:現在有數據模型,哪一塊是我們最重要的部分或者優勢部分,以及在資源分配上怎么考慮或者怎么規劃的?
高繼揚:戰略上是整機 + 智能,最終目標是釋放生產力量,物理世界生產力只有模型是不夠的,整機也得足夠好、足夠的可靠性、足夠的一致性、足夠的負載能力。對于我們最終產生規模化的銷售和足夠高的毛利率來說,整機和智能缺一不可。在這兩件事上,我覺得很難講誰就比誰一定重要,因為對于最終商業成功都很重要。剛才有三句話描述我們公司:首先我們還是智能大腦企業,然后我們很重視硬件,整機 + 智能,然后我們的整機能力很好很強。是么一個辯證關系。從研發投入上來看,顯然整機研發投入是遠遠低于智能的研發投入,我覺得差一個數量級肯定是有的,差一個數量級吧。
Q:星海圖有圍繞 AI 和數據模型的數據,這兩個模型數據是否通用?
高繼揚:這個問題特別好也特別重要,今年上半年有一些聲音把 WIM(世界模型)和 VLA 給對立起來了,其實我們一直不認為這兩個路線是對立的,它們是同源共生,而且未來會越來越走向融合,為什么這么說?訓練 VLA 也好、訓練 WIM 也好,回到它的底層是什么?就是把一些多模態數據變成 Token,然后通過多層的 Transformer,最后的監督方式、訓練方式不一樣,可能架構有些調整,變成了有一些模型叫 VLA,這些模型初始化的時候用 VLA,一類模型是 WIM,底層都是把輸入數據變成了 Token,用多層的 Transformer 去做編碼,再用某種方式做輸出,然后用某一個方式做監督,其實底層都是這樣的。
從這種角度來說,所有數據都是可以混用的,今天我們去希望訓練 VLM 和 WIM,數據都是一樣。今天我們提到的 human centric data 和 robot centric data 這兩種,robot centric 就是我們的遙操作數據,human centric 包括 UMI 數據、Ego 數據。數據這件事,本質上我們采數據其實是為了能夠鋪滿四個空間或者四個維度: 第一個維度是動作,做什么動作。第二個維度是我操作什么對象,對象維度。第三個維度是場景,在什么場景里做這樣的事。第四個是本體維度。
這么多種不同采集方式是為了更快更有效把四維度不同類型數據全部鋪滿、全部采集到,UMI 數據或者 Ego 數據本質上是什么?每個人男女老少、高矮胖瘦都不同,其實都是跨本體,不同類型本體,可以更快把這個問題解決掉,因為人的形態自如進入到環境里面,成本很低,所以采集效率很高。但最終這個機器人,模型還是部署到機器人本體上,機器人本體形態數據也是需要的,是這些東西的組合,使得我們在四個維度上都有足夠好的數據,大概是這么個邏輯。
走向 Token 銷售,未來潛力是
改寫 GDP 結構
Q:大會上看到星河圖具身智能商業模式從整機銷售到未來方案訂閱、走向物理世界的 Token 銷售,宇樹去年已經營收 17 億了,包括他們的人形機器人將近 6 億營收,是否意味著整個商業模式有利差了,將來如果走向 Token 訂閱,需要一定的裝機量,怎么去跨越這個門檻呢?
高繼揚:首先整個行業在今天這個階段,我們看到的幾乎所有銷售全是以整機為中心的銷售,大家沒有說哪個方案提供了生產力,因為這個方案的能力,所以這個東西銷售出去了。今天成熟市場是兩個:一個是開發者或者科教研這一類的,第二類是表演娛樂這一類的。顯而易見,剛才說的,宇樹一定在展演娛樂市場里面遙遙領先,這是事實。
第二個階段商業模式是面向生產力的場景方案訂閱。生產力場景,我們看到現在沒有任何一家企業真正有效地在生產力場景里面有效作業,這個市場大小是前面科教研開發者市場和展演娛樂市場幾萬倍的規模,本身這個市場在重寫 GDP,今天所有 GDP 背后其實都是某種形式的生產,不存在有身位差,真正的星辰大海還沒有展開。我覺得是這么個邏輯。
Q:Kengo 發布以來,產品公開參數并不是很多,關節模組方面是否有一些亮點和特別之處?它是一個萬元級的人形機器人,現在人形機器人卷價格,您認為是怎樣的價格更適合于商業化和成本控制?這是星海圖第一款雙足人形機器人,相對于其他人形企業來說晚一點,你對它的期待是什么,之后商業計劃是什么?
高繼揚:我們這個關節模組,很多和我們一起做的產品的產業鏈伙伴今天來到了現場,包括一起做電機、齒輪、檢測器的、殼體的等等。從具體設計來說有兩個特點,一個是整機通信全部是 EC 通信,行業里面有 Can 通信、485 通信,我們是整機 EC 通信,好處是同步性非常好,EC 通信是所有技術方案里通信最好的,但研發難度高一些,為期做好 EC 通信就會做好中空設計,因為 EC 通信對線數要求比較高,為了做好中空的設計,你在你的電機、電磁仿真、減速器設計上要做很多調整和優化。在整體性能方面,我覺得我們這個模組是行業最領先的第一梯隊的性能狀態。
整體來說,我自己認為,整機和供應鏈是一個有限游戲,智能和應用才是無限游戲。這里面有意思的點是,如果不玩好前面的有限游戲,是沒機會玩好后面無限游戲的,我們花很多時間和精力去做自己的整機和供應鏈,目的還是為了做后面的智能和應用,這是真正的目的。
現在無論是做 Kengo 這樣的雙足還是做我們 R1 這樣的輪式雙臂,包括我們、包括行業,我相信部分已經做到了,有些可能會在今年做到,有些企業會稍微慢一點,但最終這些產品的成本會穩定在 1 萬美金左右,也有可能會更低一點,這個價格區間未來兩年左右時間,是很確定的供應鏈達到的成本。但這個成本并不決定了它的商業化能力,它的商業化潛力來自于它的大腦,它能干什么活、能干什么事。
這件事一旦打開之后,給大家算賬,發達國家市場勞動力的價格是 4-5 萬美金一年,算上各類成本,如果一個產品硬件 1 萬美金,假設回本周期是一年,還有 3-4 萬美金的空間,這 3-4 萬美金空間是給誰的?是給智能的,智能如果能夠完整一個崗位(不是一個人)意味著我們可以把這 3-4 萬美金打開。行業打開,整機和供應鏈是有限游戲,智能和應用是無限游戲,為了玩這個無限游戲,得先把這個有限游戲搞好。但是真正的空間打開還得看智能、看大腦。就這么個邏輯。
Q:無限空間生產力場景是不是在工業領域?如果是的話,星海圖未來主要聚焦的市場是不是就在工業領域?在您看來,工業領域市場空間會有多大?
高繼揚:首先我覺得我們公司不會局限在一個子市場里面,我們在商業化上面或者應用上面總概括是“從開發者到生產力”,生產力無處不在,我們的產品也會無處不在。落地的過程是一個循序漸進的過程,第一步,我們現在是厘米級別進度,厘米級別進度能應用到哪里?是工業里面的上材料、搬運,物流里面的分揀、共包、分包,電商零售里面的揀選和打包等等這些環節。隨著操作精度的上升,制作業里面更多場景,裝配、線數、插拔、檢測這些全部打開,毫米級別的進度。人的操作精度有三個檔次厘米、毫米、0.1 毫米,外科大夫是 0.1 毫米的,大部分人是 1 毫米,我們能控制自己的指尖精度是 1 毫米。
再往未來看,制造業只是一個開始,農業、建筑業都是未來具身智能可以去改變的行業。我們這個行業特別好玩的一個事,上游是我們的下游,下游也是我們的上游,具身智能是未來中心性產業,所有行業都可以和具身智能產生上下游的往來和關系。未來真正的潛力是改寫 GDP 結構,而不是簡簡單單的做一個表演或者做制造業里面某一個具體工作環節,這都不是它的真正未來。
Q:如果之后搭載了本能智能模型,接下來落地的場景是哪些?
高繼揚:具體銷售策略,還是由商務團隊和整個直銷、競銷體系去發布,今天現場也來了很多銷售方面的伙伴,我就不展開說價格包括銷售策略了。我可以說一下我們本能智能未來會怎么發展。本能智能最初級階段是強化學習,現在能干啥?跳舞,跑跑跳跳,走一走,就干這個,它商業化展示、展演,可能有些通過租賃方式完成這樣的銷售。隨著模型能力的提升,下面會有一個很重要的模型能力,我們認為是全身遙操作,Human Tracking,這事是很重要的。如果這個事形成現實,相當于每個人都有自己的遠程化身,我就坐在辦公室里面全身遙操,另外一個人在邊緣電站里頭、儲能站里頭,這樣的應用就會解鎖。
但模型的作業能力顯著差于作業智能系列的模型,更多還是行作業這類巡視,輕作業這類場景。再隨著技術發展,會跟我們的作業智能逐漸融合。當和作業智能逐漸融合的時候,就進入到非結構場景里面做一些不是輕作業的,而是重作業的事,操作各種各樣的物體、開門、關門都可以做了,進入到制造業、建筑業等等,是這樣的過程。在結構化場景里面,80% 的環境都還是結構化場景,基本上都是經過人類改造的,比如我們這個是平地,在平地上有必要是雙足嗎?意義不大,還很吵,輪式挺好的,所以結構化場景里面大部分是輪式雙臂品類去解決問題,這是我對未來的看法。
Q:您剛才提到第一階段整機銷售階段不需要大規模商業化,但我們看到行業內有些公司會說自己做到 10 萬臺的下限或者說會在工廠做一些落地的展示,以及簽一些大額的工業場景的訂單,我不知道這是不是屬于行業內現在商業化被資本強行催熟的一個現狀,以及您覺得現在行業里頭有哪些商業化落地不符合當前實際情況或者技術能力的?
高繼揚:商業化這件事是不是大規模,大和小是相對概念,相對于什么是大、相對于什么是小,我們找的相對還是要回到規律,行業發展的規律,你超過了這個行業發展的規律,那個叫過度。我們認知的規律是什么?還是我們那個策略,從開發者到生產力。這個模型沒有那么強生產力的時候,生產場景強行去部署一定是給你退回來。現在價值有用,很明確的就是兩個市場:今天此時此刻的開發者市場和展演展示市場,這兩個市場都是商業驅動的,其他是各種因素驅動的。如果做了太多那樣市場的事就是過度,所以那種事我們可能會比較保守。
但是在我們認為已經打開的好市場方面我們會很激進,開發者市場全球幾百個客戶,我們在北美、新加坡、日本、韓國、歐洲、波蘭、德國、法國都有我們的客戶,國內幾乎每個省份都有我們的客戶,在這樣的市場上我們又很激進。其實我們商業化做的挺好、挺猛的,但我們還是遵循整個產業成熟的規律,而我們相信的規律是什么?是從開發者到生產力逐漸成熟的,任何一個產品在過早階段拔苗助長,最后導致的結果都不會特別好,因為價值不夠,肯定是別的都是湊出來,最后導致的結果是客戶不滿意、團隊也很累很拉扯,供應商也被牽扯的很厲害,我們一直講堅持做正確的事,正確與否來自于這件事的事實是什么,發展規律是什么,回到這些東西上去判斷此時此刻應該做什么。
Q:今年一季度有一個統計,具身行業融資了幾百億,不可避免,大家可能會提到泡沫問題,您怎么看待這種現象?星海圖未來也會做投資,在這個環境下怎么去做一些務實的決策,無論是投資領域還是自己的公司?
高繼揚:明白,泡沫這個問題是經常討論的問題,任何行業發展都伴隨著泡沫,或者任何新事物發現都是泡沫,是人們對一個事物發展無法做出精準預測,所以有的時候給出了過高的階段性估計,然后這個估計大于結果的時候就是大家認為的泡沫。這事一定會出現。贏家往往在泡沫膨脹階段和破滅階段都可以獲益。對于我們公司來說,現在還在泡沫膨脹階段或者一個已經比較頂峰的階段,我們通過這個階段獲取優質資源,大家的注意力,大家投入進來的資金其實都是很好的資源,我們希望能夠和大家一起去把這部分優質資源整合在一起,把這事給做起來。
同時,我們時時刻刻去關注著資本市場什么時候會有下行,什么時候大家對這個事要開始驗成果了,這件事一定會發生,我們做好準備的是什么呢?我們公司有一個價值觀:“務實創新”,為什么創新之前一定加務實?解決問題的創新才是創新,天馬行空對企業來說沒什么價值、沒什么意義,保證所有資源往這個去投,圍繞著我們的智能主線(本能智能、作業智能、進化智能)去投入,其他小算法不投入,留給學術界去投入。在整機上聚焦這幾類整機,同時和合作伙伴自研、共研,這就是我們的研發主線。在商業化上,從開發者到生產力,堅定的按照這個規律去做,不要過度的追求不符合這個階段的商業化。其實很多時候過度追求不符合這個階段的商業化,不是資產,而是負債。把所有這些事都做好。
如果大家看我訪談,我很喜歡曾國藩“結硬寨,打呆仗”,我覺得做很多事情都是這樣,沒什么捷徑,沒什么巧思路,我們知道自己不知道,也知道自己什么知道,知行合一,正面推進,一步一個腳印往前去走。
Q:您剛才提到數采成本百萬小時,2 億,訓練幾億美金。這個數字規模是一天的規模還是 2-3 年的規模?它對于現在融資節奏來說是遠遠還沒有達到融資泡沫還是說融資還不夠?
高繼揚:數據采集這件事,剛才我講的,為了采到 100 萬小時的數據,可能投入在 1-2 億人民幣。如果一年采到這個,今年就花這么多,兩年采到這個是兩年一共花這么多錢。不同企業節奏不一樣,我們的目標剛才也說了大概是什么樣的節奏推進這個事。第二個,成本和融資。現在投入企業幾十億都融了,這一兩億花得了,問題不大。而且數據這事本身還有社會化資本、政策性資金可以撬動的,所以數據這件事不用特別擔心,接下來這一兩年肯定就解決了。
Q:成本會不會太高了?
高繼揚:我們思路一直比較清楚,支出路徑和融資路徑是兩件事,融資路徑是什么?融資路徑是,首先你無法改變資本市場客觀的變化周期,你只能利用資本市場上行時多搞點錢,能融錢多融點錢,這是大部分比較理性創業者都會采取的策略。另外一個是支出策略,具身智能這個行業背后的驅動力是什么?這個驅動力是 AI Scaling Law。什么是 Scaling?Scaling 今年是 1,明年是 5,后年可能是 30,再往后是 100,這叫 Scaling,也有可能今年是 1、明年是 10。什么不是 Scaling?今年是 1,明年 1.2,后年 1.4,這不是 Scaling。我們的節奏是 1、5、20、100,這么上去了,這是數據節奏,意味著支出節奏也是按照這個規模放大的。傳統風險投資,融完資一看,我賬面上的錢有 1 億美金,一年花 2000 萬美金,按照五年去發,這是傳統模型,這個模型在 AI 這兒不 work,因為 AI 的驅動力是 Scaling Law,今年花 1000 萬美金,明年就花 1 億美金。所以這是兩條路徑:融資路徑和支出路徑,兩件事。
聲明:本文為 AI 前線原創,不代表平臺觀點,也不構成投資建議,未經許可禁止轉載。
會議推薦
AICon 上海站 9折限時返場,立減580,截止618!更多詳情可掃碼或聯系票務經理 13269078023 進行咨詢。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.