網易首頁 > 網易號 > 正文 申請入駐

對話杭州六小龍群核科技:目前視頻生成工具,臨近GPT3.5時刻

0
分享至


群核科技董事長黃曉煌

2025年,同Agent一樣火的概念是“空間智能”。AI教母李飛飛稱,空間智能是AI的下一個前沿。國內群核科技,一直在空間智能領域有很大投入。

12月9日群核科技2025酷+大會結束后,CEO陳航和董事長黃曉煌以及負責AI產品的龍天澤三人一起接受媒體群訪。

因為一直在三維世界深耕底層能力,如渲染引擎、GPU超級計算,基于底層能力上的軟件產品也大多服務B端客戶,以至于讓群核科技不被外界熟知。實際上,群核科技同深度求索(DeepSeek)、宇樹科技等公司并稱為杭州六小龍,成立10余年來已獲得十幾輪融資。

陳航和黃曉煌是浙大竺可楨學院同寢室的舍友,兩人畢業后均赴美留學,黃曉煌還短暫在英偉達任職過。2011年兩人回國創立群核科技,黃曉煌擔任董事長,陳航出任CEO。

在這次大會上,陳航提出一個觀念,當AI開始邁向三維世界,需要空間智能的“賣水人”,而群核科技開放底層能力,要成為空間智能的“賣水人”。

從二維世界進入到三維世界,AI進化的最大問題是缺失高質量、結構化的物理世界數據。我們了解到,過去十余年,群核科技3D空間的數據呈現出指數級的增長,目前已經有超過5億個3D場景。這個龐大數據集,對訓練垂類模型優勢很大,但對通用空間大模型的訓練而言,還只能算是毛毛雨。

“空間智能,如果以ChatGPT的發展演變比較的話,還相當于GPT2.0 或者2.5的時代,這其中最關鍵的還是數據問題!比汉丝萍嫉氖紫茖W家周子寒告訴我們,和大語言模型不同,網絡上現成的數據很多,而空間智能適用的存量數據遠遠不夠。

從GPT2.0到GPT3.0,大模型參數量從15億漲到上千億,有百倍的增長。而對于更前沿的三維數據,想要實現模型拐點,需要多少數據集完全是未知。

群核科技的路線演變,朝著一個更有野心的方向。借助Aholo平臺,把更多的底層技術能力開放給生態伙伴,匯集更多的3D數據,反哺給空間大模型,不斷提升性能,從而形成一個閉環或者數據飛輪。

相比以往,群核科技還有一個新的變化,將業務從面向B端客戶的SAAS軟件,延伸到C端。比如此次發布的LuxReal視頻生成工具,和當前市場上的視頻生成工具不同,它們依托底層物理空間的技術能力,實現3D建模,相當于為視頻里的主體一致性多構建了一道防護墻。

因此,LuxReal生成視頻里的主體在360度旋轉,或者做一些復雜動作時,肉眼察覺不出主體有任何變形。從最早推出家裝設計類工具酷家樂(海外版COOHOM),到現在的LuxReal,群核已經有4、5個主要產品。黃曉煌說,無論哪個產品增長更快,對平臺和底層能力的需求,都會引發快速增長。

以下是包括白鯨實驗室在內的多家媒體與群核科技的對話,為了方便閱讀,內容做了精簡處理。

01

空間大模型是世界大模型的解法

問:現在空間智能是大家非常關注的話題,你們如何定義空間大模型?它和世界大模型的區別是什么?

龍天澤:現在討論比較多的一個是世界模型,一個是空間大模型,兩者有很多的共通之處,像世界模型,大家有各種不同的解法,我覺得空間大模型是世界模型的一種解法。有一種流派的做法是,用前面幾幀的圖片來推測下一幀的圖片,這里面還沒有太多空間的概念,而是靠一個物理世界運作的邏輯。

這或許有點抽象。人類對于世界的理解,不是基于眼睛看到的東西去做推測,比如說人看到一個水瓶被扔了出去,可以精確預測到它被拋出去后的軌跡,這是依靠大腦直接推理出來的。

另外一個流派就像我們做的,先把三維重建起來,把各種物理模型模擬出來,恢復水平的物理信息,然后它被扔向空中后,怎么自由落體,都是根據物理規則算出來的。

這兩個流派的做法不太一樣,但都屬于世界模型的一種。到底人類是怎么理解物理世界的,這也是學術界和工業界都在探索的方向。人類理解世界,肯定不是數學公式算出來的,最終機器人用哪一種方法,其實兩個流派都在摸索。

:你們一直強調物理世界正確,擔不擔心未來通用大模型,通過暴力學習把物理世界學會了?

黃曉煌:這是個很好的問題,我不排除這種暴力方法能學會物理的一致性。之前也一直說,我們更多是生態的一份子,大家都在推動解決這個問題,就像我們內部也會調用視頻生成的大模型一起解決問題。

如果突然有人發現某個方法可以解決一致性問題,同時又能解決生存問題,高效訓練的話,大家都用那個方法做就好了。我們創業挺多年,方法一直迭代,之前認為不可能的事情也逐漸變得可能,其實非常樂于見到類似像Sora(OpenAI)這類公司,用暴力方法解決所有問題,我們直接調用就行。

龍天澤:之前我們內部一直在討論這個問題,答案是像Sora這樣的視頻模型,一定是會越來越接近物理真實的。但這里面涉及到第一性原理問題,我們不認為這種視頻模型能從二維中學到三維的東西。

簡單的物理場景下,算法會越來越能夠實現一致性,所以有可能就不需要3D了。但群核的優勢在于,現實世界一定不存在復雜的3D硬件和市場需求,而這些就是我們去滿足的場景。

數據是有天花板的,文本模型現在已經遇到數據天花板,視圖模型遲早也有這一天。而當全世界所有的視頻都拿來訓練一遍后,會發現它的物理規律很難再往上走一個臺階,這時候就是我們的優勢。

空間模型和語言模型,有人認為語言才是攻克AGI的重要路徑,有人可能會覺得是空間才是最重要的。你們怎么看?

龍天澤:李飛飛為什么會提出世界模型才是AI時代的下一個技術前沿?本質上,她認為這個世界的建模不是通過語言建模,而是通過三維空間去做的建模。這是第一性原理。

從技術上看,語言模型和空間大模型的技術并不沖突。大語言模型里的token在空間里變成提速信息,如果把訓練數據換成提速信息,它就是一個新的空間大模型。其實在這里面算法可以遷移,只是訓練數據會有不同。

02

未來可能10臺機器人服務一個人

問:現在群核的客戶里有一些掃地機器人,想問一下具身智能行業客戶情況怎樣?

黃曉煌:掃地機器人是我們客戶里很小一部分,因為國內掃地機器人公司也就幾家。我們很多的合作,大部分還是服務工業機器人,收入預期現在不能聊,屬于靜默期。但我們這方面的客戶目前非常多。

:一個中型具身智能的公司,會產生多大的需求?

黃曉煌:就這么說,機器人要學會在房間里搬椅子,起碼要有10萬個方案的訓練,就干一件事情,你想想日常你要干多少事情?

:怎么理解這10萬個方案?

黃曉煌:比如說一個方案1000塊,10萬個方案,光買這個方案就要花一個億。

:你們很多產品已經在行業里得到了應用,面臨的挑戰是什么?

黃曉煌:我們仍然處于行業發展的初期,有各種各樣挑戰,有法規問題、技術問題,也有合作問題。

如果具體一點,機器人行業的挑戰是算法沒有形成共識,中國團隊可能更傾向于真實數據,歐美團隊更傾向于大量的合成數據。我們也沒有辦法改變大家對于正確做法的認知,也不確定誰對誰錯。

但是我們能做的就是,讓技術更好地去滿足兩者的需求,比如服務中國的客戶,盡可能的采用重建技術,服務國外的客戶就用生成技術。這兩者用不同的方式去實現。

現在有種比較主流的說法,具身智能的訓練數據來自數字世界和真實世界占比是9:1。

黃曉煌:我們有的客戶是用9:1的配比,但這里面隨著技術的變化,配比也一直在變化。就像陳航(群核科技CEO)今天講的3D重建產品,不斷在縮短數字世界跟物理世界的信息差距,數字世界里的數據盡可能接近于完全真實的世界。

這也是我們努力的方向,我相信,數字世界里面的訓練占比還會繼續提升。

工業智能在全球AI界都非;馃,在可預見的未來,空間智能會長成什么樣子?它會成為互聯網下一代的水電煤嗎?

黃曉煌:我前段時間在烏鎮大會上也說了,未來可能會由10臺機器人服務一個人。這時,機器人不僅需要理解物理世界,還要能在復雜的物理世界工作,空間智能會非常關鍵,變成類似水電煤的基礎設施。

但多長時間能夠完全落地,讓這些機器人能很好地服務一個人,這個時間不好預估。但我覺得未來肯定是往這方面發展的。

:群核獲得的數據更多是室內的空間數據。相對來說,室外的空間數據獲取相對簡單一點,但是LuxReal生成視頻是全場景數據,這個問題是怎么解決的?

龍天澤:這里其實有兩個角度,第一個角度是對比一下同行,目前同行的數據集我印象里都是小幾萬,或者是小幾十萬的級別。但我們第一版3D場景是104萬,對外官方口徑是4.41億個3D模型(相當于最小的物體單元),其中可訓練的數據至少能有幾千萬,所以第一版104萬數據集,暫時沒遇到不同行業不同場景的分布問題。

未來假設我們拓展到千萬級別場景的數據,的確會遇到剛才說的問題,可能我們的數據更偏室內,室外場景怎么解決。

第二個角度是,3D世界跟其他不同的是材質表現。舉個例子,木紋在室內是地板,在室外就是木頭,這對于3D而言,材質其實是一個更基礎的訓練信息,而模型訓練使用的室內數據,其實已經包含了大量室外所需要具備的材質信息。室外3D資產的材質,我們室內數據也是有的,只是分布會有一些不一樣。

從以上兩個角度看,我們本身龐大的數據池,可能是一個斷崖式領先的數據量。因為3D和材質的這種屬性化差異,使得這種按行業或者場景劃分,并不一定是最科學的方法,反而不會成為我們的瓶頸。

03

當前的視頻生成工具接近GPT3.5時刻

:跟Sora相比,你們新發布的視頻生成工具LuxReal的獨特競爭優勢是什么?

龍天澤:我們開拓新產品的起點有兩類,一類是從技術本身考慮,一類是從商業角度考慮。LuxReal是基于技術第一性原理考慮的。舉個簡單的例子,比如現在為什么會有transformer,是因為上一代的循環神經網絡底層有根本缺陷,現在的視頻算法,其實像是在二維像素層面去模擬三維空間。

我們會認為,如果現實世界有高保全需求還原的場景,3D重建一定是必不可少的一步。所以LuxReal的初心是,如何用三D重建模態提升視頻的一致性,比如像電商營銷、短劇,我們這個技術出來了以后,去找市場上的垂直商業節點。

跟Sora的區別是,我們完成了真實的3D建模步驟,那意味著可以更好實現空間一致性,因為3D本身就是空間一致性的。而現有的一些產品主要靠視頻模型去控制,視頻模型的原理是在每一幀連續的運行下去猜下一幀,才能保持空間一致性。從技術上看,一定是有了3D建模加持的視頻生成模型,才能在一致性上更具可控性。

舉個極端例子,Sora如果開源了,我們馬上能把Sora的能力也調過來,基于我們的3D建模做出比Sora更棒的視頻。所以我們跟市場上友商的關系是,若他們愿意把API或者跟底層的一些接口能力開放出來,和我們的3D管線做嵌套對接,完全可以合作生成一致性更好的視頻。

:現在市面上的視頻生成工具生成時間比較短,從時長上看挑戰是什么?

龍天澤:目前生成時間其實取決于GPU的顯存,算法參數量的大小。當下因為我們聚焦的場景,比如說是某些短劇和營銷視頻,單分鏡生成時間大概是5~6秒。我們是一個智能體,會基于一個需求先生成故事,然后生成不同的分鏡頭,最后拼在一起。

整個過程還能加入語音、音樂等,最后時長可以自定義10秒、20秒、30秒,但單分鏡大概上限是6秒左右。

LuxReal,如果對比現在的語言類模型,它處于一個什么樣的階段?

龍天澤:LuxReal是多種算法能力疊加在一起,所以如果按商業落地性來說的話,相當于達到GPT3.5,接近商業化可落地的拐點。在我看來,至少在某些垂直營銷領域接近這個時刻,已經可以從所謂的一個創業demo,變成一個真正可以端到端交付的營銷視頻產出。

:你們已經推出多個產品面向市場,為什么還要做一個Aholo開放平臺?

黃曉煌:我們其實最核心的是空間智能的能力,包括渲染、空間的理解、生成這類的算法,原來是放在內部,這次把這些能力開放出來,通過Aholo平臺,像酷家樂,或者今天發布的LuxReal等這類產品,都是建立在我們的核心能力上面。


群核科技Aholo空間智能開放平臺全景圖

這些產品哪一個成長得更快,我們不確定,但對底層能力的需求以及增長一定會很快。

:Aholo開放平臺延伸為空間重建、生成、編輯和理解,這幾類產品現在市場需求情況如何,主要壁壘在哪?

黃曉煌:目前我覺得壁壘體現在幾個方面,一是從技術難度上看,肯定是空間生成和空間理解,技術難度是高的,要說誰最高我也不確定。這兩個技術難度的天花板都非常高。

空間的重建,目前看需求大,技術壁壘暫時沒那么高。因為我們在宣推重建時,更多的是解決過去大家爭論的,真實世界和數字世界的數據之間有gap。有了重建,這個gap就小了很多。

它的難點不在于算法本身,而是經營難題。你要能支持市面上各種各樣的硬件。因為各家機器人企業的硬件設備都不一樣,可能有成百上千種,每一種的數據格式和形態都不同。能不能把每一種形態都順利支持,建立一個數據互聯互通,這可能是另外一個難題,我們也在解決。

問:你們自稱是一個拿著錘子找釘子的商業模式,剛剛開始去做酷家樂,一直到現在推出了一個工業AI孿生平臺,這種看起來成熟的打法,在你們內部是怎么確定的?

黃曉煌:工業AI孿生平臺SpatialTwin這種產品,我們很多年前就想過要做,但有礙于技術或市場條件,一直沒推出來。很多時候都是外部環境變化了,憋了很多年的技術突然就可以上線了。

技術變化是可以提前被預見的,而市場變化則是無法預料的。就像去年發布會上,我絕對不知道今年的人形機器人、DeepSeek會這么火,社會變化太快了,至少我們還在牌桌上,也沒有miss時代的機遇。

我們一直兩條腿走路,一個前沿技術研究的團隊在做技術探索,錘子始終在找釘子到來的機會。當釘子因為技術演變到了這個節點,我們就會快速跟上,這是中小廠的特點。它可以小步快跑,迅速迭代,可以先用市場來驗證,再繼續往前去走。

撰寫|劉培

編輯|吳尋

「白鯨實驗室」原創文章

轉載、交流、合作請添加微信:liujiaquan2025

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
再見了CBA?徐昕已被美國球隊高薪挖墻腳:年薪有望超過2000萬?

再見了CBA?徐昕已被美國球隊高薪挖墻腳:年薪有望超過2000萬?

籃球快餐車
2026-05-08 00:46:53
關于軍購案,黃智賢向季麟連開火,鄭麗文正式交底,不簡單

關于軍購案,黃智賢向季麟連開火,鄭麗文正式交底,不簡單

阿腩講娛樂
2026-05-07 17:04:15
女子川西徒步遇難:全過程曝光,隊友恐擔責,網友怒斥不值得同情

女子川西徒步遇難:全過程曝光,隊友恐擔責,網友怒斥不值得同情

智慧生活筆記
2026-05-08 11:37:52
全身愛馬仕的馬筱梅生完孩子卻改穿三百塊抖音套裝

全身愛馬仕的馬筱梅生完孩子卻改穿三百塊抖音套裝

小邵說劇
2026-05-08 14:12:34
阿斯麥CEO慌了!ASML遭中方禁售,臺積電拒購2nm光刻機,反制猝不及防

阿斯麥CEO慌了!ASML遭中方禁售,臺積電拒購2nm光刻機,反制猝不及防

Thurman在昆明
2026-05-09 01:00:31
演員張頌文片場收工后,將粉絲贈送的茶葉原路退回,并叮囑“你們自己工作掙的錢給自己和家人花,我收收你們的信就好了”

演員張頌文片場收工后,將粉絲贈送的茶葉原路退回,并叮囑“你們自己工作掙的錢給自己和家人花,我收收你們的信就好了”

洪觀新聞
2026-05-07 15:18:54
再見了,塔克!總冠軍+9058萬美金到手,別怪NBA對你無情

再見了,塔克!總冠軍+9058萬美金到手,別怪NBA對你無情

世界體育圈
2026-05-08 14:53:15
一路走好!香港著名填詞人逝世終年60歲,曾為張國榮,鄭秀文填詞

一路走好!香港著名填詞人逝世終年60歲,曾為張國榮,鄭秀文填詞

粵睇先生
2026-05-07 23:56:37
梅西:作為朋友我當然希望內馬爾踢世界杯,但我無法客觀評價

梅西:作為朋友我當然希望內馬爾踢世界杯,但我無法客觀評價

懂球帝
2026-05-08 22:09:49
臺灣地區最新民調出爐,鄭麗文支持率倒數,這下讓蔣萬安撿了漏?

臺灣地區最新民調出爐,鄭麗文支持率倒數,這下讓蔣萬安撿了漏?

共工之錨
2026-05-08 00:16:36
三亞皮皮蝦事件升級!43歲老板身亡,多人威脅店鋪,顧客還有惡行

三亞皮皮蝦事件升級!43歲老板身亡,多人威脅店鋪,顧客還有惡行

不寫散文詩
2026-05-08 15:19:45
月薪幾萬卻招不到人?遠洋海員背后的殘酷,配偶:男女關系太亂了

月薪幾萬卻招不到人?遠洋海員背后的殘酷,配偶:男女關系太亂了

李將平老師
2026-05-08 09:42:27
河南籍演員北京聚餐!一眼望去熟人滿滿,李亞鵬岳云鵬劉震云都在

河南籍演員北京聚餐!一眼望去熟人滿滿,李亞鵬岳云鵬劉震云都在

天天熱點見聞
2026-05-08 04:32:33
OnlyFans女星Annie Knight與Henry Brayshaw婚禮細節曝光

OnlyFans女星Annie Knight與Henry Brayshaw婚禮細節曝光

追星雷達站
2026-05-08 00:19:29
國際足聯終于扛不住低頭了。2026世界杯轉播權報價直接腰斬

國際足聯終于扛不住低頭了。2026世界杯轉播權報價直接腰斬

流蘇晚晴
2026-05-08 20:18:42
文章面館正式開業,免費送汽水喝,馬伊琍帶著兩女兒低調支持!

文章面館正式開業,免費送汽水喝,馬伊琍帶著兩女兒低調支持!

老吳教育課堂
2026-05-08 20:15:22
一眼就歡喜:不只是心動,是久別重逢

一眼就歡喜:不只是心動,是久別重逢

疾跑的小蝸牛
2026-05-08 22:32:10
世體:皇馬更衣室認定,是維尼修斯一直向阿韋洛亞“告密”

世體:皇馬更衣室認定,是維尼修斯一直向阿韋洛亞“告密”

懂球帝
2026-05-08 14:21:05
80年代經典游戲機復活,預裝25款游戲

80年代經典游戲機復活,預裝25款游戲

熱搜摘要官
2026-05-08 00:06:45
中國光伏的堡壘,被印度從內部攻破

中國光伏的堡壘,被印度從內部攻破

觀察者網
2026-05-08 09:00:37
2026-05-09 01:35:00
白鯨實驗室one incentive-icons
白鯨實驗室one
記錄 AI改變世界的瞬間
133文章數 15關注度
往期回顧 全部

科技要聞

SK海力士平均獎金600萬 工服成相親神器

頭條要聞

外籍銀行高層在香港豪宅性虐及殺害兩女子 內幕解密

頭條要聞

外籍銀行高層在香港豪宅性虐及殺害兩女子 內幕解密

體育要聞

他把首勝讓給隊友,然后用一年時間還清賬單

娛樂要聞

古天樂被曝隱婚生子,新娘竟是她

財經要聞

估值3000億 DeepSeek尋求500億元融資

汽車要聞

MG 4X實車亮相 將于5月11日開啟盲訂

態度原創

房產
家居
數碼
公開課
軍事航空

房產要聞

豪擲6.8億拿地!何猷君大手筆投資三亞!

家居要聞

流動的尺度 打破家的形式主義

數碼要聞

華碩京東重磅新品日,華碩天選7系列游戲本開啟預約

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗:最高領袖穆杰塔巴全面掌控局勢

無障礙瀏覽 進入關懷版