![]()
“所有的這些功課都是貪婪和恐懼。”
文丨祝穎麗
編輯丨宋瑋
這是 29 歲的宋亞宸當(dāng) CEO 的第 3 年。創(chuàng)業(yè)的前一半時(shí)間,他都在 “布道”:講 3D 的重要,講 UGC 內(nèi)容平臺的可能性……過去一年,當(dāng)市場開始逐漸意識到他的講述在變成可能時(shí),事情開始加速。
據(jù)我們了解,宋亞宸創(chuàng)辦的通用人工智能公司 VAST 近期完成了 5000 萬美元 A 輪融資,領(lǐng)投方為阿里和上汽,元禾璞華、BV 百度風(fēng)投、東方嘉富跟投,老股東春華創(chuàng)投和北京市人工智能產(chǎn)業(yè)投資基金也在繼續(xù)加注。
投資人下重注的理由或許是,VAST 的價(jià)值在變得越來越確定。
去年 6 月,VAST 上線了 AI 3D 工作臺 Tripo Studio 的 Beta 版本,隨后在 12 月推出 Studio 1.0 正式版本。正式上線三個月以來,用戶規(guī)模和收入持續(xù)增長,目前平臺累計(jì)用戶已超過 650 萬,服務(wù) 9 萬多開發(fā)者及企業(yè)。
VAST 的模型能力也依然在進(jìn)化。不久前,他們剛剛發(fā)布了一款高精度生成模型,這個模型生成的 3D 模型質(zhì)量極高,不僅幾何結(jié)構(gòu)干凈,甚至能還原管子機(jī)械的內(nèi)部結(jié)構(gòu)、紋路,效果已經(jīng)與人類專業(yè)建模的差距不大。
接下來,他們還有一款面向?qū)崟r(shí)生產(chǎn)流程優(yōu)化的 基礎(chǔ)模型,這款模型的 3D 將生成過程從十幾分鐘縮短至約 1–2 秒,可用性和可編輯性都極強(qiáng)。
產(chǎn)品節(jié)奏也在加快。VAST 預(yù)計(jì)今年將推出一款面向普通用戶的 UGC 交互內(nèi)容產(chǎn)品。用戶可以創(chuàng)作和瀏覽可互動的 3D 內(nèi)容,并在社區(qū)分享與傳播,類似 “3D 版短視頻平臺”。
快速的業(yè)務(wù)節(jié)奏或許建立在這家創(chuàng)業(yè)公司的 “專注” 上。過去一段時(shí)間里,宋亞宸說,他最大的命題和自豪是 “抵御了誘惑”——在具身智能、視頻生成輪番爆火的 2025 年,他拒絕了諸多業(yè)務(wù)上的 “捷徑”,讓公司的愿景和路線圖始終沒有變化。
作為一個年輕的創(chuàng)業(yè)者,宋亞宸和大多數(shù)人一樣,勤奮而忙碌。他早上 8 點(diǎn)開始工作、晚上 12 點(diǎn)下班,然后再打幾個小時(shí)游戲——一天最少的時(shí)候只睡兩三個小時(shí);他甚至有些 “天賦異稟”,能隨時(shí)插空睡著,自我調(diào)侃是 “充電 5 分鐘、待機(jī)兩小時(shí)”。
但如此忙碌的 CEO 也許并不正常。在公司,所有人都能隨時(shí)給他安排會議,他的時(shí)間被擠得滿滿當(dāng)當(dāng);他還事必躬親,在大量事務(wù)和細(xì)節(jié)上親自過問。
他開始將這視作不健康的信號,因?yàn)檫@正說明,公司的組織能力還非常欠缺,因此作為 CEO 的他會被 “代償”。這也變成了宋亞宸接下來一年的新命題。
以下是我們這次交流后篩選出的部分問答。
3D 互動成了共識,今年將推出 UGC 互動內(nèi)容平臺
晚點(diǎn):你說現(xiàn)在已經(jīng)進(jìn)入了一個共識階段,這個共識是什么?
宋亞宸:游戲跟電影、長篇小說、繪畫很像,都是 “精英的” 藝術(shù)。但如果有一天真的出現(xiàn) UGC 游戲,那肯定不叫游戲。就像短視頻不叫 UGC 電影,推特不叫 UGC 小說一樣。它會是一種新的內(nèi)容形態(tài),我們稱之為輕交互。目前市面上已經(jīng)出現(xiàn)了一些很火的 UGC 交互平臺,只不過還沒有統(tǒng)一的定義。
晚點(diǎn):這個 3D 互動到底在干啥?有哪些內(nèi)容?
宋亞宸:舉個例子,比如你很討厭老板,于是把你的老板生成了一個娃娃,閑來無事就捏捏他、彈彈他。這是游戲嗎?可能不算,但它就是一個 3D 互動。
晚點(diǎn):但這種場景會很多嗎?
宋亞宸:所有用文字、圖片、視頻可以表達(dá)的,都可以用 3D 表達(dá)。比如支持誰、反對誰,原先可以發(fā)個贊揚(yáng)或者聲討的文章,以后也可以做個小游戲,朝他獻(xiàn)花或者丟雞蛋。
晚點(diǎn):那這個 “3D 互動” 的概念具體怎么定義?和文字視頻的互動有什么差別?
宋亞宸:人這一生,只要眼睛是睜開的,就一直在進(jìn)行 3D 互動。伸手、行走、扔石頭等等都是。文字和視頻都沒法做到這樣的實(shí)時(shí)交互,它們只是對 3D 信息的壓縮。
晚點(diǎn): 目前除了 Tripo Studio 這個工具類產(chǎn)品,你們之后的計(jì)劃是?
宋亞宸:今年我們會有社區(qū)類或者說平臺類的產(chǎn)品正式上線,直接面向普通用戶,用于 UGC 虛擬內(nèi)容 / 交互內(nèi)容的創(chuàng)作。我們的產(chǎn)品也可以用于 IP 和工業(yè)設(shè)計(jì)。
晚點(diǎn):IP 和工業(yè)化設(shè)計(jì)做什么?
宋亞宸:比如你可以定制一個自己喜歡的手辦,冰箱貼、鑰匙扣、鍵帽。
3D 生成對普通人來說的最大意義:第一,讓每個人都能做工業(yè)設(shè)計(jì)、有自己的 IP;第二,讓每個人都能做虛擬內(nèi)容,尤其是可交互的。
模型進(jìn)展:我們的腦回路和其他家不太一樣
晚點(diǎn):講講你們最新的技術(shù)進(jìn)展?
宋亞宸:我們有兩款新的基礎(chǔ)模型,準(zhǔn)確說是三個基模。兩個屬于 AI 3D 大模型,另一個是世界模型。
AI 3D 的大模型里,前段時(shí)間更新的旗艦?zāi)P?Tripo H3.1,對輸入圖片的還原度、整體結(jié)構(gòu)和局部細(xì)節(jié)的表達(dá)都有大幅提升。還有馬上要發(fā)的 Tripo P1.0,用了全新的思維方式和算法框架,相當(dāng)于從底層把 AI 3D 大模型重做了一遍,最終效果是能夠在 2 秒內(nèi)直接生成專業(yè)建模師水平的 3D 模型,比市面已有方案提速百倍以上。
這兩個最新的技術(shù)基本上就是說在行業(yè)里是斷層領(lǐng)先。
![]()
不同版本的對比
晚點(diǎn):為什么你們能做到所謂 “斷層領(lǐng)先”?
宋亞宸:第一個是數(shù)據(jù)量,我們擁有 5, 000 多萬高質(zhì)量的 3D 模型作為訓(xùn)練數(shù)據(jù),這個數(shù)據(jù)的規(guī)模肯定是領(lǐng)先的。第二就是我們的人才,我們擁有行業(yè)最頂尖的圖形學(xué)和 AI 交叉背景技術(shù)團(tuán)隊(duì),人才密度非常高。
第三就是,我們的腦回路和其他家不太一樣,發(fā)明了新的表達(dá)形式。以前的 3D 表達(dá)形式都是針對人的,更多服務(wù)于渲染、編輯與工程管線,例如網(wǎng)格、點(diǎn)云、體素與分層空間結(jié)構(gòu)等。
我們是開發(fā)了針對 AI 的訓(xùn)練的表達(dá)形式,構(gòu)建了更適合大規(guī)模訓(xùn)練與擴(kuò)散生成的表示與建模方式,將幾何與結(jié)構(gòu)信息以更高效、更可學(xué)習(xí)的形式組織起來,這樣就能利用更多的數(shù)據(jù),更大的算力,更大的參數(shù),實(shí)現(xiàn)更穩(wěn)定的高質(zhì)量生成與可用輸出。
晚點(diǎn):那第二個方向,就是世界模型現(xiàn)在在一個什么階段?
宋亞宸:我們?nèi)ツ觊_始重點(diǎn)做世界模型。首款世界模型也會在近期發(fā)布。
首先從定義上,我們認(rèn)為世界模型應(yīng)該是通用的。
至于實(shí)現(xiàn)方式。VAST 做 3D 大模型時(shí)走過這樣一條路:2022 年底,行業(yè)普遍用 2D 圖片數(shù)據(jù)訓(xùn)練。VAST 是第一個提出 2D 與 3D 數(shù)據(jù)融合訓(xùn)練的——早期圖片數(shù)據(jù)占八成、3D 占兩成,隨后比例逐步翻轉(zhuǎn),到 2024 年下半年,行業(yè)基本都轉(zhuǎn)向純 3D 數(shù)據(jù)。
我們認(rèn)為,世界模型也會重走這條路。今天大多數(shù)人先從視頻路線切入,是因?yàn)橐曨l數(shù)據(jù)更方便獲取。但從第一性原理看,世界模型的終局應(yīng)該建立在 3D 空間數(shù)據(jù)之上——因?yàn)槭澜绫旧砭褪侨S的。
只不過這段歷史階段繞不開,資本、人才、數(shù)據(jù)都先圍著視頻轉(zhuǎn),就像當(dāng)年先圍著圖片轉(zhuǎn)一樣。VAST 的做法是先行一步,現(xiàn)在就將 3D 數(shù)據(jù)與視頻數(shù)據(jù)融合訓(xùn)練,接受從 “視頻為主、3D 為輔” 逐步走向 “3D 為主、視頻為輔” 的過程。
晚點(diǎn):為什么你們要從 3D 模型做到世界模型?
宋亞宸:我們創(chuàng)業(yè)的初心就是做 UGC 的交互內(nèi)容平臺。
我們認(rèn)為交互內(nèi)容平臺可能有兩種實(shí)現(xiàn)方式,第一種是 Tripo + Cursor ,這個很好理解,Tripo 用來造萬物,Cursor 用來定規(guī)則。
更進(jìn)一步的方式是通過世界模型,直接生成一個世界。我們的愿景就是做 UGC 的交互內(nèi)容平臺,當(dāng)然要做世界模型。
晚點(diǎn):那如果世界模型比較成熟了,你之前說的 Tripo 加 cursor 的這種方式可能就會被放棄,它是二選一的還是怎么樣?
宋亞宸:可能相輔相成,也可能是一個八二和二八開的事情。
當(dāng) CEO,就是在逐層布道
晚點(diǎn):接下來聊聊,你作為 CEO 最近一段時(shí)間最大的進(jìn)化是什么?
宋亞宸:從我的角度上,2025 年其實(shí)有大量的機(jī)會,市場上有很多事情,有很多積極的信息,或者看起來值得做的事情,但我們在堅(jiān)持一直想做的事情。
晚點(diǎn):過去一年你的精力的分配,是怎么樣的?
宋亞宸:我首先花了很多時(shí)間在思考上。技術(shù)的發(fā)展是比想象中的要快的,大眾對于 AI 的接受程度比想象中要快,所以很多本來覺得不用著急形成答案的一些事情,要盡快找到答案,或者要勇敢去定義了。我花了很多時(shí)間思考產(chǎn)品怎么定義,平臺怎么定義。
再者,2023 年創(chuàng)業(yè)之前,我思考了很多事情,探索了很多東西,很多事情逐漸形成共識了。然后我就在思考說那下一個共識是什么。
第二件事情是布道,我希望布道讓更多的人在這件事情上能形成共識,讓更多的人包括了我們的投資人、客戶、創(chuàng)作者,我們團(tuán)隊(duì)內(nèi)部的人,潛在的候選人,當(dāng)然也包括媒體,能夠加入我們也好,給我們支持也好。這個事情肯定在我占比里面也很大。
第三件事情是產(chǎn)品的定義。產(chǎn)品的定義,思考占一部分,更多的其實(shí)是和一線的開發(fā)者和創(chuàng)作者走在一起,不管是通過比賽活動,還是每周大量的用戶訪談。
晚點(diǎn):你現(xiàn)在在想的新的非共識的東西是什么?
宋亞宸:那我肯定不能講了,現(xiàn)在。
晚點(diǎn):你不是在布道嗎?
宋亞宸:最先布道的肯定是團(tuán)隊(duì),然后再是比如說候選人,然后是投資人,他可能是一個逐層布道的過程。
晚點(diǎn):因?yàn)榧夹g(shù)在變快,大家對 AI 接受度變高,你想要快速給出答案的是什么?
宋亞宸:創(chuàng)業(yè)肯定有 mission 和路徑的,原本一開始不用想很多非常細(xì)顆粒度的東西,到第二年、第三年的時(shí)候再去思考這個事情也是合理的,但現(xiàn)在因?yàn)槭虑楸患铀倭耍乙崆叭ニ伎己芏嗑唧w畫面感的事情。
晚點(diǎn):具體指什么?
宋亞宸:比如 UGC 的交互內(nèi)容平臺,我們本來覺得這可能是一個需要 5 到 10 年的事,現(xiàn)在變成了 3 到 5 年。
比如它的內(nèi)容模板,前一百個具體長什么樣子?這件事我們做過探索,但一開始沒有著急要答案。我們內(nèi)部有個團(tuán)隊(duì)天天在探索這個事情,也兩三年了,它可能是個不急的事情,然后現(xiàn)在它更迫在眉睫了,或者說更重要了。
還有包括比如世界模型的一些重要問題,原來我們只是儲備一些人才、資金,思考一下大概的技術(shù)路線。但現(xiàn)在我們需要更早、更快地思考很多細(xì)節(jié),才能真正實(shí)現(xiàn)。
晚點(diǎn):對比三年前的你自己,你覺得最大的變化和成長是什么?哪些發(fā)生的事情跟你想象的不一樣。
宋亞宸:做公司很像做產(chǎn)品,產(chǎn)品需要迭代,CEO 也是。往玄乎里面說就是要修很多功課,有很多課題,都需要解決。
幾乎沒有人生下來就是 CEO,他可能有當(dāng)好 CEO 的品質(zhì),就像武俠小說里骨骼驚奇的習(xí)武之才,但如果不學(xué)武術(shù)的功法,到最后可能只剩力氣大。
一樣的道理,我也有很多工具得學(xué)。我覺得自己在認(rèn)真把自己當(dāng)產(chǎn)品迭代,包括怎么更好地直面問題、怎么實(shí)事求是地討論、怎么更清晰地溝通、怎么優(yōu)先考慮公司利益、同時(shí)尊重和信任團(tuán)隊(duì)等等。有些東西他就是反人性的。
晚點(diǎn):中間遇到過你覺得最反人性的課題是什么?
宋亞宸:太多了。比如我們喜歡招正直善良的人,但善良的人有時(shí)候不愿意直面激烈的沖突、怕傷害別人。
另外,比如很多事情天然有捷徑,有看上去更容易的實(shí)現(xiàn)方式。那我們?nèi)绾伪3珠L期主義、從第一性原理出發(fā)、不因?yàn)榻輳胶投唐谡T惑讓自己的行為變形?
總結(jié)一下,其實(shí)所有的這些功課都是貪婪和恐懼,我剛其實(shí)各舉了一個。
晚點(diǎn):聽說你是工作時(shí)長非常長的一個創(chuàng)業(yè)者?
宋亞宸:我基本上是這樣的,早上 8 點(diǎn)到晚上 12 點(diǎn)之間,大家都可以給我排會,幾乎每天都會排滿。但這件事情大家其實(shí)不用跟我打招呼,就是排我的日程就行了,全公司人都可以,哪怕你是個實(shí)習(xí)生,都可以給我發(fā)會邀。
比如昨天,我從早到晚 8 點(diǎn)到 12 點(diǎn)都有會,吃飯就是跟我們老股東一起吃的,匯報(bào)一下近況。
晚點(diǎn):有的公司的 CEO 說自己是最閑的,你可能確實(shí)我聊過的最忙的 CEO ,為什么會這樣?
宋亞宸:這個也是我 2026 年的功課。團(tuán)隊(duì)也跟我講了,說你為什么這么忙?是因?yàn)槟悴恍湃螆F(tuán)隊(duì),因?yàn)槟阌泻芏嗍虑樵谧约鹤觥⒆约航鉀Q,但其實(shí)你應(yīng)該信任團(tuán)隊(duì)。如果很多事情都是別人讓你幫、你就幫的話,團(tuán)隊(duì)永遠(yuǎn)不會成長。
我覺得這件事情說得很對,所以在我的 OKR 里面,今年有個 KR 就是這個。因?yàn)槊Σ皇且患檬拢f明你的公司不成熟。
晚點(diǎn):是。
宋亞宸:當(dāng)然可能也因?yàn)楣景l(fā)展太快,組織沒有那么快適應(yīng),它總會 “代償”。就像鍛煉,比如說你舉重,手臂力量差你會用你背的力量;腰部力量差,你可能會用你的臀部力量,這件事情是一樣的。
組織能力不夠的時(shí)候,我就會特別累,這其實(shí)不是一件好事,代表這家公司還需要做很多功課,包括我自己還得做很多功課。所以忙肯定不是一個我會想裝逼或者吹牛的事情,反而我意識到這件事情是不健康的,會想辦法有意識地去改進(jìn),不管是公司層面上還是我個人層面。
題圖來源:VAST 創(chuàng)始人宋亞宸
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.