![]()
出品|虎嗅科技組
作者|陳伊凡、解丹青
編輯|苗正卿
頭圖|AI生成
這是虎嗅WAIC“追蹤Token商業新范式”系列文章第【01】期
“如果日均建模數80000次,每次兩毛錢,每天花費16000元,如果是一個月,就是48萬元。”
在說起算力消耗這個話題時,Remy創始人王正男掏出了手機,很認真地算了筆賬,如果放在英偉達的顯卡上跑,每個月固定消耗50萬元。
對于一家創業公司來說,這筆Token消耗是不小的開銷。這是建立在所有任務都跑在英偉達的顯卡上。嚴格意義上說,Remy所做的事情跟Token的關系并不大,但Remy的生意,卻與算力的消耗息息相關,甚至關系到這家公司的關鍵商業模式。王正男有他自己的一套控制成本的方法。
“我們從去年年底至今,半年時間,Remy的用戶數達到了250萬。”但王正男在思考另一件事,他就像一個精力無限的陀螺,語調昂揚,眼里有光。
![]()
Remy在2025年華為開發者大會(HDC2025)亮相
未來的Remy,要跟抖音和小紅書爭奪入口,這是個聽起來“螳臂當車”的事,但并非不可能。我們在討論這個極致算力成本控制案例時,也與王正男聊到了Remy的未來。
“我們從去年年底至今,半年時間,Remy的用戶數達到了250萬。”但王正男在思考另一件事,他就像一個精力無限的陀螺,語調昂揚,眼里有光。
Remy的算力賬本
大模型燒Token,每次推理調用一次API,按調用量計費,可復用,可以并行,成本曲線相對可預測。Remy不是這個邏輯。
3D重建的每一次任務,都是一次獨立的訓練過程。用戶掃了一個場景,服務器就要為這個場景從零開始跑一次高斯潑濺訓練;下一個用戶來了,再跑一次,兩次之間毫無復用。Remy現在的三種模式里,物體模式平均5分鐘出結果,人像模式10分鐘,大場景40分鐘——每一分鐘,都在消耗GPU時間,對算力的消耗甚至比和大模型對話還多。
![]()
使用Remy記錄下曾經陪伴寒窗苦讀的課桌在B站獲得大量觀眾共鳴
“我們的成本其實不是Token,而是GPU。”王正男說,“我們跑的是自己的高斯潑濺模型,購買的是顯卡時間和電力。”
這就帶來了一個普通SaaS公司不會遇到的麻煩:波峰和波谷。
2025年10月22日,Remy在國內首次上線。按王正男的話說,接下來96個小時堪稱“失控”。上線第五秒,他們預備好的八九百張顯卡全部拉滿,排隊任務數量眼看著直線往上漲。最終,他們在彈性算力平臺上把算力擴到了1900張GPU,才勉強穩住局面。9天之后,Remy用戶量突破100萬。
"如果我去向大廠每個月租1900張GPU,顯然不劃算,因為峰值之后根本用不到這么多。"
所以,最劃算的辦法是把3D重建部署在彈性算力平臺上,王正男選擇了一家叫做共績科技的公司,這種彈性算力的模式叫做“算力滴滴”,算力資源像打車一樣,按需調度,用多少取多少,峰值結束就釋放。價格是美國同類彈性算力公司的十分之一。這樣,他每個月的算力成本可以控制在20萬-30萬元。
2月10日的那次功能升級,Remy推出了3D全家福和房間掃描功能,用戶可以通過Remy 3D的記錄自己曾經生活過的老房子以及與父母親人團聚的時刻。正值春節,流量再次暴漲。每10分鐘處理200次任務,每次大場景重建需要40分鐘,這意味著任何時刻都有800張顯卡沒有停歇地在跑。但依然是,當春節接近尾聲,用戶的使用頻率就會下降,如果按固定購買的邏輯囤卡,這個賬根本沒法算。
Remy的商業模式
王正男至今堅持不向用戶收費。
![]()
王正男本人 圖片由Remy提供
讓王正男重新想清楚商業模式的,是一個意料之外的數字。Remy每日的3D掃描數,是日活用戶數的1/10。
也就是說,十個打開Remy的用戶里,九個在“看”,只有一個在“拍”。
這個比例,最初讓他困惑。3D重建的直覺邏輯是:你來是為了記錄,不記錄來干嘛?但數據顯示,大量用戶登錄之后,只是在瀏覽或者反復翻看自己此前留下的記錄。
想明白這件事之后,他對Remy的定義發生了根本性轉變:Remy不是一個工具,而是一種新的記憶媒介。
“工具產品解決效率問題,適合訂閱收費。但Remy是在幫用戶記錄人生、保存記憶,這和效率沒有關系。”
這個判斷,直接否定了訂閱模式。
訂閱制的邏輯是:你付月費,我通過產品來提升你的效率。這是Photoshop的邏輯,是Notion的邏輯,是所有生產力工具的邏輯。但Remy的用戶,記錄一段孩子的童年、一套老房子的房間,然后打開來看,不是為了提高效率,他們在消費記憶。
消費行為,對應的是流量模式。
“廣告一定是一個方向。包括開屏廣告、上傳等待廣告。只要用戶規模起來,就會產生商業價值。"他說,“我更相信流量模式,而不是訂閱模式。"
雖然現在所有用戶都會記錄,但不會天天記錄。記錄天然是低頻行為,因為用3D的方式來記錄天然有門檻。想明白了這點,王正男決定,未來如果想提升留存率和用戶價值,必須讓用戶從“拍”轉向“看”。
最近Remy添加的沉浸聲場功能,就是想讓3D記憶有更多情感的元素。在 AI 時代,大模型模仿人說話、拍視頻,但人類復雜的情感它們模仿不了。因為這是各種經歷產生的“化學反應”,我們想用技術將這個“化學產物”保存下來。
最近Remy添加的沉浸聲場功能,就是想讓3D記憶有更多情感的元素。在 AI 時代,大模型模仿人說話、拍視頻,但人類復雜的情感它們模仿不了。
王正男要解決的是,為什么這些人會每天打開Remy,而不是打開抖音或朋友圈?這個問題,他自己還沒有完整的答案。“3D內容對比2D內容到底有什么獨特的價值,這是我今年要重點回答的問題。”
以下為虎嗅的對話精選:
虎嗅:過去半年,你對Remy最大的認知變化是什么?
王正男:最大的變化是我越來越確定,Remy不是一個工具產品。過去大家會把它理解成3D掃描、3D重建或者空間記錄工具,但現在我更愿意把它理解成一種新的記憶媒介。工具產品解決效率問題,因此適合訂閱收費;而Remy是在幫助用戶記錄人生、保存記憶,這和效率沒有關系。
虎嗅:為什么你反復強調“記錄”而不是“生成”?
王正男:因為我認為生成是創作者的需求,記錄是所有人的需求。生成式AI主要服務于創作者,他們用AI生成圖片、視頻、內容來表達和傳播。但記錄是所有人都會做的事情。我們會拍父母、拍孩子、拍畢業典禮、拍老房子,因為這些時刻以后可能再也不會出現。
虎嗅:很多人會問,照片和視頻已經存在了,為什么還需要3D?
王正男:因為人類一直在追求更真實的記錄方式。黑白照片變成彩色照片,照片變成視頻,視頻變成沉浸式內容,本質上都是同一個方向。
我經常講一句話:記錄也許是對抗時間唯一的武器。時間會帶走很多東西,人們之所以記錄,是因為知道很多場景不會再出現第二次。我們希望Remy能夠讓這些記憶保存得更真實。
虎嗅:為什么在Remy以前沒有成功的3D內容社區?
王正男:因為沒人回答一個問題:用戶為什么要看3D內容。
如果只是把一個東西變成3D,那并不足以支撐消費行為。視頻更方便,圖片更輕量,傳播效率也更高。
虎嗅:現在最大的產品挑戰是什么?
王正男:使用頻率。現在很多用戶會記錄,但不會天天打開。記錄天然是低頻行為,因為創作有門檻。未來如果想提升留存率和用戶價值,必須讓用戶從“拍”轉向“看”。
虎嗅:Remy未來的目標是什么?
王正男:不是生成一個不存在的世界,而是盡可能1:1還原真實世界。
AI 行業開始認真算賬了。不是只看模型能力,而是看 AI 是否真正進入業務、產生結果、跑出回報。
這也是虎嗅想追問的:錢燒哪了?干成啥了?賺還是虧了?能復用嗎?
圍繞這四問,我們將深度對話AI產業鏈條上的重要公司,沉淀AI賬本樣本庫;還將在7月WAIC期間推出系列直播、閉門會,與企業關鍵決策者共探AI生意。
詳情請戳,一起見證AI時代商業落地的真實變化。
![]()
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4868069.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.