前段時(shí)間,一個(gè)消息引發(fā)了廣泛關(guān)注:豆包大模型正式開啟商業(yè)化,推出付費(fèi)訂閱服務(wù)。
這看似是應(yīng)用層的一小步,實(shí)則是整個(gè) AI 算力產(chǎn)業(yè)鏈的一大步。它直接驗(yàn)證了算力需求的真實(shí)性與緊迫性,也為上游的算力服務(wù)商,尤其是備受關(guān)注的算力租賃板塊,注入了一劑強(qiáng)心針。
豆包推出付費(fèi)版,核心原因很簡(jiǎn)單:復(fù)雜的 AI 任務(wù)消耗巨量的算力和推理時(shí)間,成本太高了。
數(shù)據(jù)顯示,豆包日均 Token 使用量已突破 120 萬億,過去三個(gè)月翻了一倍,比剛發(fā)布時(shí)增長(zhǎng)了一千倍。
![]()
這背后,是實(shí)實(shí)在在的算力成本在燃燒。付費(fèi),是覆蓋高昂算力成本的必然選擇,也是 AI 應(yīng)用從 “叫好” 走向 “叫座” 的關(guān)鍵測(cè)試。
這個(gè)現(xiàn)象,直接印證了當(dāng)前算力供不應(yīng)求的局面。短期內(nèi)能解燃眉之急的,正是算力租賃。
五一假期里,美股 H100 和 B200 的算力租賃服務(wù)價(jià)格大幅上漲,帶動(dòng)相關(guān)板塊走高,全球算力緊缺漲價(jià)的邏輯被進(jìn)一步實(shí)錘。
算力租賃的火爆,大家有目共睹。但市場(chǎng)關(guān)注的焦點(diǎn),正在悄然變化。一個(gè)更高級(jí)的商業(yè)模式 ——“Token 工廠”,開始浮出水面。
這不僅僅是概念,而是算力服務(wù)下一站的明確方向。
傳統(tǒng)算力租賃,是重資產(chǎn)、賣資源的生意。客戶租用服務(wù)器,廠商按月收租金,核心是拿卡能力和上架率。這像是一次性買賣,收益有剛性上限。
![]()
而 Token 工廠,是價(jià)值附加的生意。它不再簡(jiǎn)單出租硬件,而是通過平臺(tái)級(jí)的調(diào)度、軟硬件深度優(yōu)化,將算力加工成標(biāo)準(zhǔn)化的智能內(nèi)容(Token)輸出給客戶。
其商業(yè)模式也升級(jí)為“Token 分成”:按照大模型實(shí)際產(chǎn)生的 Token 調(diào)用量,與模型廠商進(jìn)行收益分成。
這種模式下,超額分成收益幾乎全部轉(zhuǎn)化為純利潤,為算力服務(wù)打開了極高的利潤彈性。機(jī)構(gòu)調(diào)研顯示,在深度聯(lián)合運(yùn)營中,算力服務(wù)商可能分得 Token 銷售收入的 60%-80%。優(yōu)秀的軟件優(yōu)化,甚至能讓 Token 服務(wù)帶來的收入達(dá)到傳統(tǒng)裸算力租賃的 5 到 10 倍。
頭部算力運(yùn)營商的凈利率,有望借此從傳統(tǒng)的 10%-15%,強(qiáng)勢(shì)逼近 30% 甚至更高。
Token 工廠憑什么能大幅提升毛利?核心在于“精耕細(xì)作”和效率的極致優(yōu)化。
傳統(tǒng)租賃是粗放管理,簽個(gè)五年合同,后續(xù)基本不管。
![]()
Token 工廠則像精細(xì)化運(yùn)營的 “智能電廠”:用戶用多少收多少,價(jià)格更靈活,競(jìng)爭(zhēng)力更強(qiáng)。白天和夜晚的用戶需求不同,通過調(diào)度提升整體使用率。復(fù)雜任務(wù)和簡(jiǎn)單任務(wù),分配不同的大模型或算力資源,降低成本。
目前測(cè)算基礎(chǔ)是每日有效使用 8 小時(shí),若能提到 12 小時(shí),效率又能提升 50%。這一切優(yōu)化,都是在不顯著增加硬件成本的前提下完成的,從而大幅提升了毛利率。
雖然 Token 工廠模式想象空間巨大,但我們也需要冷靜看待。硬件的高溢價(jià),本質(zhì)源于稀缺。但技術(shù)演進(jìn)有一個(gè)殘酷規(guī)律:凡是足夠貴、足夠重復(fù)、足夠剛需的東西,最終都會(huì)被整個(gè)產(chǎn)業(yè)鏈優(yōu)化掉。
AI 算力目前消耗巨大,部分原因是模型早期訓(xùn)練粗糙、推理昂貴、調(diào)度效率不高。
![]()
一旦成本高到一定程度,整個(gè)行業(yè)就會(huì)自動(dòng)進(jìn)入 “降本模式”—— 模型壓縮、量化、新架構(gòu)、專用芯片、軟件優(yōu)化等技術(shù)都會(huì)涌現(xiàn),目標(biāo)就是讓同樣的任務(wù)消耗更少的算力。
谷歌 CEO 在季報(bào)電話會(huì)上坦言算力受限,但也表示需求能見度至少延伸到 2028 年。這意味著,算力缺口是長(zhǎng)期結(jié)構(gòu)性的,但硬件的高毛利很難像當(dāng)時(shí)那樣線性外推、無限上漲。
市場(chǎng)部分漲幅已經(jīng)包含了未來的樂觀預(yù)期。因此,真正具備長(zhǎng)期復(fù)利的公司,不能只靠賣稀缺的硬件。它們必須進(jìn)化成平臺(tái)、生態(tài)和標(biāo)準(zhǔn)的制定者。
就像曾有報(bào)道稱,大基金開始領(lǐng)投 AI 模型公司,其意圖正是打通從中國設(shè)備、中國芯片到中國模型的完整產(chǎn)業(yè)生態(tài)閉環(huán)。
硬件賺錢靠稀缺,而軟件和生態(tài)的優(yōu)化,終將稀釋這種稀缺,并創(chuàng)造出更持久的價(jià)值。
Token 工廠模式,正是算力服務(wù)商向平臺(tái)生態(tài)邁進(jìn)的關(guān)鍵一步。它炒的不是短期業(yè)績(jī),而是下一代商業(yè)模式的演進(jìn)方向,以及由此打開的長(zhǎng)期市值空間。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.