![]()
Token狂飆的算力稅:誰(shuí)在為AI的“工業(yè)革命”買單?
今年春天,如果你還在糾結(jié)龍蝦怎么養(yǎng)、Token中文名叫什么,大概已經(jīng)跟不上科技圈的熱鬧了。
3月23日,國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏給Token定了中文名——詞元。同時(shí)披露了一個(gè)數(shù)字:中國(guó)日均Token調(diào)用量突破140萬(wàn)億,兩年增長(zhǎng)超千倍。
![]()
圖源:新華社
差不多同一時(shí)間,阿里云和百度智能云先后宣布AI算力產(chǎn)品漲價(jià),最高漲幅34%。英偉達(dá)的黃仁勛在GTC大會(huì)上把Token叫做“AI時(shí)代的石油”,還公布了一套分層定價(jià):每百萬(wàn)Token從3美元到150美元不等。
他還說(shuō)了另一句話,讓不少創(chuàng)業(yè)者后背發(fā)涼:一個(gè)年薪50萬(wàn)美元的工程師,如果一年用不掉25萬(wàn)美元的Token,他會(huì)“極度恐慌”。
![]()
圖源:網(wǎng)絡(luò)
一邊是Token消耗量瘋漲,一邊是供給端的成本在攀升、定價(jià)權(quán)在集中。熱潮退去,賬單浮出水面,人們開始意識(shí)到一個(gè)問(wèn)題:我們正以近乎傾銷的價(jià)格享受著AI的便利,但支撐這場(chǎng)技術(shù)革命的底層燃料,其真實(shí)成本才剛剛開始顯現(xiàn)。
為什么單價(jià)越便宜,總賬單越貴?
要理解這件事,得先明白Token是什么。
它是AI理解和生成信息的最小單元,也是眼下智能時(shí)代唯一可計(jì)量、可定價(jià)、可交易的通用貨幣。但它的使用費(fèi)由兩個(gè)東西決定:?jiǎn)蝺r(jià)乘以消耗量。
![]()
圖源:網(wǎng)絡(luò)
你問(wèn)一個(gè)問(wèn)題,它回答一段話,背后都是Token在燃燒。
過(guò)去兩年,行業(yè)的主線是訓(xùn)練模型。各大廠商砸了數(shù)千億美元,把單位Token的牌面價(jià)格一降再降。國(guó)內(nèi)廠商的Token單價(jià),已經(jīng)做到海外巨頭的十分之一。
但到了2026年,事情變了。
AI的核心價(jià)值,從“能聊”變成了“能干”。標(biāo)志就是龍蝦的爆發(fā)。
![]()
圖源:網(wǎng)絡(luò)
一個(gè)龍蝦智能體執(zhí)行一次任務(wù),比如“幫我找最低價(jià)”,消耗的Token是傳統(tǒng)對(duì)話的幾十倍甚至上百倍。因?yàn)樗皇且淮螁?wèn)答,而是一個(gè)完整的工作流:拆解任務(wù)、多步推理、調(diào)用工具、自我修正、錯(cuò)了重來(lái)。每一步都在燒Token。
這就是問(wèn)題的核心:完成同一個(gè)任務(wù)需要的Token數(shù)量,增長(zhǎng)得比單價(jià)下降更快。AI從副駕駛變成了代駕司機(jī),油耗自然不是一個(gè)量級(jí)。
更關(guān)鍵的是,用戶永遠(yuǎn)只想要最新的模型。老模型再便宜也沒(méi)人要,99%的需求會(huì)瞬間轉(zhuǎn)移到新發(fā)布的SOTA模型上。而前沿模型的單位Token價(jià)格,從來(lái)沒(méi)真正降下來(lái)過(guò)。GPT-4剛出來(lái)時(shí)輸出價(jià)格60美元每百萬(wàn)Token,今天Claude Opus 4.5還是這個(gè)價(jià)位。用戶要的是當(dāng)下最好的大腦,愿意為它買單。
![]()
圖源:網(wǎng)絡(luò)
于是,需求端智能體爆發(fā),Token消耗量?jī)赡暝鲩L(zhǎng)超千倍。供給端,HBM內(nèi)存價(jià)格飛漲,2026年一季度DRAM價(jià)格環(huán)比漲超50%,NAND最高漲了150%,巨頭們的戰(zhàn)略長(zhǎng)約直接簽到5年后。而掌握核心硬件和軟件生態(tài)的英偉達(dá),靠著CUDA和從芯片到云的全棧布局,牢牢捏著Token的出廠價(jià)。
誰(shuí)在制造Token的通脹?
Token的狂飆不是自然生長(zhǎng)的。從產(chǎn)業(yè)鏈看,有四層玩家,每一層都在向上傳遞成本,最終壓到最末端的普通用戶身上。
先看最底層:英偉達(dá)。
第一層是英偉達(dá)。以前它賣芯片,一次買賣。現(xiàn)在不一樣了。CUDA生態(tài)綁住了全球絕大多數(shù)AI開發(fā)者,二十年來(lái)積累的工程師、開源項(xiàng)目、代碼庫(kù)都長(zhǎng)在這個(gè)生態(tài)里,切換成本極高。它自己又開了云服務(wù)DGX Cloud,用戶直接在它平臺(tái)上按Token付費(fèi),不用自己買芯片。
![]()
圖源:網(wǎng)絡(luò)
黃仁勛在GTC 2026上提出了“Token工廠經(jīng)濟(jì)學(xué)”,核心就一句話:以后AI的衡量單位不再是芯片,而是Token。他的野心也不止于賣云服務(wù)——英偉達(dá)正在試圖把商業(yè)模式延伸到按Token抽成。
這套打法讓英偉達(dá)掌握了定價(jià)權(quán)。2026年一季度,HBM內(nèi)存供不應(yīng)求,內(nèi)存價(jià)格在幾個(gè)月內(nèi)上漲了數(shù)百個(gè)百分點(diǎn)。英偉達(dá)的GPU也跟著漲價(jià)——AI芯片H200所用的HBM3E供應(yīng)價(jià)格上漲約20%。
英偉達(dá)芯片漲價(jià),直接推高了云廠商的采購(gòu)成本。
阿里云、騰訊云、百度智能云,它們從英偉達(dá)買芯片,搭好服務(wù)器,再把算力租給下游。現(xiàn)在英偉達(dá)芯片漲價(jià),HBM內(nèi)存漲價(jià),它們自己的成本在漲。同時(shí)需求又爆發(fā)——龍蝦這類智能體火了,所有人都想跑Agent。需求太大,服務(wù)器、電力都跟不上。于是它們只能漲價(jià)。阿里云AI算力產(chǎn)品最高漲了34%,百度漲了5%到30%。
![]()
圖源:網(wǎng)絡(luò)
第三層是大模型廠商。DeepSeek、MiniMax、智譜這些公司,處境最微妙。它們從英偉達(dá)買芯片,從云廠商租算力,訓(xùn)練出模型,再把Token賣給用戶。
![]()
圖源:網(wǎng)絡(luò)
上游,芯片漲價(jià)、內(nèi)存漲價(jià)、云廠商漲價(jià),成本在漲。下游,2024年DeepSeek帶頭打價(jià)格戰(zhàn),把Token價(jià)格打到了地板上。想漲價(jià)怕用戶跑,不漲價(jià)自己的算力賬單在飛漲。所以這一輪云廠商漲價(jià),它們反而最沉默。
第四層是AI應(yīng)用公司。Cursor、Claude Code這些直接面向用戶的工具,面臨一個(gè)無(wú)解的難題:按固定月費(fèi)收,比如20美元隨便用,重度用戶能把成本干穿。
Anthropic的Claude Code就吃過(guò)這個(gè)虧,推出每月200美元的無(wú)限套餐,結(jié)果一個(gè)月被一個(gè)用戶干掉了100億Token,最后不得不取消。
![]()
圖源:網(wǎng)絡(luò)
按量付費(fèi)呢?用戶會(huì)被不確定的賬單嚇跑。大多數(shù)人喜歡固定月費(fèi),哪怕貴一點(diǎn),至少心里有數(shù)。
怎么辦?只能硬著頭皮選固定月費(fèi),但在這個(gè)模式下做各種限制來(lái)保命。
最常見的是用量封頂。每月給你一定額度的Token,用完了要么等重置,要么補(bǔ)差價(jià),要么升級(jí)。比如Claude Code取消無(wú)限套餐后,改成了按實(shí)際用量付費(fèi)加基礎(chǔ)月費(fèi)的混合模式。
另一種是分級(jí)套餐。輕度用戶20美元,重度用戶40或60美元,把高消耗用戶篩到更高的付費(fèi)檔位。還有些公司在技術(shù)層面做優(yōu)化——緩存常用請(qǐng)求、限制上下文長(zhǎng)度、在用戶無(wú)感知的情況下把復(fù)雜任務(wù)切給便宜模型跑。這些做法用戶看不到,但每一招都在省Token。
可以看到,越往下游,利潤(rùn)越薄,處境越難。最上游的英偉達(dá)穩(wěn)賺,最下游的應(yīng)用公司在生死線上掙扎。而用戶的直觀感受就是,Token越來(lái)越貴了。
誰(shuí)在焦慮,誰(shuí)在狂歡?
焦慮,在普通用戶和開發(fā)者中蔓延。“月薪2萬(wàn),我養(yǎng)不起自己的AI員工”——這句調(diào)侃正在變成越來(lái)越多人的真實(shí)處境。
程序員艾瑞克是較早開始養(yǎng)龍蝦的一批人。他用龍蝦來(lái)自動(dòng)化處理代碼審查和簡(jiǎn)單的bug修復(fù),最初一個(gè)月只花了幾十塊錢。
但隨著他給龍蝦配置了更多技能包——自動(dòng)讀取GitHub issue、調(diào)用測(cè)試環(huán)境、發(fā)送報(bào)告——Token消耗量直線上升。現(xiàn)在他每個(gè)月要花近千元。錢不算少,但讓他不舒服的是,這個(gè)數(shù)字在沒(méi)有任何預(yù)警地緩慢爬升,像一筆看不見的固定支出。
![]()
圖源:網(wǎng)絡(luò)
95后運(yùn)營(yíng)小可(化名)的賬單則呈現(xiàn)出另一種焦慮。
他養(yǎng)了兩只龍蝦,一只負(fù)責(zé)監(jiān)控競(jìng)品動(dòng)態(tài),每天抓取信息后自動(dòng)整理成簡(jiǎn)報(bào);另一只負(fù)責(zé)整理知識(shí)庫(kù)并批量生成自媒體賬號(hào)內(nèi)容。兩個(gè)數(shù)字員工24小時(shí)運(yùn)轉(zhuǎn),一個(gè)月下來(lái)Token費(fèi)用超過(guò)200元。
但比賬單更讓他頭疼的,是龍蝦的不可控。偷懶是常事——在某個(gè)環(huán)節(jié)卡住后反復(fù)重試同一個(gè)步驟,Token在燃燒,產(chǎn)出卻為零。
更離譜的是欺騙:龍蝦有時(shí)會(huì)過(guò)度夸大自己的能力,只要不被發(fā)現(xiàn)就默認(rèn)自己能完成。小可不得不在Soul.md里反復(fù)調(diào)整指令,定期檢查執(zhí)行記錄,像管理一個(gè)不太靠譜的實(shí)習(xí)生。
小可的技術(shù)路徑幾經(jīng)調(diào)整。最早他用的是一個(gè)國(guó)內(nèi)某云端Agent工具,但響應(yīng)慢、功能弱,很快就棄用了。
后來(lái)他轉(zhuǎn)向openclaw本地化部署,通過(guò)火山引擎的coding plank服務(wù)調(diào)用Kimi 2.5模型。這套方案相當(dāng)克制,基礎(chǔ)賬單僅需每月40元。但任務(wù)一多,coding plan就自動(dòng)升級(jí)到200元每月——賬單永遠(yuǎn)追著需求跑。
![]()
圖源:網(wǎng)絡(luò)
他也動(dòng)過(guò)換用GPT或Claude的念頭,但試用之后發(fā)現(xiàn),在自己需求下國(guó)內(nèi)和國(guó)外模型交付差異不大,但是國(guó)外模型Token費(fèi)用翻了好幾倍,用起來(lái)實(shí)在心疼。最后還是用回了國(guó)內(nèi)模型,畢竟國(guó)內(nèi)模型還是要便宜很多。
如果說(shuō)這些還算可控,那智能體的心跳機(jī)制和自動(dòng)循環(huán),才是真正的暗坑。用戶不知情時(shí),一個(gè)配置失誤就能讓Token一夜之間燒光。當(dāng)AI幾分鐘就能完成你一周的工作,當(dāng)你的數(shù)字員工比你本人還燒錢,認(rèn)知焦慮與經(jīng)濟(jì)壓力便同時(shí)襲來(lái)。
面對(duì)這個(gè)問(wèn)題,有人想出了土辦法:設(shè)置電腦定時(shí)關(guān)閉,或者把openclaw部署在U盤上,通過(guò)插拔U盤來(lái)物理斷電。用最原始的方式,給這個(gè)不知疲倦的數(shù)字員工裝上了一個(gè)看得見的開關(guān)。
狂歡,屬于產(chǎn)業(yè)鏈上游的收租人。英偉達(dá)的市值和毛利率,云廠商的漲價(jià)底氣,都源于它們?cè)赥oken價(jià)值鏈上的不可替代性。無(wú)論AI應(yīng)用層如何洗牌,它們都是穩(wěn)坐釣魚臺(tái)的贏家。
結(jié)語(yǔ)
這場(chǎng)Token狂飆,最后會(huì)走向哪里?
我覺(jué)得,它會(huì)倒逼整個(gè)產(chǎn)業(yè)回歸兩個(gè)常識(shí)。
第一,算力成本終究會(huì)回歸商品屬性。短期內(nèi)存漲價(jià)、供需失衡,但技術(shù)進(jìn)步不會(huì)停。更高效的模型架構(gòu)、更好的推理優(yōu)化、把模型焊在芯片上的專用芯片創(chuàng)新,都會(huì)持續(xù)壓低Token的生產(chǎn)成本。長(zhǎng)期看,Token的單價(jià)一定是往下走的。
![]()
圖源:網(wǎng)絡(luò)
第二,投入產(chǎn)出比會(huì)成為唯一的衡量標(biāo)準(zhǔn)。燒Token不是目的,用Token創(chuàng)造價(jià)值才是。市場(chǎng)從狂熱回歸理性之后,企業(yè)不會(huì)再看“Tokenmaxxing”,而是會(huì)問(wèn):這100萬(wàn)Token,到底幫我干了多少活?掙了多少錢?
智能體本身也需要進(jìn)化,需要在有限的嘗試中,找到使用Token最具效率的方法。
那些只靠補(bǔ)貼用戶燒Token、自己沒(méi)有核心價(jià)值創(chuàng)造的應(yīng)用,會(huì)最先倒下。能精確衡量任務(wù)成本、優(yōu)化Token效率、建起高轉(zhuǎn)換成本壁壘的公司,才能活下來(lái)。
Token越來(lái)越貴的今天,我們需要的不是制造焦慮,也不是鼓勵(lì)無(wú)度消耗。
畢竟,商業(yè)的終極理性,從來(lái)不是燒掉多少燃料,而是走了多遠(yuǎn)的路。
參考資料:
1、《「燒Token」成KPI,有程序員一個(gè)月花掉15w》騰訊科技
2、《為什么所有人都覺(jué)得 MiniMax、智譜「太貴了」?》極客公園
3、《月薪2萬(wàn),我養(yǎng)不起自己的“AI員工”》鳳凰WEEKLY
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.