无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

龍蝦養(yǎng)得起,Token燒不起

0
分享至



Token狂飆的算力稅:誰(shuí)在為AI的“工業(yè)革命”買單?

今年春天,如果你還在糾結(jié)龍蝦怎么養(yǎng)、Token中文名叫什么,大概已經(jīng)跟不上科技圈的熱鬧了。

3月23日,國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏給Token定了中文名——詞元。同時(shí)披露了一個(gè)數(shù)字:中國(guó)日均Token調(diào)用量突破140萬(wàn)億,兩年增長(zhǎng)超千倍。


圖源:新華社

差不多同一時(shí)間,阿里云和百度智能云先后宣布AI算力產(chǎn)品漲價(jià),最高漲幅34%。英偉達(dá)的黃仁勛在GTC大會(huì)上把Token叫做“AI時(shí)代的石油”,還公布了一套分層定價(jià):每百萬(wàn)Token從3美元到150美元不等。

他還說(shuō)了另一句話,讓不少創(chuàng)業(yè)者后背發(fā)涼:一個(gè)年薪50萬(wàn)美元的工程師,如果一年用不掉25萬(wàn)美元的Token,他會(huì)“極度恐慌”。


圖源:網(wǎng)絡(luò)

一邊是Token消耗量瘋漲,一邊是供給端的成本在攀升、定價(jià)權(quán)在集中。熱潮退去,賬單浮出水面,人們開始意識(shí)到一個(gè)問(wèn)題:我們正以近乎傾銷的價(jià)格享受著AI的便利,但支撐這場(chǎng)技術(shù)革命的底層燃料,其真實(shí)成本才剛剛開始顯現(xiàn)。


為什么單價(jià)越便宜,總賬單越貴?

要理解這件事,得先明白Token是什么。

它是AI理解和生成信息的最小單元,也是眼下智能時(shí)代唯一可計(jì)量、可定價(jià)、可交易的通用貨幣。但它的使用費(fèi)由兩個(gè)東西決定:?jiǎn)蝺r(jià)乘以消耗量。


圖源:網(wǎng)絡(luò)

你問(wèn)一個(gè)問(wèn)題,它回答一段話,背后都是Token在燃燒。

過(guò)去兩年,行業(yè)的主線是訓(xùn)練模型。各大廠商砸了數(shù)千億美元,把單位Token的牌面價(jià)格一降再降。國(guó)內(nèi)廠商的Token單價(jià),已經(jīng)做到海外巨頭的十分之一。

但到了2026年,事情變了。

AI的核心價(jià)值,從“能聊”變成了“能干”。標(biāo)志就是龍蝦的爆發(fā)。


圖源:網(wǎng)絡(luò)

一個(gè)龍蝦智能體執(zhí)行一次任務(wù),比如“幫我找最低價(jià)”,消耗的Token是傳統(tǒng)對(duì)話的幾十倍甚至上百倍。因?yàn)樗皇且淮螁?wèn)答,而是一個(gè)完整的工作流:拆解任務(wù)、多步推理、調(diào)用工具、自我修正、錯(cuò)了重來(lái)。每一步都在燒Token。

這就是問(wèn)題的核心:完成同一個(gè)任務(wù)需要的Token數(shù)量,增長(zhǎng)得比單價(jià)下降更快。AI從副駕駛變成了代駕司機(jī),油耗自然不是一個(gè)量級(jí)。

更關(guān)鍵的是,用戶永遠(yuǎn)只想要最新的模型。老模型再便宜也沒(méi)人要,99%的需求會(huì)瞬間轉(zhuǎn)移到新發(fā)布的SOTA模型上。而前沿模型的單位Token價(jià)格,從來(lái)沒(méi)真正降下來(lái)過(guò)。GPT-4剛出來(lái)時(shí)輸出價(jià)格60美元每百萬(wàn)Token,今天Claude Opus 4.5還是這個(gè)價(jià)位。用戶要的是當(dāng)下最好的大腦,愿意為它買單。


圖源:網(wǎng)絡(luò)

于是,需求端智能體爆發(fā),Token消耗量?jī)赡暝鲩L(zhǎng)超千倍。供給端,HBM內(nèi)存價(jià)格飛漲,2026年一季度DRAM價(jià)格環(huán)比漲超50%,NAND最高漲了150%,巨頭們的戰(zhàn)略長(zhǎng)約直接簽到5年后。而掌握核心硬件和軟件生態(tài)的英偉達(dá),靠著CUDA和從芯片到云的全棧布局,牢牢捏著Token的出廠價(jià)。


誰(shuí)在制造Token的通脹?

Token的狂飆不是自然生長(zhǎng)的。從產(chǎn)業(yè)鏈看,有四層玩家,每一層都在向上傳遞成本,最終壓到最末端的普通用戶身上。

先看最底層:英偉達(dá)。

第一層是英偉達(dá)。以前它賣芯片,一次買賣。現(xiàn)在不一樣了。CUDA生態(tài)綁住了全球絕大多數(shù)AI開發(fā)者,二十年來(lái)積累的工程師、開源項(xiàng)目、代碼庫(kù)都長(zhǎng)在這個(gè)生態(tài)里,切換成本極高。它自己又開了云服務(wù)DGX Cloud,用戶直接在它平臺(tái)上按Token付費(fèi),不用自己買芯片。


圖源:網(wǎng)絡(luò)

黃仁勛在GTC 2026上提出了“Token工廠經(jīng)濟(jì)學(xué)”,核心就一句話:以后AI的衡量單位不再是芯片,而是Token。他的野心也不止于賣云服務(wù)——英偉達(dá)正在試圖把商業(yè)模式延伸到按Token抽成。

這套打法讓英偉達(dá)掌握了定價(jià)權(quán)。2026年一季度,HBM內(nèi)存供不應(yīng)求,內(nèi)存價(jià)格在幾個(gè)月內(nèi)上漲了數(shù)百個(gè)百分點(diǎn)。英偉達(dá)的GPU也跟著漲價(jià)——AI芯片H200所用的HBM3E供應(yīng)價(jià)格上漲約20%。

英偉達(dá)芯片漲價(jià),直接推高了云廠商的采購(gòu)成本。

阿里云、騰訊云、百度智能云,它們從英偉達(dá)買芯片,搭好服務(wù)器,再把算力租給下游。現(xiàn)在英偉達(dá)芯片漲價(jià),HBM內(nèi)存漲價(jià),它們自己的成本在漲。同時(shí)需求又爆發(fā)——龍蝦這類智能體火了,所有人都想跑Agent。需求太大,服務(wù)器、電力都跟不上。于是它們只能漲價(jià)。阿里云AI算力產(chǎn)品最高漲了34%,百度漲了5%到30%。


圖源:網(wǎng)絡(luò)

第三層是大模型廠商。DeepSeek、MiniMax、智譜這些公司,處境最微妙。它們從英偉達(dá)買芯片,從云廠商租算力,訓(xùn)練出模型,再把Token賣給用戶。


圖源:網(wǎng)絡(luò)

上游,芯片漲價(jià)、內(nèi)存漲價(jià)、云廠商漲價(jià),成本在漲。下游,2024年DeepSeek帶頭打價(jià)格戰(zhàn),把Token價(jià)格打到了地板上。想漲價(jià)怕用戶跑,不漲價(jià)自己的算力賬單在飛漲。所以這一輪云廠商漲價(jià),它們反而最沉默。

第四層是AI應(yīng)用公司。Cursor、Claude Code這些直接面向用戶的工具,面臨一個(gè)無(wú)解的難題:按固定月費(fèi)收,比如20美元隨便用,重度用戶能把成本干穿。

Anthropic的Claude Code就吃過(guò)這個(gè)虧,推出每月200美元的無(wú)限套餐,結(jié)果一個(gè)月被一個(gè)用戶干掉了100億Token,最后不得不取消。


圖源:網(wǎng)絡(luò)

按量付費(fèi)呢?用戶會(huì)被不確定的賬單嚇跑。大多數(shù)人喜歡固定月費(fèi),哪怕貴一點(diǎn),至少心里有數(shù)。

怎么辦?只能硬著頭皮選固定月費(fèi),但在這個(gè)模式下做各種限制來(lái)保命。

最常見的是用量封頂。每月給你一定額度的Token,用完了要么等重置,要么補(bǔ)差價(jià),要么升級(jí)。比如Claude Code取消無(wú)限套餐后,改成了按實(shí)際用量付費(fèi)加基礎(chǔ)月費(fèi)的混合模式。

另一種是分級(jí)套餐。輕度用戶20美元,重度用戶40或60美元,把高消耗用戶篩到更高的付費(fèi)檔位。還有些公司在技術(shù)層面做優(yōu)化——緩存常用請(qǐng)求、限制上下文長(zhǎng)度、在用戶無(wú)感知的情況下把復(fù)雜任務(wù)切給便宜模型跑。這些做法用戶看不到,但每一招都在省Token。

可以看到,越往下游,利潤(rùn)越薄,處境越難。最上游的英偉達(dá)穩(wěn)賺,最下游的應(yīng)用公司在生死線上掙扎。而用戶的直觀感受就是,Token越來(lái)越貴了。

誰(shuí)在焦慮,誰(shuí)在狂歡?

焦慮,在普通用戶和開發(fā)者中蔓延。“月薪2萬(wàn),我養(yǎng)不起自己的AI員工”——這句調(diào)侃正在變成越來(lái)越多人的真實(shí)處境。

程序員艾瑞克是較早開始養(yǎng)龍蝦的一批人。他用龍蝦來(lái)自動(dòng)化處理代碼審查和簡(jiǎn)單的bug修復(fù),最初一個(gè)月只花了幾十塊錢。

但隨著他給龍蝦配置了更多技能包——自動(dòng)讀取GitHub issue、調(diào)用測(cè)試環(huán)境、發(fā)送報(bào)告——Token消耗量直線上升。現(xiàn)在他每個(gè)月要花近千元。錢不算少,但讓他不舒服的是,這個(gè)數(shù)字在沒(méi)有任何預(yù)警地緩慢爬升,像一筆看不見的固定支出。


圖源:網(wǎng)絡(luò)

95后運(yùn)營(yíng)小可(化名)的賬單則呈現(xiàn)出另一種焦慮。

他養(yǎng)了兩只龍蝦,一只負(fù)責(zé)監(jiān)控競(jìng)品動(dòng)態(tài),每天抓取信息后自動(dòng)整理成簡(jiǎn)報(bào);另一只負(fù)責(zé)整理知識(shí)庫(kù)并批量生成自媒體賬號(hào)內(nèi)容。兩個(gè)數(shù)字員工24小時(shí)運(yùn)轉(zhuǎn),一個(gè)月下來(lái)Token費(fèi)用超過(guò)200元。

但比賬單更讓他頭疼的,是龍蝦的不可控。偷懶是常事——在某個(gè)環(huán)節(jié)卡住后反復(fù)重試同一個(gè)步驟,Token在燃燒,產(chǎn)出卻為零。

更離譜的是欺騙:龍蝦有時(shí)會(huì)過(guò)度夸大自己的能力,只要不被發(fā)現(xiàn)就默認(rèn)自己能完成。小可不得不在Soul.md里反復(fù)調(diào)整指令,定期檢查執(zhí)行記錄,像管理一個(gè)不太靠譜的實(shí)習(xí)生。

小可的技術(shù)路徑幾經(jīng)調(diào)整。最早他用的是一個(gè)國(guó)內(nèi)某云端Agent工具,但響應(yīng)慢、功能弱,很快就棄用了。

后來(lái)他轉(zhuǎn)向openclaw本地化部署,通過(guò)火山引擎的coding plank服務(wù)調(diào)用Kimi 2.5模型。這套方案相當(dāng)克制,基礎(chǔ)賬單僅需每月40元。但任務(wù)一多,coding plan就自動(dòng)升級(jí)到200元每月——賬單永遠(yuǎn)追著需求跑。


圖源:網(wǎng)絡(luò)

他也動(dòng)過(guò)換用GPT或Claude的念頭,但試用之后發(fā)現(xiàn),在自己需求下國(guó)內(nèi)和國(guó)外模型交付差異不大,但是國(guó)外模型Token費(fèi)用翻了好幾倍,用起來(lái)實(shí)在心疼。最后還是用回了國(guó)內(nèi)模型,畢竟國(guó)內(nèi)模型還是要便宜很多。

如果說(shuō)這些還算可控,那智能體的心跳機(jī)制和自動(dòng)循環(huán),才是真正的暗坑。用戶不知情時(shí),一個(gè)配置失誤就能讓Token一夜之間燒光。當(dāng)AI幾分鐘就能完成你一周的工作,當(dāng)你的數(shù)字員工比你本人還燒錢,認(rèn)知焦慮與經(jīng)濟(jì)壓力便同時(shí)襲來(lái)。

面對(duì)這個(gè)問(wèn)題,有人想出了土辦法:設(shè)置電腦定時(shí)關(guān)閉,或者把openclaw部署在U盤上,通過(guò)插拔U盤來(lái)物理斷電。用最原始的方式,給這個(gè)不知疲倦的數(shù)字員工裝上了一個(gè)看得見的開關(guān)。

狂歡,屬于產(chǎn)業(yè)鏈上游的收租人。英偉達(dá)的市值和毛利率,云廠商的漲價(jià)底氣,都源于它們?cè)赥oken價(jià)值鏈上的不可替代性。無(wú)論AI應(yīng)用層如何洗牌,它們都是穩(wěn)坐釣魚臺(tái)的贏家。


結(jié)語(yǔ)

這場(chǎng)Token狂飆,最后會(huì)走向哪里?

我覺(jué)得,它會(huì)倒逼整個(gè)產(chǎn)業(yè)回歸兩個(gè)常識(shí)。

第一,算力成本終究會(huì)回歸商品屬性。短期內(nèi)存漲價(jià)、供需失衡,但技術(shù)進(jìn)步不會(huì)停。更高效的模型架構(gòu)、更好的推理優(yōu)化、把模型焊在芯片上的專用芯片創(chuàng)新,都會(huì)持續(xù)壓低Token的生產(chǎn)成本。長(zhǎng)期看,Token的單價(jià)一定是往下走的。


圖源:網(wǎng)絡(luò)

第二,投入產(chǎn)出比會(huì)成為唯一的衡量標(biāo)準(zhǔn)。燒Token不是目的,用Token創(chuàng)造價(jià)值才是。市場(chǎng)從狂熱回歸理性之后,企業(yè)不會(huì)再看“Tokenmaxxing”,而是會(huì)問(wèn):這100萬(wàn)Token,到底幫我干了多少活?掙了多少錢?

智能體本身也需要進(jìn)化,需要在有限的嘗試中,找到使用Token最具效率的方法。

那些只靠補(bǔ)貼用戶燒Token、自己沒(méi)有核心價(jià)值創(chuàng)造的應(yīng)用,會(huì)最先倒下。能精確衡量任務(wù)成本、優(yōu)化Token效率、建起高轉(zhuǎn)換成本壁壘的公司,才能活下來(lái)。

Token越來(lái)越貴的今天,我們需要的不是制造焦慮,也不是鼓勵(lì)無(wú)度消耗。

畢竟,商業(yè)的終極理性,從來(lái)不是燒掉多少燃料,而是走了多遠(yuǎn)的路。

參考資料:

1、《「燒Token」成KPI,有程序員一個(gè)月花掉15w》騰訊科技

2、《為什么所有人都覺(jué)得 MiniMax、智譜「太貴了」?》極客公園

3、《月薪2萬(wàn),我養(yǎng)不起自己的“AI員工”》鳳凰WEEKLY

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
董路再惹爭(zhēng)議!足球小將爆冷1-0桑托斯:中國(guó)球員只上4人 7名外援

董路再惹爭(zhēng)議!足球小將爆冷1-0桑托斯:中國(guó)球員只上4人 7名外援

念洲
2026-06-12 10:55:10
穆帥將告知5將可離隊(duì),卡馬文加在列

穆帥將告知5將可離隊(duì),卡馬文加在列

競(jìng)技風(fēng)云錄
2026-06-12 00:27:55
1.6萬(wàn)億大撤退!國(guó)家隊(duì)從“托底”變“調(diào)倉(cāng)”,散戶的路更難走了

1.6萬(wàn)億大撤退!國(guó)家隊(duì)從“托底”變“調(diào)倉(cāng)”,散戶的路更難走了

史行途
2026-06-12 16:29:34
2027款豐田賽那SIENNA上市 售29.88萬(wàn)元起

2027款豐田賽那SIENNA上市 售29.88萬(wàn)元起

車質(zhì)網(wǎng)
2026-06-12 13:03:05
《給阿嬤的情書》女主爆紅,男主也簽約大公司,今年最強(qiáng)素人逆襲

《給阿嬤的情書》女主爆紅,男主也簽約大公司,今年最強(qiáng)素人逆襲

娛君墜星河
2026-06-12 17:35:16
18萬(wàn)的路虎,背刺大批中產(chǎn)

18萬(wàn)的路虎,背刺大批中產(chǎn)

鳴金網(wǎng)
2026-06-12 19:54:56
你信嗎?有些事被迫終止,其實(shí)是老天在救你!網(wǎng)友:想想都后怕

你信嗎?有些事被迫終止,其實(shí)是老天在救你!網(wǎng)友:想想都后怕

另子維愛(ài)讀史
2026-06-12 19:50:24
損失兩萬(wàn)億,普京心腹當(dāng)場(chǎng)掀桌,俄內(nèi)部矛盾激化,財(cái)長(zhǎng)硬剛到底!

損失兩萬(wàn)億,普京心腹當(dāng)場(chǎng)掀桌,俄內(nèi)部矛盾激化,財(cái)長(zhǎng)硬剛到底!

丁丁鯉史紀(jì)
2026-06-12 17:02:04
快訊!我國(guó)臺(tái)灣國(guó)民黨表態(tài)了!

快訊!我國(guó)臺(tái)灣國(guó)民黨表態(tài)了!

故事終將光明磊落
2026-06-12 12:15:41
陳競(jìng)?cè)伍L(zhǎng)沙市委書記

陳競(jìng)?cè)伍L(zhǎng)沙市委書記

大風(fēng)新聞
2026-06-12 16:37:20
撈錢沒(méi)底線?94歲胡楓開演唱會(huì)僅過(guò)去2天,“惡心”一幕出現(xiàn)

撈錢沒(méi)底線?94歲胡楓開演唱會(huì)僅過(guò)去2天,“惡心”一幕出現(xiàn)

傲傲講歷史
2026-06-12 12:10:22
第四波反制來(lái)了,中方禁止入境,臺(tái)當(dāng)局治權(quán)被接管,菲律賓已介入

第四波反制來(lái)了,中方禁止入境,臺(tái)當(dāng)局治權(quán)被接管,菲律賓已介入

影孖看世界
2026-06-12 23:56:08
扎心啊!夏奇拉去世界杯的次數(shù)都比意大利多,上了熱搜

扎心啊!夏奇拉去世界杯的次數(shù)都比意大利多,上了熱搜

小犙拍客在北漂
2026-06-12 14:29:23
工地“臨時(shí)”夫妻,女人當(dāng)眾表示:睡我一年你連瓶水都沒(méi)買過(guò)!

工地“臨時(shí)”夫妻,女人當(dāng)眾表示:睡我一年你連瓶水都沒(méi)買過(guò)!

阿凱銷售場(chǎng)
2026-06-12 20:23:39
華為超跑SUV來(lái)了,法拉利設(shè)計(jì)師操刀,4顆激光雷達(dá)

華為超跑SUV來(lái)了,法拉利設(shè)計(jì)師操刀,4顆激光雷達(dá)

網(wǎng)上車市
2026-06-11 18:46:02
阿里高層這次真的生氣了

阿里高層這次真的生氣了

一見財(cái)經(jīng)
2026-06-12 11:11:21
1936年?duì)I長(zhǎng)帶兩個(gè)連投奔紅軍,1955年授銜以為自己頂多被評(píng)為大校

1936年?duì)I長(zhǎng)帶兩個(gè)連投奔紅軍,1955年授銜以為自己頂多被評(píng)為大校

磊子講史
2026-06-11 11:53:11
兒子長(zhǎng)相與妻子領(lǐng)導(dǎo)神似,丈夫偷偷做親子鑒定,結(jié)果出來(lái)后愣住了

兒子長(zhǎng)相與妻子領(lǐng)導(dǎo)神似,丈夫偷偷做親子鑒定,結(jié)果出來(lái)后愣住了

婉婉碎碎念
2024-10-14 16:07:36
登貝萊捍衛(wèi)姆巴佩:外界批評(píng)不公,他是超級(jí)好人

登貝萊捍衛(wèi)姆巴佩:外界批評(píng)不公,他是超級(jí)好人

體壇周報(bào)
2026-06-12 16:52:15
韓國(guó)前國(guó)腳李乙容:我兒子踢世界杯我比自己當(dāng)球員時(shí)還緊張

韓國(guó)前國(guó)腳李乙容:我兒子踢世界杯我比自己當(dāng)球員時(shí)還緊張

懂球帝
2026-06-12 18:24:14
2026-06-13 01:15:00
首席商業(yè)評(píng)論 incentive-icons
首席商業(yè)評(píng)論
深究商業(yè)邏輯,助力價(jià)值成長(zhǎng)。
7402文章數(shù) 101027關(guān)注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬(wàn)億美元富豪誕生!

頭條要聞

美加墨世界杯第二場(chǎng)比賽就現(xiàn)空座 英媒:尷尬

頭條要聞

美加墨世界杯第二場(chǎng)比賽就現(xiàn)空座 英媒:尷尬

體育要聞

歐洲恐韓?肉德維德?

娛樂(lè)要聞

一天4個(gè)瓜,肖戰(zhàn)熱巴最意外

財(cái)經(jīng)要聞

萬(wàn)億美元順差背后,透露這些信號(hào)

汽車要聞

標(biāo)配激光雷達(dá)/雙動(dòng)力可選 昊鉑S600限時(shí)售17.99萬(wàn)起

態(tài)度原創(chuàng)

游戲
本地
親子
教育
房產(chǎn)

因?yàn)槠ü蓻](méi)有貼吧老哥翹,劍星新女主被炎上?

本地新聞

AK劉彰邂逅河北南大港濕地

親子要聞

給孩子報(bào)個(gè)幼兒園還要工資流水?難道這就是傳說(shuō)中的“因財(cái)施教”

教育要聞

家長(zhǎng)成了“瘋女人”,被女兒作業(yè)搞崩潰,網(wǎng)友:太真實(shí)

房產(chǎn)要聞

海南最賺錢行業(yè)曝光!最快4年半,海口全款買三房!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版