无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

理性聊聊Token經(jīng)濟(jì)的泡沫問題

0
分享至


?潮涌AI編輯部

文|HAL

關(guān)于AI到底能不能“降本增效”,前不久Uber總裁兼COO安德魯·麥克唐納在一檔播客里講了一個細(xì)節(jié)。

他說,今年4月,Uber CTO普拉文·內(nèi)帕利·納加發(fā)現(xiàn)公司四個月就用光了2026全年的Claude Code預(yù)算。那一刻被他形容為“腦袋爆炸”。

得知這一噩耗之后,公司內(nèi)部開始認(rèn)真討論一件以前沒人當(dāng)回事的事:Token到底花了多少錢,這些錢換回了什么。

麥克唐納給出的結(jié)論很冷靜。他和高級工程負(fù)責(zé)人交流之后意識到,更高的Token消耗,并沒有換來同比例更多的、對用戶真正有用的功能。

那條“投入越多、產(chǎn)出越多”的曲線,他畫不出來。

他還有一句話說得很直接:AI不是免費(fèi)的。


圖源:網(wǎng)絡(luò)

這件事值得說,原因不在于Uber小氣不想花錢——它一年R&D投入三十多億美元,不差這點(diǎn)預(yù)算。關(guān)鍵在于,一家把AI用得這么猛、采用率這么高的公司,第一次公開承認(rèn)自己算不清這筆賬。

當(dāng)然,Uber也不是孤例。

微軟正在收回自家部門里大部分Claude Code的授權(quán),要求員工改用GitHub Copilot;擅長整活的語言學(xué)習(xí)平臺Duolingo也撤回了把AI使用量納入績效考核的做法,因?yàn)閱T工質(zhì)疑這個指標(biāo)獎勵的是“為用而用”;而在國內(nèi),米哈游的一位技術(shù)leader也在近期分享中無奈說道一次“慘痛”事件,由于工程師沒有設(shè)置Token消耗上限就下班離開,結(jié)果智能體連續(xù)運(yùn)行13小時,消耗了價值200萬元人民幣的Token,而這200萬在網(wǎng)友看來是無意義;甚至社交媒體上有消息表示,騰訊開始縮水員工的Token福利……

今年還未過半,企業(yè)們已經(jīng)要集體開始算Token賬了。

有意思的地方在這里——

所有人都覺得AI還在持續(xù)進(jìn)化模型還在變強(qiáng)Token單價還在跌采用率還在漲一切看起來都還在爬坡,離頂點(diǎn)還有距離。

可泡沫已經(jīng)先一步冒出來了。

Token越來越便宜,賬單卻越來越貴

先看一個反直覺的事實(shí)。

過去一年,主流廠商每百萬Token的平均成本從大約10美元跌到2.5美元;再往前看,2024年初要達(dá)到GPT-4級別的性能,每百萬Token大約要60美元;到2026年初,這個數(shù)字下降了超過98%,高效模型只要0.3到0.75美元。

Token在快速變便宜。但同一批看著Token價格下跌的企業(yè),月度賬單卻在成倍增長。

原因不復(fù)雜。

單價下跌只說了一半的故事。

企業(yè)消費(fèi)AI的方式變了。按2024年的Token費(fèi)率做的預(yù)算表,遇上2026年的用法,消耗的是預(yù)算的好幾倍。

國內(nèi)這邊,降幅比海外更大。

4月底,DeepSeek在兩天內(nèi)兩次降價,先給V4-Pro開了2.5折限時優(yōu)惠,又把全系輸入緩存命中價降到首發(fā)價的十分之一。原本說好5月31日恢復(fù)原價,結(jié)果5月22日宣布:2.5折不再限時,轉(zhuǎn)為永久。降價之后,V4-Pro緩存命中輸入每百萬Token只要0.025元。

緊接著是小米。5月27日MiMo-V2.5系列API宣布永久降價,最高降幅99%,同時取消了上下文窗口的分檔。雷軍轉(zhuǎn)發(fā)了這則消息,歡迎開發(fā)者接入。其緩存命中輸入價從每百萬Token 2.8元降到0.025元,與DeepSeek基本持平。


算下來,2026上半年中國各家大模型公司一共下調(diào)了六次API價格,其中三次宣布為永久降價。

但同一個市場里,還有另一批廠商在漲價。

字節(jié)豆包推出付費(fèi)訂閱,智譜三次上調(diào)API價格,阿里云和騰訊云相繼宣布漲價5%。一邊是DeepSeek、小米把價格壓到很低,一邊是另一批廠商往上調(diào)。同一個賽道,同一段時間,降價和漲價同時發(fā)生。

這一點(diǎn)比單純降價更值得琢磨。如果這個生意已經(jīng)有穩(wěn)定的盈利模型,價格應(yīng)該收斂到一個區(qū)間,而不會分成兩個方向。

價格分化,說明廠商對這東西該賣多少錢并沒有共識——有人想用補(bǔ)貼換規(guī)模,有人想靠漲價緩口氣,背后是同一個問題:還沒找到一條能站得住的成本線。

其中最大的變量其實(shí)是Agent。

聊天機(jī)器人時代,你問一句,它答一句,Token按單次調(diào)用計(jì)費(fèi)。Agent時代不同,它會自己拆解任務(wù)、調(diào)用工具、反復(fù)試錯,一個任務(wù)背后是幾十上百輪調(diào)用。同樣一件事,agentic工作流消耗的Token是聊天機(jī)器人的5到30倍,極端情況能到幾百倍甚至上千倍。


圖源:網(wǎng)絡(luò)

這才是Uber那筆賬算不清的根源。問題不在某一次漲價,而在整個使用范式換擋,把成本曲線整體抬高了一個量級。

這件事也對一個流行說法構(gòu)成了挑戰(zhàn):AI是基礎(chǔ)設(shè)施,邊際成本會趨近于零。

傳統(tǒng)軟件確實(shí)是這個邏輯。寫一次,托管成本極低,每多一個客戶的邊際成本接近于零,所以能做出75%到80%的毛利率。AI不適用這套邏輯。每一次推理、每一條回復(fù)、每一個代碼建議,背后都要消耗實(shí)際的算力。

而Agent把這個問題進(jìn)一步放大。如今推理已經(jīng)占到企業(yè)AI預(yù)算的85%,占AI總算力消耗的八到九成。產(chǎn)業(yè)越往Agent走,賬單越高,而不是越低。

所以,Uber現(xiàn)在做的事,是把Token消耗的成本,直接拿去和招人的成本作對比。一邊是工程師的工資,一邊是模型的賬單,擺在同一張表上比。

這是一個信號。

當(dāng)一家公司開始把算力賬單和招人成本放在一起核算的時候,意味著它已經(jīng)把AI當(dāng)成一項(xiàng)需要權(quán)衡的常規(guī)成本,而不再是無條件投入的戰(zhàn)略項(xiàng)目。

買方覺得貴了,但賣方自己也在虧

更值得注意的問題在供給這一端。

Uber們現(xiàn)在還覺得Token便宜,是因?yàn)檫@個價格本身被補(bǔ)貼過。它并不反映真實(shí)成本,更像一張還沒到期的優(yōu)惠券。

看毛利率。

據(jù)The Information報(bào)道,OpenAI去年毛利率從40%跌到33%,遠(yuǎn)低于自己46%的預(yù)測;Anthropic 2025年的毛利率預(yù)計(jì)只有40%,比目標(biāo)低了10個百分點(diǎn)——兩家都沒達(dá)標(biāo),主因都是同一個:推理成本失控,遠(yuǎn)超預(yù)期。

看絕對虧損。

OpenAI 2025年虧損約90億美元,2026年預(yù)計(jì)170億,2027年570億。有分析師把訓(xùn)練成本也計(jì)入后估算,OpenAI在每一塊“算力美元”上只收回大約0.68美元——也就是說,在支付任何工資和銷售費(fèi)用之前,僅硬件成本一項(xiàng),每1美元就要虧掉0.32美元。


圖源:網(wǎng)絡(luò)

這意味著用戶每發(fā)一條復(fù)雜查詢,AI公司實(shí)際上就在這筆交易上虧錢;而那些低價訂閱,恰恰是補(bǔ)貼力度最大的部分。

當(dāng)然這個劇本也并不陌生。

所謂“千禧一代生活方式補(bǔ)貼”,就是VC的錢幫你補(bǔ)貼了便宜的Uber打車和DoorDash外賣。今天你用的每一個Token,本質(zhì)上是這套補(bǔ)貼的AI版本。

補(bǔ)貼還有更隱蔽的一層。

這些AI大廠通過戰(zhàn)略合作拿到打折算力,華爾街有時候管這叫“循環(huán)融資”——微軟據(jù)報(bào)道以低于市場價向OpenAI供應(yīng)算力。可即便吃著這些折扣,OpenAI和Anthropic還是在虧錢。

補(bǔ)貼不會一直持續(xù)。已經(jīng)有從業(yè)者明確預(yù)告:當(dāng)前API定價是被補(bǔ)貼的,做2027年預(yù)算時應(yīng)該保守假設(shè)未來18個月API價格上漲30%到50%,因?yàn)閺S商遲早要轉(zhuǎn)向能盈利的單位經(jīng)濟(jì)學(xué)。

很多唱空者說得更直白,當(dāng)前這些價格戰(zhàn),是風(fēng)險(xiǎn)投資和超大規(guī)模廠商的交叉補(bǔ)貼撐起來的,一旦資本收緊,就難以為繼。

比如現(xiàn)在很多大公司發(fā)現(xiàn)Token賬單和產(chǎn)出對不上,開始算賬;賣方本身就在虧本經(jīng)營,遲早要漲價;漲價之后,買方的賬更難算。兩頭都還在虧生意,顯然中間總是有一些環(huán)節(jié)出了問題。

當(dāng)然,也有人不認(rèn)同這套判斷。

有一派的“餐巾紙算法”認(rèn)為推理其實(shí)是賺錢的——輸入Token的處理成本比輸出Token低近千倍,靠這種不對稱,API業(yè)務(wù)的毛利率可以達(dá)到軟件級別,即便估算偏差三倍也依然盈利。

但問題恰恰在這里。單Token更便宜不等于整體更便宜

當(dāng)Agent把每個任務(wù)的Token消耗抬高5到30倍,毛利能否擴(kuò)張,取決于成本下降的速度是否快過需求上升的速度。

這是一個還沒有答案的賭注。

而泡沫常常就出現(xiàn)在沒有答案的地方。

互聯(lián)網(wǎng)時代“先圈用戶、再談變現(xiàn)”的邏輯能成立,前提是邊際成本真的可以做到趨近于零,規(guī)模上來之后成本會被攤薄。

Token經(jīng)濟(jì)沒有這個前提——規(guī)模越大,消耗越多,所以,它可能比許多行業(yè)都更早,在自身還沒真正成熟的階段,就先遇上泡沫。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
紅星觀察丨世界杯遇冷,是FIFA的錯還是時代的鍋

紅星觀察丨世界杯遇冷,是FIFA的錯還是時代的鍋

紅星新聞
2026-06-12 13:50:28
劉浩存“臥魚”動作引全網(wǎng)模仿熱潮!專業(yè)戲曲從業(yè)者提醒

劉浩存“臥魚”動作引全網(wǎng)模仿熱潮!專業(yè)戲曲從業(yè)者提醒

韓小娛
2026-06-13 07:43:04
“摸奶子”再惹爭議,OPPO的流量反噬開始了

“摸奶子”再惹爭議,OPPO的流量反噬開始了

品牌頭版
2026-05-13 10:18:15
日本天皇對高市早苗的不滿,已經(jīng)到了差點(diǎn)“發(fā)飆”的地步了?

日本天皇對高市早苗的不滿,已經(jīng)到了差點(diǎn)“發(fā)飆”的地步了?

影孖看世界
2026-06-12 23:57:37
穆里尼奧硬剛皇馬高層!原定掃地出門的王牌,被狂人強(qiáng)行續(xù)約留隊(duì)

穆里尼奧硬剛皇馬高層!原定掃地出門的王牌,被狂人強(qiáng)行續(xù)約留隊(duì)

奶蓋熊本熊
2026-06-13 04:15:49
靠陪睡上位、搶胡可男友?從央視離職的她,為何擺脫不了身上污名

靠陪睡上位、搶胡可男友?從央視離職的她,為何擺脫不了身上污名

暖心萌阿菇?jīng)?/span>
2026-06-12 10:36:26
世界杯開幕式!labubu嚇了全球一跳

世界杯開幕式!labubu嚇了全球一跳

李東陽朋友圈
2026-06-12 08:35:34
布達(dá)拉宮地下世界復(fù)雜得嚇人!
金碧輝煌下藏著1200多個“地壟”

布達(dá)拉宮地下世界復(fù)雜得嚇人! 金碧輝煌下藏著1200多個“地壟”

西樓知趣雜談
2026-06-12 08:54:44
記者:加拿大世界杯開幕式引爭議

記者:加拿大世界杯開幕式引爭議

懂球帝
2026-06-13 03:05:31
約基奇聯(lián)手東契奇可能性為零?好友回應(yīng):等40歲去湖人拿一年底薪

約基奇聯(lián)手東契奇可能性為零?好友回應(yīng):等40歲去湖人拿一年底薪

羅說NBA
2026-06-13 06:34:33
為何單身老人喜歡請保姆?50歲保姆傾訴:大多不是為了花錢買服務(wù)

為何單身老人喜歡請保姆?50歲保姆傾訴:大多不是為了花錢買服務(wù)

烙任情感
2026-06-12 09:17:27
X航空公司空姐疑似偷拍同事,令人不齒啊。

X航空公司空姐疑似偷拍同事,令人不齒啊。

微微熱評
2026-06-12 12:04:32
國安部披露:在我國某海域發(fā)現(xiàn)有較大型活體海洋動物被掛上傳感器,竊取海洋敏感數(shù)據(jù)

國安部披露:在我國某海域發(fā)現(xiàn)有較大型活體海洋動物被掛上傳感器,竊取海洋敏感數(shù)據(jù)

每日經(jīng)濟(jì)新聞
2026-06-12 13:16:05
48歲喜提“七胞胎”兒子,全職奶爸一人帶7個娃,真實(shí)“身份”不只是礦業(yè)老板那么簡單

48歲喜提“七胞胎”兒子,全職奶爸一人帶7個娃,真實(shí)“身份”不只是礦業(yè)老板那么簡單

婚姻與家庭
2026-06-12 09:38:24
林鄭月娥:卸任特首后近況如何?工作42年,一直沒在香港買房

林鄭月娥:卸任特首后近況如何?工作42年,一直沒在香港買房

通文知史
2024-10-25 16:20:03
遙遙領(lǐng)先!余承東:世界還不知大模型是何物,我們就發(fā)布了盤古

遙遙領(lǐng)先!余承東:世界還不知大模型是何物,我們就發(fā)布了盤古

鞭牛士
2026-06-12 17:20:32
黃仁勛說清穿皮夾克原因,17歲后全靠老婆買衣服,30度高溫也不脫

黃仁勛說清穿皮夾克原因,17歲后全靠老婆買衣服,30度高溫也不脫

大廠編外實(shí)習(xí)生
2026-06-12 17:45:33
馬斯克成為人類首個10000億美元富豪,還帶動約400名員工成為億萬富翁;這些錢每小時花100萬美元24小時不停,可以花114年

馬斯克成為人類首個10000億美元富豪,還帶動約400名員工成為億萬富翁;這些錢每小時花100萬美元24小時不停,可以花114年

極目新聞
2026-06-12 22:59:31
男子找“貨拉拉”送4瓶茅臺,貨沒送到騎手失聯(lián),報(bào)警后騎手稱“摔車酒碎扔垃圾桶了”,無力賠償想用母親耗時5年制作的手工刺繡擔(dān)保

男子找“貨拉拉”送4瓶茅臺,貨沒送到騎手失聯(lián),報(bào)警后騎手稱“摔車酒碎扔垃圾桶了”,無力賠償想用母親耗時5年制作的手工刺繡擔(dān)保

都市快報(bào)橙柿互動
2026-06-12 23:25:23
心理學(xué):發(fā)生關(guān)系之后,人與人之間立刻變得不一樣,這正是人性的本質(zhì)所在

心理學(xué):發(fā)生關(guān)系之后,人與人之間立刻變得不一樣,這正是人性的本質(zhì)所在

心理觀察局
2026-06-13 06:58:15
2026-06-13 11:00:49
壹娛觀察 incentive-icons
壹娛觀察
想做泛娛樂產(chǎn)業(yè)的望遠(yuǎn)鏡和聲吶
2455文章數(shù) 5914關(guān)注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

沈逸:日菲"地圖開疆"耍花招 中方高度敏感明確回應(yīng)

頭條要聞

沈逸:日菲"地圖開疆"耍花招 中方高度敏感明確回應(yīng)

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

12年情懷碎一地!跑男接連翻車

財(cái)經(jīng)要聞

梁文鋒向左,楊植麟向右

汽車要聞

標(biāo)配激光雷達(dá)/雙動力可選 昊鉑S600限時售17.99萬起

態(tài)度原創(chuàng)

家居
健康
藝術(shù)
房產(chǎn)
教育

家居要聞

空間微調(diào) 移形換境

老人、小孩、孕婦,吃粽子有啥風(fēng)險(xiǎn)

藝術(shù)要聞

砸了640億,再賠160億!沙特“The Line”項(xiàng)目徹底涼了?

房產(chǎn)要聞

海南最賺錢行業(yè)曝光!最快4年半,海口全款買三房!

教育要聞

高考出分后,如何沖穩(wěn)保選院校志愿?

無障礙瀏覽 進(jìn)入關(guān)懷版