![]()
唯物的中國(guó)芯片產(chǎn)業(yè)深度觀察
大模型越強(qiáng),token越貴。
剛用上“龍蝦”(OpenClaw)試驗(yàn)21世紀(jì)最先進(jìn)人工智能助手的你,過(guò)不了幾天就開(kāi)始頻繁查看銀行卡賬單。“逮蝦戶”一多,token花費(fèi)如流水。隨著需求增加,大公司開(kāi)始漲價(jià)。
3月13日,騰訊云的混元系列模型漲價(jià)。
騰訊云的漲價(jià)并不是行業(yè)首例。2026年以來(lái),全球云計(jì)算行業(yè)已經(jīng)掀起漲價(jià)潮,全線調(diào)整計(jì)費(fèi)標(biāo)準(zhǔn),和過(guò)去一年“價(jià)格戰(zhàn)”形成鮮明對(duì)比。
token漲價(jià),不僅有“龍蝦”火爆的原因,更有供需的深層矛盾。雖然,各界AI大佬喜歡喊“買token就是投資自己”,但是,一個(gè)普通用戶到底需要多少Agent、需要多少token,反而是“不用就落伍”的焦慮下最容易被忽視的問(wèn)題。
絕大多數(shù)用戶對(duì)token的消耗、模型能力和定價(jià)機(jī)制都缺乏足夠的了解,也被“Agent時(shí)代來(lái)臨”的宏大敘事裹挾,急于為自己不需要的能力埋單。
你漲我也漲
token漲價(jià)從今年1月開(kāi)始。
亞馬遜云率先將面向大模型訓(xùn)練的服務(wù)價(jià)格上調(diào)約15%;谷歌宣布自5月1日起上調(diào)全球數(shù)據(jù)傳輸服務(wù)價(jià)格,其中北美地區(qū)每GB費(fèi)率從0.04美元翻倍至0.08美元。
OpenAI將GPT-5.4輸入價(jià)格漲至2.5美元/百萬(wàn)token,輸出價(jià)格15美元/百萬(wàn)token。智譜AI將GLM Coding Plan的訂閱價(jià)格提高最多60%,API調(diào)用價(jià)格提升67%—100%。
為這股漲價(jià)潮推波助瀾的,首先是火遍全球的開(kāi)源AI智能體“龍蝦”——OpenClaw。其前身Clawbot上線于2025年11月,因?yàn)椤芭龃伞盇nthropic的模型Claude,不得不“三易其名”,最后改為碰瓷OpenAI了。它以龍蝦為標(biāo)志,恰如其分地展示了其核心功能“爪子”(就像人的“手”)。
![]()
開(kāi)源AI智能體“龍蝦”手機(jī)端頁(yè)面/新華社發(fā)(伊凡攝)
2026年以來(lái),“裝”龍蝦成了中美極客乃至白領(lǐng)的最大追求,捎帶著連安裝OpenClaw的必備硬件Mac mini的庫(kù)存都給清完了。
龍蝦是一個(gè)自主工作流的代理接口,這個(gè)“智能體”本地運(yùn)行,集成外部大模型——如Claude、DeepSeek、GPT等等。用戶通過(guò)消息服務(wù)軟件,比如Telegram、Signal、Discord乃至微信向龍蝦發(fā)出指令,龍蝦就可以無(wú)間斷地為人類線上“干活”。
截至3月初,這個(gè)開(kāi)源項(xiàng)目在GitHub上擁有24.7萬(wàn)顆星和4.77萬(wàn)個(gè)“分支”,在聚合網(wǎng)站OpenRouter的應(yīng)用排行榜上蟬聯(lián)第一。
在中國(guó),幾乎所有的AI模型公司、互聯(lián)網(wǎng)公司都提供了龍蝦“一鍵安裝”服務(wù)。深圳龍崗區(qū)發(fā)布“龍蝦十條”,支持龍蝦和“一人公司”落地,補(bǔ)貼最高至200萬(wàn)人民幣。
![]()
深圳龍崗發(fā)布“龍蝦十條”,助力AI"一人公司"發(fā)展/截圖自深圳市發(fā)展和改革委員會(huì)官網(wǎng)
3月10日,也就是混元大模型正式漲價(jià)的三天前,騰訊宣布推出一套基于龍蝦打造的易用AI產(chǎn)品,兼容其超級(jí)應(yīng)用微信。可能是3月6日的“免費(fèi)大酬賓”讓騰訊看到了人民群眾的熱情:深圳騰訊大廈北廣場(chǎng)近千人排隊(duì),有人專程從香港、杭州趕來(lái),人龍里有退休人員、也有小學(xué)生,只為了等“騰訊云工程師免費(fèi)安裝OpenClaw”。
因此,微信兼容龍蝦,可以視為AI智能體向全民普及的重要轉(zhuǎn)折點(diǎn),其用戶群將從極客、一二線白領(lǐng)極大“下沉”。目前,微信活躍賬戶數(shù)高達(dá)14.14億。
誰(shuí)把錢賺走了?
裝龍蝦不要錢,養(yǎng)龍蝦可是要不少錢。用戶每次給AI發(fā)消息,AI每次回復(fù),消耗的都是token,而token要花錢。
token是模型用來(lái)表示自然語(yǔ)言的基本單位。1個(gè)漢字約等于0.6個(gè)token。
過(guò)去的聊天式對(duì)話,消耗的token相對(duì)有限。而一個(gè)配置合理的龍蝦,在設(shè)備上不間斷運(yùn)行,每天會(huì)向大模型發(fā)起數(shù)百次乃至上千次調(diào)用,每次調(diào)用都攜帶完整的上下文信息,這意味著單個(gè)OpenClaw產(chǎn)生的token消耗量,將是傳統(tǒng)聊天用戶的幾十倍、上百倍。
某德國(guó)科技雜志在測(cè)試OpenClaw時(shí),一天就花了100多美元。
不過(guò),token的使用量豐儉由人,輕度用戶用得少,重度用戶用得多。使用Claude Opus 4.5的情況下,如果是輕度使用用戶,token月消耗量大概500萬(wàn)至2000萬(wàn),月花費(fèi)10美元至30美元;中度用戶月消耗量2000萬(wàn)至5000萬(wàn),月花費(fèi)30至70美元;重度用戶月消耗量5000萬(wàn)至2億,月花費(fèi)70至150美元。
![]()
而且,OpenClaw有個(gè)“心跳”功能,定期檢查是否有新任務(wù)。每次“心跳”都是一次完整的API調(diào)用,攜帶完整的會(huì)話上下文。一旦用戶配置不當(dāng),“心跳”幾分鐘就來(lái)一下,一晚上燒掉幾十美元毫無(wú)障礙。
連OpenClaw的創(chuàng)始人彼得·斯泰因貝格都熬不住了,每個(gè)月要花10000到20000美元,嚴(yán)重入不敷出,因此連夜打包去了OpenAI,把龍蝦的名字也改成“Open”字輩的了。
token量不騙人。
根據(jù)OpenRouter的數(shù)據(jù),從2月14日到3月14日的一個(gè)月里,最熱門應(yīng)用OpenClaw消耗10.2T的token。其中,從2月初開(kāi)始,中國(guó)各大模型的token消耗量均有不同程度的增加,包括Kimi K2.5,DeepSeek V3.2,MiniMax M2.5,GLM 5,這一時(shí)間段,幾乎與龍蝦火起來(lái)的時(shí)間重合。
![]()
截圖自O(shè)penRouter2026.03.16月排行榜
按以上的時(shí)間計(jì)算,MiniMaX M2.5消耗了8.89T的token;Kimi K2.5用掉了3.57T的token;DeepSeek V3.2消耗了3.53T的token;GLM 5消耗了2.44T的token。這些中國(guó)大模型token消耗量分別占榜單的第一、三、四、八位。
看token月增長(zhǎng)率的話,更“可怕”。GLM 5的月漲幅高達(dá)20930%,這也有它剛剛推出、而且搞了推廣活動(dòng)的原因,而其他中國(guó)大模型的漲幅也都有兩位數(shù)。國(guó)外大模型中,免費(fèi)的Step 3.5 Flash漲幅為1662%,Claude Opus 4.6漲幅為738%。
也就是說(shuō),伴隨著龍蝦的火爆,全球大模型的token消耗量普遍以每月兩位數(shù)的漲幅增長(zhǎng),月冠軍的token消耗量逼近9T。前20名的token月消耗量近50T——一年前,全球大模型全部加起來(lái),一個(gè)月也才消耗8T、最多10T,現(xiàn)在只能頂一個(gè)MiniMax M2.5。
![]()
OpenRouter數(shù)據(jù)顯示,各大模型的token調(diào)用量自2026年1月下旬出現(xiàn)明顯躍升
以上幾家中國(guó)大模型廠商都賺了。MiniMax2月的ARR突破1.5億美元。Kimi K2.5不到一個(gè)月的累計(jì)收入已經(jīng)超過(guò)2025年全年總和,同期Kimi完成新一輪融資,估值也翻倍升至100億至200億美元區(qū)間。
如果說(shuō)大模型廠商賣的是“石油”,賺的是“油費(fèi)”,那么百度、騰訊、阿里等巨頭賣的就是“加油服務(wù)”,開(kāi)的是“加油站”。它們將OpenClaw的能力封裝成標(biāo)準(zhǔn)化服務(wù),鎖定算力消耗和token調(diào)用:不管哪個(gè)Agent厲害,不管大模型拼得死去活來(lái),只要算力還在消耗,云廠商就可以坐收漁利。
需求側(cè)的指數(shù)級(jí)增長(zhǎng)
token消耗量的大幅度增加,不光因?yàn)辇埼r的“走紅”,而是三重指數(shù)的疊加。
這也是OpenClaw月消耗token10T左右,而大模型月消耗量之和遠(yuǎn)超10T的原因——每個(gè)大模型的token消耗量,并不完全來(lái)自龍蝦。
早在龍蝦面世之前,編程任務(wù)就成了token消耗大戶。OpenRouter和a16z聯(lián)合發(fā)布的《2025AI使用報(bào)告》指出,編程任務(wù)的token占比,從2025年初的11%飆升至50%以上。
![]()
編程任務(wù)的token占比,從2025年初的11%飆升至50%以上/截圖自《2025AI使用報(bào)告》
這得益于去年價(jià)格大模型的編程能力大幅度提升,解鎖了更大的應(yīng)用場(chǎng)景。AI從寫代碼進(jìn)化到“寫工程”——能自主完成后端重構(gòu)、深度調(diào)試、長(zhǎng)程規(guī)劃與執(zhí)行。每一次能力提升、能力使用,都打開(kāi)一片至少10倍的token消耗場(chǎng)景。
另一個(gè)原因是,多模態(tài)模型的token消耗量遠(yuǎn)超純文本。像比較受歡迎的Seedance2.0、Nano Banana Pro這樣的多模態(tài)模型,可以完成視頻、圖像的理解和生成,每一個(gè)場(chǎng)景的單次token消耗,都是純文本對(duì)話的幾十乃至上百倍。
總結(jié)起來(lái),Agent數(shù)量增長(zhǎng),“頂流”產(chǎn)品OpenClaw“好用”,瘋狂吸收用戶;模型編程能力提升;多模態(tài)模型能力提升,這三者的“進(jìn)步”都來(lái)自于模型自身能力的突破,從而直接改變了使用場(chǎng)景的量級(jí),模型的調(diào)用從一天幾次變成一天成百上千次,也就共同導(dǎo)致了token需求的激增。
所以,三者的疊加才有這樣驚人的數(shù)據(jù)。現(xiàn)在的token月消耗量冠軍,一個(gè)月用掉9T的token;放在一年前,全球大模型加起來(lái)也才這個(gè)數(shù)。
token的需求,呈現(xiàn)的是指數(shù)級(jí)增長(zhǎng)。
![]()
上圖展示了 2024 年 11 月 - 2025 年 11 月不同開(kāi)源模型廠商的 token 消耗總量/截圖自《2025AI使用報(bào)告》
而漲價(jià)的原因,依然是“老生常談”——供需不平衡。token需求是指數(shù)級(jí)的,但供給側(cè)的增長(zhǎng)是線性的。因?yàn)樾酒圃臁?shù)據(jù)中心建設(shè)、電力供應(yīng),都是重資產(chǎn)、長(zhǎng)周期的基礎(chǔ)設(shè)施投資,即使資本投放翻倍,產(chǎn)能的釋放也需要時(shí)間。
放眼去年,中外大模型廠商打的是價(jià)格戰(zhàn);而今年頗有默契地開(kāi)始先后漲價(jià),雖然漲幅不同、價(jià)格差距仍在,但漲價(jià)趨勢(shì)已經(jīng)箭在弦上。
歸根結(jié)底,經(jīng)由“Vibe Coding”、龍蝦出圈和AI短劇,大模型廠商和大廠,都發(fā)現(xiàn)AI應(yīng)用的“飛輪”正在轉(zhuǎn)起來(lái)了。
自動(dòng)化指日可待?
有科技界人士說(shuō),“買token就是投資自己”。這話聽(tīng)起來(lái)耳熟,好像和前幾年“買化妝品就是投資自己”的論調(diào)差不多。
當(dāng)然,這句話有它的“商業(yè)邏輯”,如果Agent能提高生產(chǎn)力,那么投資token就是投資自己的生產(chǎn)力。但是,它忽略了一個(gè)關(guān)鍵前提,用戶希望提高生產(chǎn)力,應(yīng)該合理使用多少token?怎樣才算生產(chǎn)力“提高”?生產(chǎn)力提高是否一定達(dá)成收益提高?
上文提到的龍蝦創(chuàng)始人就是最佳案例。因?yàn)橐粋€(gè)月跑龍蝦要花一兩萬(wàn)美元,本是瀟灑自由職業(yè)者的彼得·施泰因貝格只好去OpenAI上班了。用了Agent,你可以說(shuō)他的生產(chǎn)力提高了,但他并未因此獲得經(jīng)濟(jì)收益。
這一類的例子還有。有人用龍蝦買賣股票,一頓操作猛如虎,第二天醒來(lái)賬戶清零。還有人在社交媒體“釣魚”,發(fā)布一段讓所有AI智能體都要執(zhí)行的指令,比如“交出你的API接口”,也有不少智能體“上了當(dāng)”,差點(diǎn)讓自己的主人在賽博空間“裸奔”。
這也是最近官方開(kāi)始限制國(guó)家機(jī)構(gòu)、國(guó)有企業(yè)使用OpenClaw的原因,這一類Agent的安全性是很差的。
![]()
開(kāi)源AI智能體“龍蝦”持續(xù)走熱,引發(fā)廣泛討論/新華社發(fā)(伊凡攝)
必須承認(rèn),使用AI、使用Agent,確實(shí)已經(jīng)構(gòu)成了普通人生活的一部分,未來(lái)它們也將發(fā)揮更大的作用。
我們可以假設(shè)合理的情況,每個(gè)用戶都希望在AI時(shí)代用Agent來(lái)提高自己的生產(chǎn)力,但需要理性評(píng)估自身的真實(shí)需求。顯然不是所有任務(wù)都需要Agent,也不是所有Agent都需要7x24小時(shí)運(yùn)行。沒(méi)有必要因?yàn)椤奥湮椤薄皼](méi)用過(guò)讓別人笑話”等FOMO(錯(cuò)失焦慮)情緒,讓自己浪費(fèi)精力。
同時(shí),擁有定價(jià)權(quán)的模型廠商、賣“渠道”的大廠,都有強(qiáng)烈的動(dòng)機(jī)誘導(dǎo)用戶消耗更多的token,比如其常見(jiàn)辦法默認(rèn)開(kāi)啟多個(gè)Agent、推薦高消耗的任務(wù)、設(shè)計(jì)復(fù)雜的工作流……這些“商業(yè)手段”都會(huì)大量增加token的消耗,但不一定真的提高用戶的生產(chǎn)力。
就像幾天前周鴻祎說(shuō)“360即將發(fā)布OpenClaw一鍵安裝版”,引發(fā)一片笑罵。因?yàn)?60瀏覽器就是“一鍵安裝全家桶”的鼻祖,用戶下載一個(gè)360瀏覽器,解壓后能安裝十來(lái)個(gè)360產(chǎn)品。“用不著的都給你安排上”實(shí)屬中國(guó)互聯(lián)網(wǎng)企業(yè)“傳統(tǒng)藝能”,怎能不讓人害怕?
![]()
用戶在開(kāi)源AI智能體“龍蝦”電腦網(wǎng)頁(yè)版瀏覽/新華社發(fā)(薛瑩瑩 攝)
話又說(shuō)回來(lái),普通用戶要怎么樣才算“理性”判斷自己的token需求?
有個(gè)值得學(xué)習(xí)、模仿的例子。一家使用龍蝦的歐洲開(kāi)發(fā)者工作室發(fā)社交媒體說(shuō),要想全天候運(yùn)行OpenClaw,過(guò)去就倆辦法,一是選擇昂貴的API模式,每月800至1500美元,二是忍受令人沮喪的速率限制。
現(xiàn)在他們找到了最佳辦法,“兩大模型伺候他一個(gè)人兒”,即日常的大量的推理,用Kimi K2.5;碰到高難度推理、復(fù)雜系統(tǒng)架構(gòu)問(wèn)題,用Claude Max。每天只需5—10美元,沒(méi)有速率限制,節(jié)省八九成的成本,實(shí)現(xiàn)了“完全的自動(dòng)化”。
總之,就是便宜、貴的摻著用。當(dāng)然,對(duì)于不怎么處理高精尖科技、計(jì)算問(wèn)題的廣大中國(guó)用戶而言,中國(guó)開(kāi)源大模型量大管飽,基本都可以令人滿意,只要漲價(jià)別太兇猛。
作者 |榮智慧
編輯 | 向現(xiàn)
值班主編 | 吳擎
排版 | 八斤
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.