![]()
圖源 | Tech星球
文| 王琳
全員Token-maxxing(把Token用量拉到極限)還沒倆月,互聯網公司急速調轉船頭。
6月5日,騰訊已在內部宣布調整 AI Token 額度。核心的變化是,全員統一額度改為按工作任務動態調配。通知明確表示,總投入只增不減,對能用 AI 帶來顯著提效和價值產出的同學,保障 Token 額度,不搞 Token 消耗量排名,不販賣焦慮。
大公司們對Token額度的快速消耗甚至超過了他們自己的預期。今年4月,Uber首席技術官普拉文·納加(Praveen Naga)表示,公司在4個月內就將2026年的AI預算花光了,Uber 2025年的研發支出達到34億美元。Meta員工在30天內消耗了60.2萬億個AI token,成本超過了1億美元。
國內亦是如此。5月20日,《崩壞》系列 AI NPC & Gameplay 技術團隊負責人鄭銀河透露,有員工為了實現項目,建了幾十個 Agent 共同協作,結果一晚上燒了價值 200 萬元的 Token。
曾經,為了踐行AI策略,不少公司希望員工最大程度去調用AI工具,甚至搞Token用量排名,以此作為升職、加薪的標準之一,但當看到天價Token賬單后,互聯網公司們懵了。
3天用掉90%額度,大廠狂砍Token用量
騰訊此次Token額度動態調整并沒有提前通知,這讓一些員工感到措手不及。一位騰訊研發人員稱,自己根本不夠用,發布通知到當天,就發現自己有10%的額度了,用claude就是挺不住得燒。
Tech星球了解到,此次調整涉及到包括實習生、外包、正式員工在內的所有人員。目前,只有混元大模型對所有人免費。這樣的調整在一些人看來在情理之中。“用腳指頭想也知道,怎么可能一直超多超量供應”,一位騰訊員工評論道。
一位騰訊大數據方向的外包員工告訴Tech星球,以前他們使用大模型是積分制,有100000積分,就沒有關注具體Token量,但是夠一個月使用。現在外包只能申請混元大模型,混元是沒有Token限制的。
但混元在所有基礎大模型中表現并不優異。憑借在“強推理+256K超長上下文”的能力,Hy3 preview曾連續登頂OpenRouter全球周榜,但整體能力上,尤其復雜任務時,比如編程等,Hy3 和DeepSeek V4 Flash、Claude Sonnet 4.6等模型依然存在差距。
但Token的調整對每個事業部每個人的體感不一樣,有人只剩100美元,有人則有1萬多元人民幣。
一位騰訊實習生告Tech星球,調整前,自己只有100美元,調整后算起來有200美元了,市面上的先進模型都能用,但200美元確實不夠用,寫代碼的話一天多的時候就能用50美元。一位騰訊AI預研游戲員工稱,自己目前還有12600元,而同事有2.1萬元。還有一些人則表示,Token直接砍半了。
一位騰訊后端研發稱,雖然目前Token額度有所縮減,但自己所在的組并不受影響,不夠就可以向上級申請。
此前,騰訊傳出為每位員工發放價值約22萬元的Token套餐。按照騰訊集團2026年Q1財報中提到的114848名員工計算,騰訊每年需要支付252億元費用。作為對比,其2025年的研發費用為857.5億元。
但現在,即便是財大氣粗的騰訊也要開始算細賬了,而這只是行業的縮影。Tech星球了解到,國內主流大廠都會要求員工優先使用內部大模型,內部大模型對員工基本免費,甚至一些公司還屏蔽了競對的模型。但是最終內部模型產出的效果可能依然比不上海外模型。
一位字節跳動員工向Tech星球介紹,公司內部并不強制用AI,“Token額度對大廠是很大的負擔,不少互聯網公司不同崗位不同部門額度存在差異,并且在字節如果AI相關的技術研發崗位如果額度不夠,還可以內部審批去外面單獨采購”,他補充道。
一位美團員工表示,并沒有聽到內部會有額度限制,但自己的額度是完全夠用的。一位百度員工則稱,內部根據部門不同額度限制的情況也會有差異。
破除Token盲目崇拜
大廠或者還在猶豫是否削減Token額度,但更多中小型互聯網公司已經撐不住了。
廣州一家做跨境支付的企業決定削減員工的Token用量:從上不封頂到人均每月500美元。而此前一個月,他們消耗掉了40萬美元的Token。
“這完全不夠用了”,上述公司的一位程序員告訴Tech星球。他所在的公司竟然出現互相借Token想象,比如一位后端開發者2天就消耗掉370美元的Token,額度報警,該開發者開始向他借Token用。
以前大大小小的互聯網公司們踐行Token-maxxing,生怕錯過AI浪潮。于是,員工們拼命研究如何消耗Token。一位上述員工分享道,尤其后端程序員,研發了各種封裝包、skill,每個業務有一堆提效工具,一些程序員一開就是好幾個agent,一小時就能燒掉上億Token。這導致新規發布前,一些程序員就已經超出預算1000多美元。消耗1億Token,如果使用目前編程主流選擇Claude Sonnet 4.6,需要至少花費2000元,最高甚至達到1萬元。
事實上,Token浪費的情況確實存在。一位新能源汽車員工稱,公司每個月給他1000美元的Token額度,他根本用不完,為了消耗,只能用AI寫原創小說,比如續寫《紅樓夢》。
上海某老牌互聯網公司員工告訴Tech星球,公司以前是不限的,但現在公司開始統一管理大家的Token額度,每個人都需要走釘釘審批申請Token,每個人的額度是幾百元到1000元不等。
這樣的情況開始變得普遍。北京某腰部互聯網公司員工稱,原來大家可以不限額使用Claude Code,公司報銷。現在是開放了Anthropic的API接口,每個人每月是1000元額度,并且讓大家優先使用更便宜的國產大模型。
但現實是,便宜的大模型只能勝任一些簡單的代碼補全類任務,一旦遇到復雜任務,需要多輪次反復交互,甚至不如自己手搓。“我現在已經開始自己買額度了,1000元的額度可能根本用不了一周。”
一些公司則要求全棧AI化,這導致Token用量大幅度上升。廣州某游戲公司員工稱,之前Token全員免費,自己一個月用了小3萬Token,部門人人超標,之后就只能用DeepSeek的模型了。
上海一位程序員在社交平臺分享道,自己的部門只有4個人,但一個月就消耗掉了6萬元Token。現在技術老大直接采買了DeepSeek的Token讓技術切換。
Token-maxxing的另外一個結果是,在復盤的時候,不少程序員發現看不懂自己寫的代碼,甚至都找不到代碼在哪里,為什么要這么寫。公司的管理者們發現,即便使用了AI,整體的運營效率并沒有提升,甚至當大模型需要排隊時,反而影響重要產品的節奏。
百度創始人李彥宏在今年的AI開發者大會上首次提出日活智能體數(Daily Active Agents,簡稱DAA),DAA大致對應移動互聯網時代通用的日活用戶數(DAU),它看起來,比單純看Token消耗量更能體現平臺和生態真實繁榮程度的度量。
從不設上限的肆意揮霍,到如今精打細算的“配額制”與“國產替代”,互聯網公司對AI的盲目崇拜正在經歷一場必經的祛魅。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.