網易首頁 > 網易號 > 正文申請入駐

從不限量到自費上班，互聯網公司們付不起Token賬單

2026-06-18 16:54:30　來源: Tech星球

吉林舉報

分享至

圖源 | Tech星球

文| 王琳

全員Token-maxxing（把Token用量拉到極限）還沒倆月，互聯網公司急速調轉船頭。

6月5日，騰訊已在內部宣布調整 AI Token 額度。核心的變化是，全員統一額度改為按工作任務動態調配。通知明確表示，總投入只增不減，對能用 AI 帶來顯著提效和價值產出的同學，保障 Token 額度，不搞 Token 消耗量排名，不販賣焦慮。

大公司們對Token額度的快速消耗甚至超過了他們自己的預期。今年4月，Uber首席技術官普拉文·納加（Praveen Naga）表示，公司在4個月內就將2026年的AI預算花光了，Uber 2025年的研發支出達到34億美元。Meta員工在30天內消耗了60.2萬億個AI token，成本超過了1億美元。

國內亦是如此。5月20日，《崩壞》系列 AI NPC & Gameplay 技術團隊負責人鄭銀河透露，有員工為了實現項目，建了幾十個 Agent 共同協作，結果一晚上燒了價值 200 萬元的 Token。

曾經，為了踐行AI策略，不少公司希望員工最大程度去調用AI工具，甚至搞Token用量排名，以此作為升職、加薪的標準之一，但當看到天價Token賬單后，互聯網公司們懵了。

3天用掉90%額度，大廠狂砍Token用量

騰訊此次Token額度動態調整并沒有提前通知，這讓一些員工感到措手不及。一位騰訊研發人員稱，自己根本不夠用，發布通知到當天，就發現自己有10%的額度了，用claude就是挺不住得燒。

Tech星球了解到，此次調整涉及到包括實習生、外包、正式員工在內的所有人員。目前，只有混元大模型對所有人免費。這樣的調整在一些人看來在情理之中。“用腳指頭想也知道，怎么可能一直超多超量供應”，一位騰訊員工評論道。

一位騰訊大數據方向的外包員工告訴Tech星球，以前他們使用大模型是積分制，有100000積分，就沒有關注具體Token量，但是夠一個月使用。現在外包只能申請混元大模型，混元是沒有Token限制的。

但混元在所有基礎大模型中表現并不優異。憑借在“強推理+256K超長上下文”的能力，Hy3 preview曾連續登頂OpenRouter全球周榜，但整體能力上，尤其復雜任務時，比如編程等，Hy3 和DeepSeek V4 Flash、Claude Sonnet 4.6等模型依然存在差距。

但Token的調整對每個事業部每個人的體感不一樣，有人只剩100美元，有人則有1萬多元人民幣。

一位騰訊實習生告Tech星球，調整前，自己只有100美元，調整后算起來有200美元了，市面上的先進模型都能用，但200美元確實不夠用，寫代碼的話一天多的時候就能用50美元。一位騰訊AI預研游戲員工稱，自己目前還有12600元，而同事有2.1萬元。還有一些人則表示，Token直接砍半了。

一位騰訊后端研發稱，雖然目前Token額度有所縮減，但自己所在的組并不受影響，不夠就可以向上級申請。

此前，騰訊傳出為每位員工發放價值約22萬元的Token套餐。按照騰訊集團2026年Q1財報中提到的114848名員工計算，騰訊每年需要支付252億元費用。作為對比，其2025年的研發費用為857.5億元。

但現在，即便是財大氣粗的騰訊也要開始算細賬了，而這只是行業的縮影。Tech星球了解到，國內主流大廠都會要求員工優先使用內部大模型，內部大模型對員工基本免費，甚至一些公司還屏蔽了競對的模型。但是最終內部模型產出的效果可能依然比不上海外模型。

一位字節跳動員工向Tech星球介紹，公司內部并不強制用AI，“Token額度對大廠是很大的負擔，不少互聯網公司不同崗位不同部門額度存在差異，并且在字節如果AI相關的技術研發崗位如果額度不夠，還可以內部審批去外面單獨采購”，他補充道。

一位美團員工表示，并沒有聽到內部會有額度限制，但自己的額度是完全夠用的。一位百度員工則稱，內部根據部門不同額度限制的情況也會有差異。

破除Token盲目崇拜

大廠或者還在猶豫是否削減Token額度，但更多中小型互聯網公司已經撐不住了。

廣州一家做跨境支付的企業決定削減員工的Token用量：從上不封頂到人均每月500美元。而此前一個月，他們消耗掉了40萬美元的Token。

“這完全不夠用了”，上述公司的一位程序員告訴Tech星球。他所在的公司竟然出現互相借Token想象，比如一位后端開發者2天就消耗掉370美元的Token，額度報警，該開發者開始向他借Token用。

以前大大小小的互聯網公司們踐行Token-maxxing，生怕錯過AI浪潮。于是，員工們拼命研究如何消耗Token。一位上述員工分享道，尤其后端程序員，研發了各種封裝包、skill，每個業務有一堆提效工具，一些程序員一開就是好幾個agent，一小時就能燒掉上億Token。這導致新規發布前，一些程序員就已經超出預算1000多美元。消耗1億Token，如果使用目前編程主流選擇Claude Sonnet 4.6，需要至少花費2000元，最高甚至達到1萬元。

事實上，Token浪費的情況確實存在。一位新能源汽車員工稱，公司每個月給他1000美元的Token額度，他根本用不完，為了消耗，只能用AI寫原創小說，比如續寫《紅樓夢》。

上海某老牌互聯網公司員工告訴Tech星球，公司以前是不限的，但現在公司開始統一管理大家的Token額度，每個人都需要走釘釘審批申請Token，每個人的額度是幾百元到1000元不等。

這樣的情況開始變得普遍。北京某腰部互聯網公司員工稱，原來大家可以不限額使用Claude Code，公司報銷。現在是開放了Anthropic的API接口，每個人每月是1000元額度，并且讓大家優先使用更便宜的國產大模型。

但現實是，便宜的大模型只能勝任一些簡單的代碼補全類任務，一旦遇到復雜任務，需要多輪次反復交互，甚至不如自己手搓。“我現在已經開始自己買額度了，1000元的額度可能根本用不了一周。”

一些公司則要求全棧AI化，這導致Token用量大幅度上升。廣州某游戲公司員工稱，之前Token全員免費，自己一個月用了小3萬Token，部門人人超標，之后就只能用DeepSeek的模型了。

上海一位程序員在社交平臺分享道，自己的部門只有4個人，但一個月就消耗掉了6萬元Token。現在技術老大直接采買了DeepSeek的Token讓技術切換。

Token-maxxing的另外一個結果是，在復盤的時候，不少程序員發現看不懂自己寫的代碼，甚至都找不到代碼在哪里，為什么要這么寫。公司的管理者們發現，即便使用了AI，整體的運營效率并沒有提升，甚至當大模型需要排隊時，反而影響重要產品的節奏。

百度創始人李彥宏在今年的AI開發者大會上首次提出日活智能體數（Daily Active Agents，簡稱DAA），DAA大致對應移動互聯網時代通用的日活用戶數（DAU）,它看起來，比單純看Token消耗量更能體現平臺和生態真實繁榮程度的度量。

從不設上限的肆意揮霍，到如今精打細算的“配額制”與“國產替代”，互聯網公司對AI的盲目崇拜正在經歷一場必經的祛魅。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.