網易首頁 > 網易號 > 正文申請入駐

大廠Token不再“管夠”：騰訊開始限額，字節可部分報銷

2026-06-13 12:39:27　來源: 經濟觀察報

北京舉報

分享至

大廠Token不再“管夠”（資料圖）

記者劉思璇

從6月開始，一名騰訊員工發現：在內部管理看板上，自己分到的Token（詞元）額度變少了。“之前一個月有2000美元（約1.35萬元人民幣）額度，這個月只有1400元人民幣，兩天就用沒了。”

據經濟觀察報不完全統計，目前騰訊不同部門員工人均月Token額度差異較大，從1000元到7000元人民幣不等。Token額度分配到組后，由組內管理者再分給員工個人。額度不足時，員工可向管理者“舉手申請”提高額度。

對于員工Token，目前國內各家大廠主要有兩種分配方式：一是額度分配到員工個人，如有超額需求，員工自費后可部分報銷；二是額度分配到部門，作為部門預算的一部分，由管理者在部門內分配。

無論分給誰、怎么分，歸根結底，分的都是用來買Token的錢。Agent（智能體）介入工作，帶來Token消耗指數級增長，算力成本也在擠壓大廠的利潤。到了2026年中，包括微軟、Meta等在內的國內外全球頂級科技大廠都開始踩下內部AI無限使用的“剎車”，對員工的AI Token用量進行監控、限制和動態調配。

額度收縮后，一些員工對自己將回歸“古法編程”表示擔憂，員工面臨著由奢入儉的陣痛：回歸手搓，還是自費加額、花錢打工？

“大鍋飯”結束了

騰訊是國內率先對員工Token控額的互聯網大廠之一。據經濟觀察報了解，6月起，騰訊多個業務員工的Token額度均有下降，且部門之間差異較大：在AI需求較大的混元大模型團隊，員工月Token額度約7000元；在聚焦計算機視覺領域的優圖實驗室，額度約5250元；另有騰訊娛樂外包員工透露，自己月Token額度僅1000元。

“組內共用一個額度池，組長來分配。”前述騰訊員工稱，“這是這個月的暫行辦法，下個月可能還要改。”

今年3月，脈脈社區上有消息稱，騰訊給員工配置了“每人年均22萬元Token資源”，每月包含700美元Cursor額度、700美元Claude額度、1000美元CodeBuddy額度等，以此激勵員工使用AI提效。該消息得到多位騰訊員工證實。

AI狂歡的同時，關于“Token用量是否會關聯工作投入度”的猜測愈演愈烈。3月底，有騰訊員工在脈脈同事圈發帖稱，部分業務在統計各部門、團隊的Token用量并排名。一些員工擔心Token消耗不夠充分，在工作時間搭建無實際意義的工作流、讓Agent重復完成任務，處理個人需求，甚至“接私活”，以確保Token用量不落后。

此次騰訊調整員工Token額度，有意改變此前以Token消耗量作為單一衡量標準的“大鍋飯”模式。經濟觀察報了解到：2026年，騰訊將持續加碼Token投入，但不再按統一標準分配到員工；部門管理者結合工作情況，動態分配資源，如有需求，員工可申請加量；內部反對Token使用量排名，不單純以Token消耗衡量員工產出。

Token超了怎么辦？

騰訊之外，其他互聯網大廠的Token額度配置邏輯不一。

在產研等AI使用程度較高的崗位，阿里員工每月額度約為8000元，不限制模型，員工稱處理日常需求“基本夠用”；京東員工可不限量調用自家模型，調用外部模型所產生的費用分攤到部門；美團有員工稱，還沒聽說明確的Token額度標準，但在使用內部AI產品時，經常遇到“模型變笨”的情況，懷疑是因調用量過多而被“降級到質量更低的模型”。

而在字節，員工可不限量調用TRAE（字節自研AI IDE產品）內模型，其中包含GPT、Gemini、Grok等；如有工作需要調用其他模型，產生的費用可部分報銷，有部門報銷標準為實際支出的50%，產研崗位年度報銷上限為1000美元，其他崗位報銷上限為300美元。

關于員工Token額度的配置，大廠們正在釋放相同的信號：AI要用，Token得管，否則成本可能失控。

5月20日，2026阿里云峰會現場，米哈游《崩壞》系列AI NPC & Gameplay技術團隊負責人鄭銀河分享團隊在探索AI過程中的經歷：有員工搭建幾十個Agent共同協作，一晚上燒掉約200萬元人民幣的Token。

一家AI初創企業的研發人員向經濟觀察報介紹，他所在團隊約50人，過去一個月團隊Token成本約20萬美元，人均成本達到4000美元，“主要用于編碼，編碼質量高的模型價格都高。老板讓節省一些，后續考慮換便宜點的模型。”

6月初，OpenAI CEO Sam Altman在一場直播中表示，AI支出已經成為企業的大問題，而 “在年初時，人們還對自己的花費非常滿意”。

換低價模型，或自費補額度

“看板上寫了，如果Token不夠，可以找負責人去加額度。”一名騰訊員工說，他的月Token額度約3000美元，6月看板更新后，額度僅有5000元人民幣，“發下來三天就用沒了，Agent、Subagent（子智能體）跑起來，額度用得很快”。于是他向上級主管申請提額，得到的反饋是部門預算有限，提額被拒絕。“各部門上限不一樣，要看業務情況。”

騰訊此次Token額度調整范圍主要針對外部模型，員工依舊可以不限量使用騰訊自研的混元大模型，這也導致混元調用量有所增長。有員工稱，換回混元后，工作效率下降，使用體驗變差，“幻覺很嚴重，也不是專用于編碼的模型，不如手搓”。

苦于公司配額不夠用，有騰訊員工選擇自掏腰包，訂閱每月200美元的Codex Pro 20x。他算了一筆賬：“用混元的話，基礎需求都要跑很久，失敗了還得重跑，耽誤時間。雖然不想自費打工，但是總比沒額度用要好，這個價格也還好。”

在額度配置相對充裕的字節，模型調用也并非隨心所欲。“我自己和身邊大部分同事都用GPT-5.5，公司內的模型接口天天排長隊。”一名字節研發人員透露，即便該模型在公司付費范圍內，仍有員工用個人賬號自費訂閱，避免模型排隊導致工作進度耽擱。

額度受限后，員工很難回到AI介入前的純人工模式。“工作量已經漲上去了，沒有因為Token減了就降下來。而且用AI以后，我很難再回歸古法編程了。”一名騰訊員工正因Token不足而困擾。

當Token關聯起成本和產能，企業應當如何劃定和分配額度？大廠們仍在尋找答案。

責任編輯：戴麗麗_NN4994

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.