![]()
大廠Token不再“管夠”(資料圖)
記者 劉思璇
從6月開始,一名騰訊員工發現:在內部管理看板上,自己分到的Token(詞元)額度變少了。“之前一個月有2000美元(約1.35萬元人民幣)額度,這個月只有1400元人民幣,兩天就用沒了。”
據經濟觀察報不完全統計,目前騰訊不同部門員工人均月Token額度差異較大,從1000元到7000元人民幣不等。Token額度分配到組后,由組內管理者再分給員工個人。額度不足時,員工可向管理者“舉手申請”提高額度。
對于員工Token,目前國內各家大廠主要有兩種分配方式:一是額度分配到員工個人,如有超額需求,員工自費后可部分報銷;二是額度分配到部門,作為部門預算的一部分,由管理者在部門內分配。
無論分給誰、怎么分,歸根結底,分的都是用來買Token的錢。Agent(智能體)介入工作,帶來Token消耗指數級增長,算力成本也在擠壓大廠的利潤。到了2026年中,包括微軟、Meta等在內的國內外全球頂級科技大廠都開始踩下內部AI無限使用的“剎車”,對員工的AI Token用量進行監控、限制和動態調配。
額度收縮后,一些員工對自己將回歸“古法編程”表示擔憂,員工面臨著由奢入儉的陣痛:回歸手搓,還是自費加額、花錢打工?
“大鍋飯”結束了
騰訊是國內率先對員工Token控額的互聯網大廠之一。據經濟觀察報了解,6月起,騰訊多個業務員工的Token額度均有下降,且部門之間差異較大:在AI需求較大的混元大模型團隊,員工月Token額度約7000元;在聚焦計算機視覺領域的優圖實驗室,額度約5250元;另有騰訊娛樂外包員工透露,自己月Token額度僅1000元。
“組內共用一個額度池,組長來分配。”前述騰訊員工稱,“這是這個月的暫行辦法,下個月可能還要改。”
今年3月,脈脈社區上有消息稱,騰訊給員工配置了“每人年均22萬元Token資源”,每月包含700美元Cursor額度、700美元Claude額度、1000美元CodeBuddy額度等,以此激勵員工使用AI提效。該消息得到多位騰訊員工證實。
AI狂歡的同時,關于“Token用量是否會關聯工作投入度”的猜測愈演愈烈。3月底,有騰訊員工在脈脈同事圈發帖稱,部分業務在統計各部門、團隊的Token用量并排名。一些員工擔心Token消耗不夠充分,在工作時間搭建無實際意義的工作流、讓Agent重復完成任務,處理個人需求,甚至“接私活”,以確保Token用量不落后。
此次騰訊調整員工Token額度,有意改變此前以Token消耗量作為單一衡量標準的“大鍋飯”模式。經濟觀察報了解到:2026年,騰訊將持續加碼Token投入,但不再按統一標準分配到員工;部門管理者結合工作情況,動態分配資源,如有需求,員工可申請加量;內部反對Token使用量排名,不單純以Token消耗衡量員工產出。
Token超了怎么辦?
騰訊之外,其他互聯網大廠的Token額度配置邏輯不一。
在產研等AI使用程度較高的崗位,阿里員工每月額度約為8000元,不限制模型,員工稱處理日常需求“基本夠用”;京東員工可不限量調用自家模型,調用外部模型所產生的費用分攤到部門;美團有員工稱,還沒聽說明確的Token額度標準,但在使用內部AI產品時,經常遇到“模型變笨”的情況,懷疑是因調用量過多而被“降級到質量更低的模型”。
而在字節,員工可不限量調用TRAE(字節自研AI IDE產品)內模型,其中包含GPT、Gemini、Grok等;如有工作需要調用其他模型,產生的費用可部分報銷,有部門報銷標準為實際支出的50%,產研崗位年度報銷上限為1000美元,其他崗位報銷上限為300美元。
關于員工Token額度的配置,大廠們正在釋放相同的信號:AI要用,Token得管,否則成本可能失控。
5月20日,2026阿里云峰會現場,米哈游《崩壞》系列AI NPC & Gameplay技術團隊負責人鄭銀河分享團隊在探索AI過程中的經歷:有員工搭建幾十個Agent共同協作,一晚上燒掉約200萬元人民幣的Token。
一家AI初創企業的研發人員向經濟觀察報介紹,他所在團隊約50人,過去一個月團隊Token成本約20萬美元,人均成本達到4000美元,“主要用于編碼,編碼質量高的模型價格都高。老板讓節省一些,后續考慮換便宜點的模型。”
6月初,OpenAI CEO Sam Altman在一場直播中表示,AI支出已經成為企業的大問題,而 “在年初時,人們還對自己的花費非常滿意”。
換低價模型,或自費補額度
“看板上寫了,如果Token不夠,可以找負責人去加額度。”一名騰訊員工說, 他的月Token額度約3000美元,6月看板更新后,額度僅有5000元人民幣,“發下來三天就用沒了,Agent、Subagent(子智能體)跑起來,額度用得很快”。于是他向上級主管申請提額,得到的反饋是部門預算有限,提額被拒絕。“各部門上限不一樣,要看業務情況。”
騰訊此次Token額度調整范圍主要針對外部模型,員工依舊可以不限量使用騰訊自研的混元大模型,這也導致混元調用量有所增長。有員工稱,換回混元后,工作效率下降,使用體驗變差,“幻覺很嚴重,也不是專用于編碼的模型,不如手搓”。
苦于公司配額不夠用,有騰訊員工選擇自掏腰包,訂閱每月200美元的Codex Pro 20x。他算了一筆賬:“用混元的話,基礎需求都要跑很久,失敗了還得重跑,耽誤時間。雖然不想自費打工,但是總比沒額度用要好,這個價格也還好。”
在額度配置相對充裕的字節,模型調用也并非隨心所欲。“我自己和身邊大部分同事都用GPT-5.5,公司內的模型接口天天排長隊。”一名字節研發人員透露,即便該模型在公司付費范圍內,仍有員工用個人賬號自費訂閱,避免模型排隊導致工作進度耽擱。
額度受限后,員工很難回到AI介入前的純人工模式。“工作量已經漲上去了,沒有因為Token減了就降下來。而且用AI以后,我很難再回歸古法編程了。”一名騰訊員工正因Token不足而困擾。
當Token關聯起成本和產能,企業應當如何劃定和分配額度?大廠們仍在尋找答案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.