![]()
新智元報道
編輯:元宇
【新智元導讀】Meta內部搞了個AI用量排行榜「Claudeonomics」,8.5萬員工拼消耗、沖段位、搶「Token傳奇」稱號。有人一個月燒掉200萬美元,有人寫外掛沖榜,有人掛著Agent睡覺也在跑——硅谷卷Token,已經卷到走火入魔了。
一個人,30天,燒掉3285億token!
按Anthropic公開定價粗算,這些燒掉的算力成本接近200萬美元。
4月初,The Information記者Jyoti Mann在X上首次曝光Meta內部「Claudeonomics」排行榜,30天全公司token總消耗超60萬億。
![]()
這些瘋狂的數字,來自Meta內部一個名叫「Claudeonomics」排行榜的比賽,8.5萬人參與的燒token大賽,只展示前250名。
從銅牌、銀牌、金牌、鉑金、翡翠,一路升到「永恒會話」(Session Immortal),再到最高榮譽「Token傳奇」(Token Legend)。
沒錯,燒token都燒出段位來了。
這筆賬到底有多大?The Information專門做了一個計算器來拆解:
![]()
The Information報道中附帶的交互式token成本估算器,按Claude Opus 4.6占86%的模型配比、70%緩存命中率估算,1萬億token理論成本約550萬美元。
當然,這只是按公開價的估算,但數據量級本身已經足夠炸裂。
如果放到整個Meta來看,這個數字更恐怖:最近一個月token總消耗約60.2萬億。
這是什么概念?
The Information做了一個估算:美國國會圖書館全部藏書折算約2.66萬億token,Meta的Llama 3訓練數據是15萬億token,人類歷史上所有出版書籍加起來估算約20萬億token。
Meta員工30天燒掉的token量,是人類全部出版物的3倍!
這還只是開始。一周之后,這個數字據報道跳到了73.7萬億。
消息傳開后,業內知名技術博主Gergely Orosz在X上一針見血地評論:
Token用量已經是Meta績效評估的一部分。聰明人在刷他們認為領導想看的指標,就這么簡單。
![]()
這已經不是某個工程師在用AI寫代碼的故事了,而演變成一場超大規模AI消耗競賽游戲:
覆蓋數萬人,有排名、有稱號、有榮譽體系。
曝光后兩天
排行榜就消失了
The Information的報道發出后,Meta內部炸開了鍋。
有員工在內部討論區寫道:
我建議大家算算這背后的能源消耗。要不是真的在發生,我會以為是個笑話。
到了周三,排行榜從Meta內網消失了。
Meta發言人對外的說法是:排行榜是由創建者自行撤下的,不是公司下令。
公司強調,員工評估看的是「實際交付影響」,不主張把個人token數據作為評估績效的主要方式。
但Meta發出的信號是矛盾的。
據The Information報道,Meta內部一個名為Checkpoint的AI驅動績效追蹤系統,確實將token使用量列為數據點之一。
排行榜雖然撤了,但公司官方的AI Insights儀表盤仍然對所有員工開放,你隨時可以查看自己和團隊的token消耗。
Meta發言人表示,AI Insights儀表盤的目的是幫助公司了解各組織如何向AI原生的工作方式轉型,它提供的洞察不只是token用量,還包括代碼相關指標和其他維度。
雖然,Meta停掉了排行榜,嘴上說不以token論英雄,但排行榜的邏輯仍然存在,這讓不少員工感受到公司釋放出的信號并不完全一致。
「代碼行數」
披上token新衣
這個排行榜雖然只存在了幾天,但它已經催生出了一套「刷分」操作。
![]()
據The Information援引匿名員工描述,一些Meta工程師想出了各種辦法來膨脹自己的AI使用指標。
比如,一些工程師會讓AI Agent 生成大量細小改動,這些改動對功能幫助有限,但每次仍會形成一次commit,從而抬高其AI使用指標。
量上去了,排名自然好看。
還有人開發了轉錄機器人,掛在會議里自動做記錄。
有的人甚至專門鼓勵同事來用自己開發的轉錄工具,因為只要別人通過你的工具跑token,消耗量就算在你頭上。
類似的事不只發生在Meta。
亞馬遜電商部門去年也出現過一個案例。
一位經理暗示團隊應該更多使用AI編程工具Cline。于是團隊里有人直接改了代碼,讓每次和Cline的對話看起來消耗了10倍的token。
這個團隊的AI使用排名迅速沖到了分部前列。
不過到今年年初,亞馬遜調整了系統,這個「作弊碼」失效了。
這些故事看起來有些荒誕,但熟悉軟件行業歷史的人一定不陌生。
Box CEO Aaron Levie直言:這讓他想起了AI出現之前,行業里圍繞「用代碼行數衡量程序員產出」的那些老爭論。
代碼行數也曾經被當作生產力指標。
結果工程師們學會了把一行能寫完的邏輯拆成十行:指標漲了,產出沒變,甚至更差了。
現在,同樣的故事只是換了個計量單位:代碼行數變成了token數。刷行數變成了刷commit、掛轉錄機器人、改系統讓數字翻10倍。
指標可量化,又和績效沾邊,就一定可能會「玩壞」。
據The Information報道,有Meta員工私下承認,那些token用量低的人,有時候會焦慮自己看起來「不夠AI native」。
同時這位員工也認為,高token用量不應該成為一種身份符號,因為它并不是生產力的好指標。
不卷token的公司
怎么玩?
既然刷token排名的邏輯漏洞這么明顯,有沒有企業選擇另外一條路?
執法裝備的公司Axon選擇了把AI激勵綁定在業務交付上,而不是消耗量上。
他們的做法是團隊如果利用AI工具超額完成年度路線圖目標15%以上,就能拿到現金獎金。
Axon總裁Josh Isner透露,今年公司各團隊集體的路線圖超額幅度正在追蹤到30%左右,主要歸功于Claude Code和Cursor的使用。
預計今年在AI編程工具上的支出將達到「數千萬美元」級別。
Isner認為,當你引入「盡量多用這個工具我們就付錢」這種考核的時候,風險越來越大:
你怎么知道你得到的是你想要的結果,或者說,到底有沒有任何結果?
Aaron Levie并不鼓勵tokenmaxxing,也不認為它會在硅谷之外的大公司里廣泛流行。
不過他也表示,自己理解這種沖動,因為當前階段需要先讓工程師充分試用這些工具。
他選了另一種方式:既然AI能讓團隊更高效,那就把產品目標定得更高。員工能不能完成這些加碼后的目標,直接影響薪酬。
但Levie也沒有一刀切地否定token消耗。他認為應該容忍一定程度的token「浪費」,因為那意味著團隊在嘗試新東西:
硅谷現在正處于這樣一個階段,你得讓工程師去試這些工具。
Levie愿意為試錯買單,但不愿意把「誰燒得最多」變成一種排名機制。
Axon和Box代表了一種觀點:token只是彈藥,你用了多少不重要,你使用它做出了什么才重要。
當油表被當成速度表
Meta的排行榜被撤了,但背后催生它的那股力量依然強大:
硅谷高管們集體把「多燒token」等同于「高生產力」的敘事一點也沒有減弱。
![]()
英偉達CEO黃仁勛
英偉達CEO黃仁勛就曾在All-In Podcast上說過一句被廣泛引用的話:
如果一個年薪50萬美元的工程師,連至少25萬美元的token都沒用掉,他會「高度警惕」。
他甚至設想了一個未來:Token會成為招聘時的標配福利,就像牙科保險和免費午餐一樣。工程師面試時會問:「這份工作給我配多少token?」
Meta CTO Andrew Bosworth在今年2月的一次科技會議上提到,如果一個頂級工程師花掉相當于自己年薪的token成本,卻能把生產力提升到10倍,這筆錢就好比「白送的錢」,應該繼續投,甚至不必設上限。
前OpenAI和特斯拉AI科學家Andrej Karpathy則是再造新詞:token消耗量儼然成了AI時代個人能力的新標尺:
你的token吞吐量是多少?你能指揮多少token吞吐量(Token throughput)?
當行業大佬都在說「多燒token就是高生產力」,大家聽到的信號只有一個:不燒就是落后,這種FOMO(Fear of Missing Out,錯失恐懼)會迅速從「我要不要多用一點AI」變成「我敢不敢不用」。
沒有人想成為團隊里那個token用量墊底的人,而排行榜只是把這種焦慮變成了一場公開競賽。
但問題恰恰在這里。
Token消耗量之所以被追捧,是因為它是目前最容易量化的AI使用指標。
你很難衡量一個工程師「用AI之后交付質量提升了多少」,但你可以精確地看到他燒了多少token,就它和「代碼行數」一樣。
但容易量化,不等于值得量化。
代碼行數對應的是寫代碼的動作,并不代表軟件質量;Token消耗量衡量的是API調用次數,不等于工程產出。
這就好比油表能告訴你燒了多少油,但它不代表速度和里程。
而AI Agent時代,只會讓這個問題更尖銳。
![]()
NYT近期的報道描述了一種新景象:
工程師同時開十幾個窗口,放出幾十個Agent并行跑任務,有些Agent系統被設計成24/7不間斷運行,在人類睡覺的時候還在持續消耗token。
一個全職Agent一周可以跑掉7億個token。
當token消耗可以脫離人類干預自動增長的時候,拿消耗量來衡量人的生產力,就更加荒謬了。
雖然,Meta的Claudeonomics排行榜已經下線,但它折射出一個人類在技術采用上的「經典悖論」:
當一個工具的使用量可以被精確計量、可以被公開排名、可以和績效感知掛鉤,它就必然從工具變成表演。
代碼行數是這樣,commit次數是這樣,專利申請數、論文引用量、OKR完成率,全都是這樣。
每一個曾被當作生產力代理指標的數字,最終都催生出了一套刷分產業。
現在輪到了token。
下一個被異化的指標會是什么?
也許是Agent的并發數量,也許是AI生成代碼的合并率,也許是某種我們今天還想象不到的新數字。
只要企業還分不清「鼓勵用AI」和「考核AI帶來的真實產出」,類似的刷榜游戲就不會停。
參考資料:
https://www.theinformation.com/articles/tokenmaxxing-tide-may-turning?rc=epv9gi
https://www.theinformation.com/articles/meta-employees-vie-ai-token-legend-status?rc=epv9gi
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.