網易首頁 > 網易號 > 正文 申請入駐

Meta“Token榜”逼瘋打工人,一夜燒掉公司幾萬刀!AI時代Token焦慮越來越離譜

0
分享至


作者|冬梅

編輯|蔡芳芳

Meta 內部把燒 token 當成 KPI

近日,據 The Information 報道,Meta 公司內部出現了一個名為“Claudeonomics”(這一名稱源自 Anthropic 旗艦產品 Claude)的 AI token 消費排行榜,該排行榜由員工自愿在公司內網創建,追蹤超過 8.5 萬名員工的 token 使用情況。

根據該榜單,Meta 內部過去 30 天的消耗掉 token 總量超過 60 萬億。按照 Anthropic 最新公布的定價,其 Claude Opus 4.6 模型中輸入和輸出 token 的平均成本約為每百萬 token 15 美元。以此估算,60 萬億 token 的成本約為 9 億美元。不過 Meta 實際采用的是哪種模型以及其采購價格,我們尚不清楚。

據悉,Meta 內部個人 token 數消耗最多的達到了 2810 億,根據模型類型的不同,這筆金額可能價值數百萬美元。

在 Meta 內部,消耗最多的 AI 計算能力,正在成為一種新的身份象征。

這種現象反映了硅谷“Token 最大化”文化的興起——將 token 消耗量作為衡量生產力的基準,并作為評估員工是否“精通人工智能”的競爭指標。

科技公司高管們對這一趨勢表示贊同。

英偉達 CEO 黃仁勛上個月表示,如果一名年收入 50 萬美元的工程師每年在 AI token 上的花費少于 25 萬美元,他會“深感擔憂”。

Meta CTO Andrew Bosworth 在二月份的一次科技會議上表示,據《福布斯》報道,一位頂尖工程師如果將相當于自己年薪的金額用于購買 token,其生產力可以提升至多十倍。Bosworth 坦率地說道:“這筆交易的成果顯而易見;應該持續投入,而且沒有上限!

特斯拉和 OpenAI 的前頂級 AI 科學家、現任 AI 教育初創公司負責人 Andrej Karpathy 不久前也在播客中也表示:“如果 token 用不完,我會很焦慮。”

如果說 Meta 的 token 排行榜代表的是一種“更多調用等于更高生產力”的工程文化,那么 OpenClaw 的流行則揭示了另一件事:在 Agent 時代,token 的消耗方式正在發生結構性變化。

這只被開發者們反復調教的“數字龍蝦”,不再只是一個能聊天、能寫代碼的模型外殼,而是一個可以持續執行任務、主動調用工具、甚至自行拆解目標的 Agent 系統。它不像傳統對話式 AI 那樣“問一句答一句”,而更接近一個不下班的執行單元:任務一旦啟動,就可能在后臺長時間運轉,反復推理、調用、修正。

問題正是從這里開始變得微妙。

表面上,OpenClaw 降低了“用 AI 做事”的門檻——你不再需要頻繁與模型去交互,系統會替你跑完整個流程;但在更深一層,它也改變了成本的發生方式:越來越多的用戶開始意識到,自己消耗的已經不只是“幾次對話”的成本,而是一整條任務鏈條背后的計算開銷。

一次看似簡單的自動化流程,可能拆分成數十甚至上百次模型調用;一次“讓 AI 自己去完成”的指令,背后對應的是長時間的推理軌跡和連續的 Token 流水。

問題也隨之浮現:當 Token 的主要消耗來自模型內部推理過程,而不是用戶直接需求,把 Token 當作生產力指標本身就可能是一種誤判。而這些不可見的 Token 消耗是否真的帶來了等價的價值,也需要打個問號。

Token 消耗等同于生產力嗎?

Meta 的 Token 消耗排行榜其實引發了不少爭議。

彭博社旗下知名媒體人 Joe Weisenthal 在 X 平臺上直接質問道:“用 token 總消耗量來衡量生產力究竟有什么意義?”

他還嘲諷道:“這真讓人感覺像‘后院煉鋼爐’一樣”,暗示這種一味追求數字指標而忽視實際質量的做法,就像不計成本地肆意浪費資源一樣。


這背后的根本性問題是:token 消耗量是一個投入指標,而非產出指標。就像用打印頁數來衡量員工生產力一樣,消耗更多 token 并不等同于取得更多成果。一些員工為了提升排名而讓 AI 代理閑置數小時的行為,恰恰表明這個指標可以通過“人工數據膨脹”來操縱。

當我們試圖厘清“Token 消耗越多,生產力提升就越明顯”這一命題是否成立時,必須先將目光投向這些被消耗的 Token 究竟流向了何處

想象這樣一個場景:你讓 AI 助手幫你拍張照片——聽起來是個再簡單不過的任務。但在后臺,這個“簡單”的指令可能觸發 20~50 次模型調用。每一次調用都在消耗算力、吞噬 token,而賬單最終會精確到小數點后幾位送到你面前。

YuanLab.ai 團隊專家在接受 InfoQ 采訪時表示,“token 由模型生成,對于同一任務,不同模型生成的 token 數量差異較大,其中一些模型的 token 效率較低,大量 token 被消耗在無效內容上——模型在已得出正確結論后仍持續生成反思、自我驗證等內容,在一些模型中,這部分無效 token 占比高達 70% 以上,是最核心的浪費來源。

Latency 問題本質上是 token 冗余的外在表現。推理鏈條越長,單步響應時間越難壓縮,在 Agent 多步驟任務中,每一步的延遲疊加會讓整體任務響應時間遠超預期,進而觸發超時重試,反而產生更多 token 消耗,形成惡性循環。

所以真正的 token 成本黑洞,藏在系統的“內耗”中。這種“內耗”的根源不僅在于硬件利用率,更在于系統架構本身。

當用戶提出一個任務請求時,AI Agent 系統會進行復雜的調度:任務分解、子任務分配、模型選擇、結果整合……這個過程中的每一次調度,都會帶來額外的開銷。系統調度會把基礎模型成本放大 3-5 倍,在極端情況下甚至達到 10 倍。

在復雜多模態文檔解析與長鏈路業務決策中,以企業級財報分析 Agent 任務為例,涉及跨頁圖文解析、數據抽取、多源對比、結論生成等多個子任務,每個子任務都需要獨立的模型調用,且上一步的輸出會成為下一步的上下文輸入。

在沒有推理效率優化的情況下,單任務的 token 消耗可以輕松達到數十萬甚至上百萬 token,綜合算力成本遠超人工完成同等工作的成本,從商業邏輯上就已經站不住腳。

更關鍵的是,這類任務的成本不是靜態的。隨著業務規模擴大、并發任務增多,成本會以任務數量為系數快速膨脹,而任務成功率和質量卻未必同步提升。當單任務的綜合算力成本與其創造的實際商業價值做對比時,很多看起來很有潛力的場景,在規;涞貢r會發現根本無法實現正向 ROI。

舉個例子:用戶說“幫我分析這份財報”。

  • 第一步:理解用戶意圖(調用模型)

  • 第二步:識別需要提取的關鍵信息(調用模型)

  • 第三步:從文檔中提取數據(調用模型)

  • 第四步:驗證提取的準確性(調用模型)

  • 第五步:生成分析報告(調用模型)

  • 第六步:檢查報告的完整性(調用模型)

如果中間某個環節出現偏差,系統還會進行“反思”和“回滾”,重新規劃路徑。一個看似簡單的任務,可能在后臺經歷了數十次調用。

所以這個問題的結論應該是——在很多場景下,Token 消耗的增長,優先反映的不是生產力提升,而是系統復雜度的上升。甚至可以說:Token 越多,越有可能說明系統越“不會做減法”。

事實上,“Token 消耗不等于生產力提升”這一現象,并不是個別案例,而正在成為行業中的普遍共識。

Token 增長的本質:

系統在為不確定性買單

包括 OpenAI、Anthropic 以及 Google DeepMind 在內的多家機構,在對復雜任務鏈路(如工具調用、代碼生成、長文檔推理)的評估中都發現:隨著任務復雜度提升,系統往往通過增加中間推理步驟和調用次數來維持成功率,而不是通過單次推理能力的提升來實現效率躍遷。

換句話說,當前大量 Agent 系統所呈現出的“高 Token 消耗”,本質上是一種工程層面的補償機制——它用更多計算去覆蓋模型能力的邊界。

這也正是問題的關鍵轉折點:如果 Token 的增加主要用于對沖不確定性,而不是直接創造價值,那么優化方向就不應該是“繼續增加調用”,而是“減少不確定性本身”。

也正是在這樣的背景下,行業開始從“如何多做幾步”轉向一個更本質的問題:如何讓模型在更少步驟內,把每一步做對

答案正在變得清晰——決定效果上限的,并不是調用次數,而是每一次調用的質量,以及系統在長鏈路中的決策穩定性。

YuanLab.ai 團隊認為前大量 Agent 系統依賴“多輪調用”來完成復雜任務,本質上是一種技術妥協。當單步推理無法穩定完成意圖理解、工具選擇與邏輯推演時,系統只能通過增加調用次數,引入反思、驗證等機制,用冗余計算來對沖不確定性。這種路徑確實可以提升任務成功率,但代價是顯而易見的:Token 消耗被成倍放大,延遲不斷累積,系統復雜度迅速上升。

換句話說,行業今天普遍采用的“多調用換效果”,并不是因為任務本身必須如此復雜,而是因為底層模型尚不具備在單步內高質量完成決策的能力。當模型能夠在一次推理中完成精準的意圖識別、合理的路徑規劃以及可靠的執行決策時,大量中間步驟本身就是可以被壓縮甚至消除的。真正高效的 Agent,不應該依賴“多做幾次來糾錯”,而是依賴“第一次就做對”。

這一點在長鏈路任務中尤為明顯。Agent 系統的核心挑戰,從來不只是單步推理,而是跨步驟的一致性與全局規劃能力。當模型缺乏對整體目標的把控能力時,系統不得不將任務拆解為大量細碎的子任務,并在每一個環節增加校驗機制,以防止誤差累積。但這種設計也直接導致了調用次數的指數級增長,使得原本可以在少數步驟內完成的任務,被拉長為一個高冗余的執行流程。

最終結果是,Token 消耗的增長,更多反映的是系統控制能力的不足,而非智能水平的提升。

這種現象,與人類工作方式有著相似的映射。一個經驗不足的執行者,往往需要反復確認、多次修正,依賴流程和檢查來保證結果;而一個成熟的專家,則可以在更少步驟內完成同樣甚至更復雜的任務。兩者之間的差異,并不在于“做了多少步”,而在于每一步決策的質量與確定性。當前很多 Agent,更像前者,而非后者。

但有意思的是,在過去幾年形成的技術路徑中,行業逐漸建立了一種近乎默認的假設:更強的智能,必須建立在更高的算力消耗之上。

從 GPT-3 到 GPT-4,這一邏輯被反復驗證,并進一步演化為一種路徑依賴——通過更大的模型、更長的上下文、更復雜的推理鏈,來換取能力提升。當這套思路被延伸到 Agent 系統時,就演變為“用更多調用換更高成功率”的實踐慣性,進而推動整個行業走向一場隱性的算力競賽。

但問題在于,這種以規模驅動的增長方式,正在逼近邊界。一方面,Token 成本的持續上升,使得大規模 Agent 部署在經濟上變得難以承受;另一方面,調用鏈條的不斷拉長,也讓系統延遲和不穩定性問題更加突出。在這種背景下,單純依賴“多用算力”來換取效果,已經不再具備可持續性。

OpenClaw 所引發的討論,恰恰指向了另一種可能性:智能的提升,不在于“用得多”,而在于“用得準”。這意味著,下一階段 Agent 的優化重點,將不再是擴大調用規模,而是提升 Token 的使用效率——減少無效推理、壓縮冗余鏈路、提高單步決策的信息密度,并通過更合理的系統設計降低調度與回滾帶來的額外開銷。

從這個角度來看,當前 Agent 面臨的核心瓶頸,并不是算力不足,而是算力利用效率過低。繼續堆疊調用次數,只會帶來更高成本和更復雜系統,卻未必帶來等比例的能力提升。真正決定 Agent 能否走向規模化落地的關鍵,在于能否用更少的 Token,穩定完成更復雜的任務。

無問芯穹 CEO 夏立雪在 3 月 27 日的中關村論壇年會的一場 AI 主題論壇上,闡明了相似的觀點。

夏立雪認為,當前階段,與其單純擴張算力規模,不如把已有資源用到極致。圍繞這個目標,他提出,應加快構建更高效、標準化的“Token 工廠”,提供持續穩定、規; Token 服務,使頂尖模型能力高效賦能海量下游場景,盡可能提升每一個 Token 的轉化效率,讓算力“花得值”。

這也意味著,Agent 的競爭,正在從“誰消耗更多資源”,轉向“誰更高效地使用資源”。

而這,或許才是 Token 經濟真正進入成熟階段的起點。

OpenClaw 引發 AI 成本結構重塑:

不拼算力,拼效率

當我們將目光投向未來,OpenClaw 帶來的啟示是深遠的。

首先,AI 的成本曲線不必是線性的。行業一直假設更強的模型必然更貴,但 OpenClaw 證明了效率優化可以打破這個魔咒。一個高效訓練的模型,可能比一個參數更大但訓練低效的模型更強、更省。

其次,算力不是 AI 發展的唯一瓶頸。當 GPU 利用率只有 15%-30% 時,問題不在于算力不夠,而在于算力沒被好好利用。通過系統優化,我們可以在現有硬件條件下釋放數倍的潛力。

最后,AI 的民主化需要效率革命。只有當成本降到足夠低,AI 才能從少數科技巨頭的專利,變成每個開發者、每個企業都能使用的工具。OpenClaw 的 token 經濟學,正在為這個未來鋪路。

在這個新時代里,智能不再是昂貴的奢侈品,而是觸手可及的基礎設施。每一分算力都被珍視,每一次調用都有價值。OpenClaw 這類智能體引發的狂燒 token 的解決辦法不應只是簡單地省錢,而是讓 AI 真正走向高效、可持續的未來。

而這個未來,已經不遠了。

聲明:本文為 AI 前線原創,不代表平臺觀點,未經許可禁止轉載。

會議推薦

世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?

AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。

誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。

今日薦文

你也「在看」嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
16歲女生玩秋千墜亡后續:同隊女子發聲,曝出片視頻,現索命崖壁

16歲女生玩秋千墜亡后續:同隊女子發聲,曝出片視頻,現索命崖壁

李晚書
2026-05-07 12:49:46
我有罪,大導演昆汀花1萬美金,在包房舔腳半小時,直到皮膚起皺

我有罪,大導演昆汀花1萬美金,在包房舔腳半小時,直到皮膚起皺

西樓知趣雜談
2026-04-20 08:40:47
從未為女兒家花過一分錢 住了二十五年 86歲老人75萬存單感動無數人

從未為女兒家花過一分錢 住了二十五年 86歲老人75萬存單感動無數人

藝鑒在線
2026-05-07 10:49:29
中伊已談妥,特朗普訪華有變?魯比奧喊話中國,給美國一個面子

中伊已談妥,特朗普訪華有變?魯比奧喊話中國,給美國一個面子

藍色海邊
2026-05-07 11:28:46
游客吐槽秦皇島山海關景區故意遮擋景觀,不買票正面拍不到“天下第一關”全景,客服回應

游客吐槽秦皇島山海關景區故意遮擋景觀,不買票正面拍不到“天下第一關”全景,客服回應

臺州交通廣播
2026-05-07 06:48:35
小米SU7鎖單8萬臺,扯下了誰的訂單遮羞布?

小米SU7鎖單8萬臺,扯下了誰的訂單遮羞布?

邱小鋮
2026-05-06 16:09:25
8級大風+暴雨!冷空氣返場?新臺風生成!接下來廣東天氣→

8級大風+暴雨!冷空氣返場?新臺風生成!接下來廣東天氣→

江門高新
2026-05-07 12:06:12
一天三個瓜,演唱會驚動半個娛樂圈,拍戲不敬業?表演被燙到腿

一天三個瓜,演唱會驚動半個娛樂圈,拍戲不敬業?表演被燙到腿

一盅情懷
2026-05-07 13:02:43
美國人號召“全民買下精神航空”,12萬人幾十個小時認捐6億+,他卻慌了

美國人號召“全民買下精神航空”,12萬人幾十個小時認捐6億+,他卻慌了

華人生活網
2026-05-06 03:51:54
胖東來創始人于東來發文:感謝您 感恩您!

胖東來創始人于東來發文:感謝您 感恩您!

大象新聞
2026-05-06 10:44:01
日本潛艇一夜落伍?041核潛艇登場,國產全核水下艦隊即將落地?

日本潛艇一夜落伍?041核潛艇登場,國產全核水下艦隊即將落地?

阿芒娛樂說
2026-05-07 11:10:14
哈馬斯新領導人剛上位,以色列“見面禮”:炸死其兒子

哈馬斯新領導人剛上位,以色列“見面禮”:炸死其兒子

桂系007
2026-05-07 03:49:12
終于反應過來了?美媒:中國正全國動員,殲36殲50生產超美國兩倍

終于反應過來了?美媒:中國正全國動員,殲36殲50生產超美國兩倍

今墨緣
2026-05-07 08:13:58
一種謀劃叫馬伊琍,離婚七年隱婚曝光,文章只是一個過客

一種謀劃叫馬伊琍,離婚七年隱婚曝光,文章只是一個過客

一盅情懷
2026-05-07 12:57:40
全靠內鬼,105噸假黃金騙了253億

全靠內鬼,105噸假黃金騙了253億

大貓財經Pro
2026-05-06 18:44:18
弘歷登基時還有10位叔叔在,有兩位比乾隆年幼,他們的結局如何

弘歷登基時還有10位叔叔在,有兩位比乾隆年幼,他們的結局如何

老范談史
2026-05-06 15:46:59
繼子照顧病重養母 13年,臨終給繼子5萬親兒2套房,繼子取款愣了

繼子照顧病重養母 13年,臨終給繼子5萬親兒2套房,繼子取款愣了

蘭姐說故事
2025-04-19 10:00:11
75歲姜昆近況:與46歲單身愛女相依為命,日子過得讓人羨慕

75歲姜昆近況:與46歲單身愛女相依為命,日子過得讓人羨慕

娛說瑜悅
2026-04-04 15:38:01
小楊阿姨去意已決,公園直播透露將辭職,馬筱梅曾讓她公開請假

小楊阿姨去意已決,公園直播透露將辭職,馬筱梅曾讓她公開請假

君笙的拂兮
2026-05-07 02:03:48
大逆襲!西部第二狂勝38分:全隊7人得分上雙,文班狂刷紀錄

大逆襲!西部第二狂勝38分:全隊7人得分上雙,文班狂刷紀錄

體壇小李
2026-05-07 12:44:43
2026-05-07 13:44:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
1476文章數 149關注度
往期回顧 全部

科技要聞

凌晨突發!馬斯克租22萬塊GPU給“死敵”

頭條要聞

北京三位女大學生青海自駕游2死1傷 傷者一審獲刑4年

頭條要聞

北京三位女大學生青海自駕游2死1傷 傷者一審獲刑4年

體育要聞

阿森納巴黎會師歐冠決賽!5月31日開戰

娛樂要聞

小S阿雅重返大S母校,翻看大S畢業照

財經要聞

特朗普:美伊“很有可能”達成協議

汽車要聞

理想為什么不做轎車,有了解釋……

態度原創

家居
藝術
游戲
旅游
軍事航空

家居要聞

破繭成蝶 土味精裝房爆改

藝術要聞

這位老教授筆下的青年,活力滿滿

靠說話打架的游戲,是怎么讓人喊出“爺青回”的?

旅游要聞

“五一”假期盤點:文旅消費亮點紛呈

軍事要聞

特朗普:美伊"很可能"達成協議

無障礙瀏覽 進入關懷版