在人工智能領域,Token 就是這個世界的硬通貨。讀懂 Token,就能看清 AI 的計費邏輯、成本壓力,以及廠商與用戶之間的博弈關系。
![]()
谷歌衡量 AI 業務爆發式增長,唯一的計量單位就是 Token。谷歌首席執行官桑達爾?皮查伊在最近的 I/O 開發者大會上公布,公司每月處理的 Token 總量高達3.2 千萬億。他笑著補充:“我從沒想過自己會說出‘千萬億’這個詞,但現實就是如此。”
簡單來說,Token 是大語言模型(LLM)處理數據的基本單位,被稱作驅動 AI 革命的 “新石油”。對 AI 服務商而言,它是計量用量、設定價格的標尺;對企業用戶來說,它是換取算力、實現 AI 能力的核心成本。
市場對 Token 的需求近乎無限,這進一步加劇了全球 GPU 資源短缺,反過來又持續推高使用 AI 工具的整體成本。
Token 究竟是什么?
和人類理解語言的方式類似,大語言模型會把句子拆解成一個個 Token,以此理解語義。皮查伊將其定義為:“模型處理數據的基本單元,每一個 Token 往往對應一個待解決問題的片段。”
Token 的形式不固定,可以是完整單詞、詞根,也可以是字母串、符號或短語,復合詞還會被拆分成多個 Token。比如輸入提示詞 “I am running after a car”,模型會拆成 “I”“am”“run”“ing”“after”“a”“car”,共 7 個 Token。
Gartner高級總監分析師迪帕克?賽斯給出了通用換算標準:1 個 Token 大約相當于 0.75 個英文單詞,100 個單詞約等于 135 個 Token。
Token 定價有門道:上傳便宜,下載更貴
Token 并非統一定價,核心差異在于 “上傳” 和 “下載”——向 AI 系統上傳內容的 Token 價格更低,而獲取 AI 生成結果的下載 Token 價格更高。
舉個例子,用戶上傳一份簡歷只需支付少量費用,但下載經 AI 潤色優化后的簡歷,費用會明顯增加。ManpowerGroup數據科學與 AI 解決方案負責人馬克斯?利明解釋:“上傳成本低,因為 AI 還未進行深度運算;下載成本高,是因為 AI 已經完成了分析、生成等核心工作。”
目前,Token 計費模式主要面向企業和程序員這類重度用戶。Anthropic 的 Claude Code、OpenAI 的 Codex 均采用 Token 計費;微軟 GitHub 也宣布,將于 6 月 1 日起推行類似的 Token 計費機制。
企業最終的 AI 賬單由兩部分組成:Token 費用 + 算力費用(如 GPU 使用時長)。利明提到,Max Leaming一方面向模型廠商支付 Token 費用,另一方面還要承擔獨立的算力成本。目前,該公司使用微軟 Azure 云服務,搭配 Snowflake 數據庫運行 AI 相關業務。
高效模型:用更少 Token 辦更多事
不同 AI 模型的 Token 使用效率差異很大,優質模型能以更低 Token 消耗,輸出更優質的結果,直接幫企業節省成本。
皮查伊在大會上重點提到谷歌新推出的Gemini 3.5 Flash,這款模型采用 Token 計費,卻能以不到同類頂級模型一半的價格,提供前沿水平的 AI 能力。
“我們了解到,不少企業已經用光了年度 Token 預算,” 皮查伊說,“如果企業混合使用 Gemini 3.5 Flash 和其他頂級模型,能大幅降低整體成本。”
提示詞效率,決定 Token 成本的關鍵
提示詞(Prompt)的編寫效率,直接決定 Token 消耗多少。Gartner分析師賽斯舉例稱,同樣完成一項編程任務,有人用 10000 個 Token 才能搞定,有人僅需 1000 個,但目前還沒有工具能精準衡量這種效率差異。
“越來越多企業開始轉向按最終效果付費,因為大家逐漸認清 Token 的真實成本,開始重視 Token 使用效率。” 賽斯說。
ManpowerGroup就針對這一點,開發了簡化用戶數據查詢流程的看板工具。起初,新用戶使用內部勞動力市場數據工具,需要 10 輪追問才能獲取目標結果;一年后,用戶平均僅需 4 輪追問,Token 消耗大幅減少,效率顯著提升,背后核心原因就是提示詞編寫更精準高效。
不過高效也分兩面,部分頂級 AI 工具定價極高。比如 Anthropic 尚未公開的 Mythos 大模型,推理能力遠超同類,但單 Token 價格堪稱天價。利明認為:“即便單 Token 成本上漲,整體使用成本反而可能下降,因為它的效率足夠高。”
AI 廠商的 “成癮式” 商業模式
頭部 AI 廠商投入巨額資金搭建 AI 基礎設施,卻刻意壓低 Token 單價,這被業內稱為“成癮式策略”,即先讓用戶對 AI 服務產生依賴,后續再通過漲價收割利潤。
利明補充,免費 Token 是廠商鎖定客戶的重要手段。向企業提供免費 Token,會促使企業將核心業務流程綁定到廠商專屬的大語言模型和 AI 智能體上。為進一步鞏固綁定,主流 AI 廠商還會派出工程師駐場,為客戶部署 AI 模型。
這類工程師被稱為前線工程師(FDE),相當于 AI 領域的 “專屬顧問”,幫客戶制定 AI 戰略、搭建技術框架、解決推理與上下文理解難題,還負責處理安全問題,深度參與客戶 AI 項目落地。
如今,OpenAI、谷歌、微軟早已不再只賣 AI 模型,而是轉向 “深入企業內部,幫客戶搭建專屬 AI 基礎設施” 的服務模式。
免費 Token,成為工程師的新型職場福利
英偉達CEO黃仁勛曾提到,免費 Token 如今已成為工程師的求職福利,就像企業為員工報銷手機話費一樣普遍。
利明表示自己尚未見過這類案例,但他認為這種模式暗藏風險,因為雇主提供的免費 OpenAI 或微軟 Token,本質是一種間接的廠商鎖定。“員工習慣了某款 AI 工具,就會越來越依賴它,企業后續很難更換供應商。”
同時,免費 Token 也降低了前沿 AI 技術的試錯門檻。不少企業高管會自費測試 OpenClaw,即那項被視為突破性但暫不適合企業正式使用的高風險 AI 技術。ARM AI 與開發者平臺高級副總裁亞歷克斯?斯皮內利就有過這樣的經歷:“我測試 OpenClaw 時,一次配置錯誤,一個周末就產生了 500 美元賬單。這世上沒有免費午餐,Token 真的很貴。”
賽斯將免費 Token 策略,比作印度一家煙草公司曾給員工發放香煙的做法:“員工領了香煙就會抽,慢慢養成習慣。免費 Token 也是如此,一旦用上,就離不開了,因為它已經成了 AI 世界的硬通貨。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.