網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

當(dāng) Token 越來越便宜，賬單為什么越來越貴

高中歷史為何越來越邊緣化

2026-06-14 00:30:02　來源: 胡說成理

河南舉報

分享至

Django 框架聯(lián)合創(chuàng)始人 Simon Willison，大概是今天世界上最懂 Claude Code 和 Codex 的開發(fā)者之一。

過去 30 天，他消耗了價值 2180.16 美元的 token，實際支付只有 200 美元。

很多人看到的是劃算。

Simon 看到的卻是另一件事。

因為這筆便宜，正在消失。

OpenAI 已經(jīng)把 Codex 從按消息估算改回按 token 計費；Anthropic 沒有提高 Opus 4.7 的掛牌價格，卻通過新的 tokenizer 讓同樣文本最多多切 35% token。過去被平臺補貼掉的那部分成本，正在一點點回到用戶賬單上。

對 Simon 來說，這意味著一個非常具體的變化：過去 200 美元燒掉 2000 多美元 token 的日子，正在成為歷史，而不會再成為一種長期模式。未來某一天，他消耗的那 2180 美元，很可能真的需要支付 2180 美元。

對任何重度開發(fā)者來說，這都不是一個輕松的消息。

問題在于，這件事幾乎不可避免。

企業(yè)已經(jīng)率先感受到了這種變化。

據(jù) The Information 報道，Uber 進入 2026 年沒幾個月就燒穿了全年 AI 預(yù)算，主因是 Claude Code。4 月 23 日，OpenAI 發(fā)布 GPT-5.5，輸入和輸出價格從 GPT-5.4 的 2.5/15 美元提高到 5/30 美元；Anthropic 雖然維持 Opus 4.7 的掛牌價格不變，但 Willison 估算其有效成本約為 Opus 4.6 的 1.4 倍。

一個明漲，一個暗漲。

如果只看這些新聞，很容易得出一個結(jié)論：AI 越來越貴了。

問題是，這個結(jié)論恰恰與過去幾年最重要的研究結(jié)果相反。

a16z 合伙人 Guido Appenzeller 給這條曲線起過一個名字：LLMflation。

2021 年，每百萬 token 60 美元的 GPT-3 級能力，今天只需要 0.06 美元。

武漢大學(xué) Mingdeng Du 團隊今年 3 月統(tǒng)計 OpenRouter 318 個模型和 Epoch AI 3237 條記錄后發(fā)現(xiàn)，過去六年，token 價格整體下降約 600 倍。經(jīng)濟檔模型價格半衰期只有 1.10 年，中檔模型 1.55 年，都快過摩爾定律。

如果只看成本，今天的大模型行業(yè)根本不像在漲價。

更像在經(jīng)歷一場歷史上罕見的通縮。

于是問題來了。

如果成本在塌，賬單為什么越來越貴？

因為企業(yè)今天付的錢，很多討論把這兩筆錢混在一起，于是永遠算不明白這筆賬。

先看第一筆。

Claude Code 修一個 Bug，不是在聊天框里回答問題。它要讀代碼倉庫、分析依賴關(guān)系、調(diào)用工具、運行測試、理解報錯，再把結(jié)果重新送回模型推理。用戶最后看到的可能只是幾百行代碼改動，背后滾過去的卻是幾十萬 token。

推理模型也是如此。

行業(yè)測算顯示，一些復(fù)雜推理任務(wù)里，模型內(nèi)部消耗的 token 可以達到最終輸出的幾十倍甚至上百倍。

所以 Uber 的預(yù)算失控，未必意味著浪費。

也可能意味著另一件事：AI 開始真正干活了。

過去幾年，人們習(xí)慣把大模型當(dāng)搜索引擎、聊天機器人或者寫作助手。今天越來越多企業(yè)把它當(dāng)工程師、分析師、運營人員和客服團隊使用。

任務(wù)變復(fù)雜了。

消耗自然會上升。

買法拉利的人不會抱怨油耗。

不是因為他不在乎錢。

而是買法拉利，本身就是為了那套性能。

今天很多 Agent 任務(wù)也是一樣。代碼審查、復(fù)雜運維、金融分析、合同審核，這些場景里，頂級 Agent 和頂級模型往往是綁定關(guān)系。你當(dāng)然可以換一個便宜五倍的模型，但結(jié)果很可能一起打折。

這部分錢，買的是能力。

它沒有白花。

如果故事到這里結(jié)束，那么結(jié)論會很簡單：AI 更能干了，所以 AI 更貴了。

可問題偏偏出在這里。

過去幾年最重要的研究結(jié)果，講的恰恰是另一件事。

AI 并沒有變貴。

AI 正在經(jīng)歷一場前所未有的降價。

很多人記住了武漢大學(xué)那篇論文里的六年降價 600 倍。

真正值得看的，卻不是這組數(shù)字。

而是那條沒有降下來的曲線。

論文把模型分層以后發(fā)現(xiàn)，經(jīng)濟檔和中檔模型都在沿著同一條軌跡下滑。能力越來越普及，價格越來越接近成本。

如果故事到這里結(jié)束，那么 AI 最終會變成一種標準化商品。

就像云服務(wù)器、電力或者帶寬。

問題在于，偏偏有一部分模型不遵守這個規(guī)律。

論文對旗艦?zāi)Ｐ蛢r格做指數(shù)擬合，得到的 R2 只有 0.031。

翻譯成人話就是：

降價規(guī)律到了這里，幾乎失效了。

與此同時，推理模型相對于普通模型還存在平均 31.5 倍溢價。

這不是統(tǒng)計誤差。

這是市場結(jié)構(gòu)。

普通能力越來越便宜。

不可替代的能力沒有。

OpenAI 把 GPT-5.5 的價格提高一倍，Anthropic 讓 Opus 4.7 通過 tokenizer 提高有效價格，都發(fā)生在這條曲線之外。

于是一個有意思的現(xiàn)象出現(xiàn)了。

同樣叫 token。

有些 token 正在迅速商品化。

有些 token 正在迅速硬通貨化。

前者的價格越來越接近成本。

后者的價格越來越接近稀缺性。

這也是為什么 GPT-5.5 和 DeepSeek 可以同時存在，而且都合理。

前者賣的是當(dāng)前最強能力。

后者賣的是已經(jīng)被驗證、正在擴散的能力。

兩者都在 AI 市場里。

但遵循的是兩套不同的定價原則。

看到這里，一個問題自然會冒出來。

既然頂級模型最終都會擴散，既然今天的 GPT-5.5 遲早會變成明天的普通能力，為什么還要有人拼命往塔尖沖？

因為塔尖最大的價值，從來不是賣貴。

而是定義什么叫先進。

汽車行業(yè)就是這樣。

一輛 5 萬元的車和一輛 500 萬元的車，都能把人從 A 點送到 B 點。后者當(dāng)然更貴。但豪車存在的意義，從來不只是讓富人消費。

ABS、ESP、主動安全、智能駕駛，很多后來成為行業(yè)標配的東西，最早都出現(xiàn)在最貴的那批車上。等技術(shù)成熟，再進入更大的市場。

豪車賺到的錢是一回事。

更重要的是，它定義了行業(yè)下一步往哪里走。

AI 也是一樣。

最新的架構(gòu)、最長的上下文、最復(fù)雜的推理鏈、最激進的訓(xùn)練方法，都會首先出現(xiàn)在塔尖模型里。它們中的絕大多數(shù)會失敗，少數(shù)成功的部分再被蒸餾、壓縮、工程化，最后進入更便宜的產(chǎn)品。

塔尖不是為了賣得更貴而提價。

而是稀缺性和不可替代性，本身就是最剛性的價格支撐。

只要一個模型代表當(dāng)前最先進能力，它的價格就不再完全由成本決定。

決定價格的，是有多少人需要它，以及有多少人能夠替代它。

這也是美國前沿模型公司真正捍衛(wèi)的東西。

不是某一個版本。

而是“最先進模型”這個位置本身。

美國以全球 AI 創(chuàng)新第一策源地自居。無論是否喜歡這個說法，至少在今天，它仍然掌握著最強閉源模型、最強商業(yè)化產(chǎn)品和最強融資能力。

既然掌握這個位置，價格自然不會跟著成本一起跌。

因為它賣的已經(jīng)不是 token。

而是不可替代性。

美國前沿收的那筆租，不是利潤，是賭注的本金。

SpaceX 的 S-1 招股文件里寫著：Anthropic 自 2026 年 5 月起向它采購 COLOSSUS 與 COLOSSUS II 的算力，合約到 2029 年 5 月，每月最高約 12.5 億美元，而這只是它供應(yīng)商名單里的一家。

從價格與成本那道縫里擠出來的錢，轉(zhuǎn)手喂進機房。

這種承諾只在一個前提下成立：

它賭自己手里那點不可替代性，未來幾年塌不下來。

中國押的也是同一道題。

只是方向不同。

很多人把中國模型理解成低價路線。

這是一種誤讀。

如果只是低價，中國不會出現(xiàn) DeepSeek 的百億美元融資，不會出現(xiàn)智譜持續(xù)沖擊更強編碼能力，也不會出現(xiàn)騰訊混元結(jié)束兩年單邊降價、重新提高 API 價格。

中國企業(yè)同樣在爭奪塔尖。

因為沒有人愿意永遠接受別人的價格錨點。

真正的區(qū)別在于，中國更相信技術(shù)擴散。

DeepSeek 把 V4-Pro 永久降到原價四分之一，百萬 token 輸入輸出合計約 5.27 美元，是 GPT-5.5 的七分之一、Claude Opus 4.7 的六分之一，同時推進約 100 億美元融資。小米 MiMo-V2.5 系列永久降價，最高降幅 99%。火山引擎披露，豆包大模型日均 token 已突破 120 萬億，三個月翻倍。

這些動作背后不是簡單的價格戰(zhàn)。

而是一種產(chǎn)業(yè)判斷。

過去二十年，中國最成功的產(chǎn)業(yè)幾乎都遵循同一條路徑。

新能源車如此。

動力電池如此。

光伏如此。

先追趕最先進技術(shù)，再把先進技術(shù)工程化、規(guī)模化、商品化，最后把原本屬于少數(shù)人的能力帶進大眾市場。

AI 正在重復(fù)這條路徑。

塔尖當(dāng)然重要。

但體積最大的市場，從來不在塔尖。

中國賭的是，塔尖能力擴散的速度，會快于塔尖收租的速度。

而這道墻現(xiàn)在有多厚，沒人知道。

智譜4月7日開源的 GLM-5.1，編程能力做到Claude Opus 4.6的94.6%，MIT 協(xié)議商用零限制，訓(xùn)練全程跑華為昇騰、沒有一張英偉達卡。

今天這場看上去在爭 token 價格的爭論，爭的不是價格。

爭的是 AI 的不可替代性還能維持多久。

美國賭的是這道墻足夠厚。

中國賭的是這道墻會越來越薄。

等答案揭曉，兩邊的下注里，必有一筆成為再也收不回的沉沒成本。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.