Django 框架聯(lián)合創(chuàng)始人 Simon Willison,大概是今天世界上最懂 Claude Code 和 Codex 的開發(fā)者之一。
過去 30 天,他消耗了價值 2180.16 美元的 token,實際支付只有 200 美元。
很多人看到的是劃算。
Simon 看到的卻是另一件事。
因為這筆便宜,正在消失。
OpenAI 已經(jīng)把 Codex 從按消息估算改回按 token 計費;Anthropic 沒有提高 Opus 4.7 的掛牌價格,卻通過新的 tokenizer 讓同樣文本最多多切 35% token。過去被平臺補貼掉的那部分成本,正在一點點回到用戶賬單上。
對 Simon 來說,這意味著一個非常具體的變化:過去 200 美元燒掉 2000 多美元 token 的日子,正在成為歷史,而不會再成為一種長期模式。未來某一天,他消耗的那 2180 美元,很可能真的需要支付 2180 美元。
對任何重度開發(fā)者來說,這都不是一個輕松的消息。
問題在于,這件事幾乎不可避免。
企業(yè)已經(jīng)率先感受到了這種變化。
據(jù) The Information 報道,Uber 進入 2026 年沒幾個月就燒穿了全年 AI 預(yù)算,主因是 Claude Code。4 月 23 日,OpenAI 發(fā)布 GPT-5.5,輸入和輸出價格從 GPT-5.4 的 2.5/15 美元提高到 5/30 美元;Anthropic 雖然維持 Opus 4.7 的掛牌價格不變,但 Willison 估算其有效成本約為 Opus 4.6 的 1.4 倍。
一個明漲,一個暗漲。
如果只看這些新聞,很容易得出一個結(jié)論:AI 越來越貴了。
問題是,這個結(jié)論恰恰與過去幾年最重要的研究結(jié)果相反。
a16z 合伙人 Guido Appenzeller 給這條曲線起過一個名字:LLMflation。
2021 年,每百萬 token 60 美元的 GPT-3 級能力,今天只需要 0.06 美元。
武漢大學(xué) Mingdeng Du 團隊今年 3 月統(tǒng)計 OpenRouter 318 個模型和 Epoch AI 3237 條記錄后發(fā)現(xiàn),過去六年,token 價格整體下降約 600 倍。經(jīng)濟檔模型價格半衰期只有 1.10 年,中檔模型 1.55 年,都快過摩爾定律。
如果只看成本,今天的大模型行業(yè)根本不像在漲價。
更像在經(jīng)歷一場歷史上罕見的通縮。
于是問題來了。
如果成本在塌,賬單為什么越來越貴?
因為企業(yè)今天付的錢,很多討論把這兩筆錢混在一起,于是永遠算不明白這筆賬。
![]()
先看第一筆。
Claude Code 修一個 Bug,不是在聊天框里回答問題。它要讀代碼倉庫、分析依賴關(guān)系、調(diào)用工具、運行測試、理解報錯,再把結(jié)果重新送回模型推理。用戶最后看到的可能只是幾百行代碼改動,背后滾過去的卻是幾十萬 token。
推理模型也是如此。
行業(yè)測算顯示,一些復(fù)雜推理任務(wù)里,模型內(nèi)部消耗的 token 可以達到最終輸出的幾十倍甚至上百倍。
所以 Uber 的預(yù)算失控,未必意味著浪費。
也可能意味著另一件事:AI 開始真正干活了。
過去幾年,人們習(xí)慣把大模型當(dāng)搜索引擎、聊天機器人或者寫作助手。今天越來越多企業(yè)把它當(dāng)工程師、分析師、運營人員和客服團隊使用。
任務(wù)變復(fù)雜了。
消耗自然會上升。
買法拉利的人不會抱怨油耗。
不是因為他不在乎錢。
而是買法拉利,本身就是為了那套性能。
今天很多 Agent 任務(wù)也是一樣。代碼審查、復(fù)雜運維、金融分析、合同審核,這些場景里,頂級 Agent 和頂級模型往往是綁定關(guān)系。你當(dāng)然可以換一個便宜五倍的模型,但結(jié)果很可能一起打折。
這部分錢,買的是能力。
它沒有白花。
如果故事到這里結(jié)束,那么結(jié)論會很簡單:AI 更能干了,所以 AI 更貴了。
可問題偏偏出在這里。
過去幾年最重要的研究結(jié)果,講的恰恰是另一件事。
![]()
AI 并沒有變貴。
AI 正在經(jīng)歷一場前所未有的降價。
很多人記住了武漢大學(xué)那篇論文里的六年降價 600 倍。
真正值得看的,卻不是這組數(shù)字。
而是那條沒有降下來的曲線。
論文把模型分層以后發(fā)現(xiàn),經(jīng)濟檔和中檔模型都在沿著同一條軌跡下滑。能力越來越普及,價格越來越接近成本。
如果故事到這里結(jié)束,那么 AI 最終會變成一種標準化商品。
就像云服務(wù)器、電力或者帶寬。
問題在于,偏偏有一部分模型不遵守這個規(guī)律。
論文對旗艦?zāi)P蛢r格做指數(shù)擬合,得到的 R2 只有 0.031。
翻譯成人話就是:
降價規(guī)律到了這里,幾乎失效了。
與此同時,推理模型相對于普通模型還存在平均 31.5 倍溢價。
這不是統(tǒng)計誤差。
這是市場結(jié)構(gòu)。
普通能力越來越便宜。
不可替代的能力沒有。
OpenAI 把 GPT-5.5 的價格提高一倍,Anthropic 讓 Opus 4.7 通過 tokenizer 提高有效價格,都發(fā)生在這條曲線之外。
于是一個有意思的現(xiàn)象出現(xiàn)了。
同樣叫 token。
有些 token 正在迅速商品化。
有些 token 正在迅速硬通貨化。
前者的價格越來越接近成本。
后者的價格越來越接近稀缺性。
這也是為什么 GPT-5.5 和 DeepSeek 可以同時存在,而且都合理。
前者賣的是當(dāng)前最強能力。
后者賣的是已經(jīng)被驗證、正在擴散的能力。
兩者都在 AI 市場里。
但遵循的是兩套不同的定價原則。
看到這里,一個問題自然會冒出來。
既然頂級模型最終都會擴散,既然今天的 GPT-5.5 遲早會變成明天的普通能力,為什么還要有人拼命往塔尖沖?
因為塔尖最大的價值,從來不是賣貴。
而是定義什么叫先進。
汽車行業(yè)就是這樣。
一輛 5 萬元的車和一輛 500 萬元的車,都能把人從 A 點送到 B 點。后者當(dāng)然更貴。但豪車存在的意義,從來不只是讓富人消費。
ABS、ESP、主動安全、智能駕駛,很多后來成為行業(yè)標配的東西,最早都出現(xiàn)在最貴的那批車上。等技術(shù)成熟,再進入更大的市場。
豪車賺到的錢是一回事。
更重要的是,它定義了行業(yè)下一步往哪里走。
AI 也是一樣。
最新的架構(gòu)、最長的上下文、最復(fù)雜的推理鏈、最激進的訓(xùn)練方法,都會首先出現(xiàn)在塔尖模型里。它們中的絕大多數(shù)會失敗,少數(shù)成功的部分再被蒸餾、壓縮、工程化,最后進入更便宜的產(chǎn)品。
塔尖不是為了賣得更貴而提價。
而是稀缺性和不可替代性,本身就是最剛性的價格支撐。
只要一個模型代表當(dāng)前最先進能力,它的價格就不再完全由成本決定。
決定價格的,是有多少人需要它,以及有多少人能夠替代它。
這也是美國前沿模型公司真正捍衛(wèi)的東西。
不是某一個版本。
而是“最先進模型”這個位置本身。
美國以全球 AI 創(chuàng)新第一策源地自居。無論是否喜歡這個說法,至少在今天,它仍然掌握著最強閉源模型、最強商業(yè)化產(chǎn)品和最強融資能力。
既然掌握這個位置,價格自然不會跟著成本一起跌。
因為它賣的已經(jīng)不是 token。
而是不可替代性。
美國前沿收的那筆租,不是利潤,是賭注的本金。
SpaceX 的 S-1 招股文件里寫著:Anthropic 自 2026 年 5 月起向它采購 COLOSSUS 與 COLOSSUS II 的算力,合約到 2029 年 5 月,每月最高約 12.5 億美元,而這只是它供應(yīng)商名單里的一家。
從價格與成本那道縫里擠出來的錢,轉(zhuǎn)手喂進機房。
這種承諾只在一個前提下成立:
它賭自己手里那點不可替代性,未來幾年塌不下來。
中國押的也是同一道題。
只是方向不同。
很多人把中國模型理解成低價路線。
這是一種誤讀。
如果只是低價,中國不會出現(xiàn) DeepSeek 的百億美元融資,不會出現(xiàn)智譜持續(xù)沖擊更強編碼能力,也不會出現(xiàn)騰訊混元結(jié)束兩年單邊降價、重新提高 API 價格。
中國企業(yè)同樣在爭奪塔尖。
因為沒有人愿意永遠接受別人的價格錨點。
真正的區(qū)別在于,中國更相信技術(shù)擴散。
DeepSeek 把 V4-Pro 永久降到原價四分之一,百萬 token 輸入輸出合計約 5.27 美元,是 GPT-5.5 的七分之一、Claude Opus 4.7 的六分之一,同時推進約 100 億美元融資。小米 MiMo-V2.5 系列永久降價,最高降幅 99%。火山引擎披露,豆包大模型日均 token 已突破 120 萬億,三個月翻倍。
這些動作背后不是簡單的價格戰(zhàn)。
而是一種產(chǎn)業(yè)判斷。
過去二十年,中國最成功的產(chǎn)業(yè)幾乎都遵循同一條路徑。
新能源車如此。
動力電池如此。
光伏如此。
先追趕最先進技術(shù),再把先進技術(shù)工程化、規(guī)模化、商品化,最后把原本屬于少數(shù)人的能力帶進大眾市場。
AI 正在重復(fù)這條路徑。
塔尖當(dāng)然重要。
但體積最大的市場,從來不在塔尖。
中國賭的是,塔尖能力擴散的速度,會快于塔尖收租的速度。
而這道墻現(xiàn)在有多厚,沒人知道。
智譜4月7日開源的 GLM-5.1,編程能力做到Claude Opus 4.6的94.6%,MIT 協(xié)議商用零限制,訓(xùn)練全程跑華為昇騰、沒有一張英偉達卡。
今天這場看上去在爭 token 價格的爭論,爭的不是價格。
爭的是 AI 的不可替代性還能維持多久。
美國賭的是這道墻足夠厚。
中國賭的是這道墻會越來越薄。
等答案揭曉,兩邊的下注里,必有一筆成為再也收不回的沉沒成本。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.