![]()
![]()
理解Token的定價(jià)、市場(chǎng)結(jié)構(gòu)與未來(lái)趨勢(shì),本質(zhì)上是在理解一種新型生產(chǎn)要素如何被嵌入到人類社會(huì)既有的經(jīng)濟(jì)、政治和文化秩序之中,形成智能經(jīng)濟(jì)新形態(tài)。
來(lái)源 |騰訊科技
4月底,AI圈的熱度被兩場(chǎng)發(fā)布會(huì)點(diǎn)燃:
OpenAI亮出GPT-5.5,DeepSeek緊接著推出V4。
AI圈再次進(jìn)入了一輪“誰(shuí)更強(qiáng)”的熱烈討論。
如果我們把視角從模型能力切換到商業(yè)層面,會(huì)發(fā)現(xiàn)一個(gè)更有意思的現(xiàn)象——兩家給同等任務(wù)標(biāo)的Token價(jià)格,差了一個(gè)數(shù)量級(jí)。
以API價(jià)格為例,GPT-5.5的標(biāo)準(zhǔn)報(bào)價(jià)為輸入每百萬(wàn)Token 5美元、輸出每百萬(wàn)Token 30美元;
DeepSeek V4-Pro在2.5折促銷期內(nèi)的報(bào)價(jià)為緩存命中輸入每百萬(wàn)Token0.025元、緩存未命中輸入每百萬(wàn)Token 3元、輸出每百萬(wàn)Token 6元。
約合人民幣折算,GPT-5.5的輸出價(jià)格,是DeepSeek V4-Pro促銷價(jià)的30多倍。
把視野放大到整個(gè)產(chǎn)業(yè)環(huán)境下來(lái)看,這場(chǎng)價(jià)差就更耐人尋味了——
2026年的AI行業(yè),正處在算力成本集體上行、各家廠商紛紛調(diào)價(jià)的關(guān)口。
為什么同一個(gè)產(chǎn)業(yè)里會(huì)同時(shí)出現(xiàn)“漲價(jià)”和“低價(jià)”兩種截然相反的信號(hào)?
為什么GPT-5.5敢翻倍漲?
DeepSeek敢直接把價(jià)格再次降價(jià)?
為什么用戶既愿意為前者付溢價(jià),又被后者大規(guī)模吸引?
按常理,一個(gè)成熟產(chǎn)業(yè)的價(jià)格信號(hào)應(yīng)該是同向的。
但AI大模型行業(yè)偏偏走出了一條截然相反的路,而且兩端都站滿了買(mǎi)家。
這些問(wèn)題指向同一個(gè)答案——我們必須重新理解“Token”這件事。
“Token”原本只是技術(shù)文檔里的字符切分單位,在短短幾年內(nèi)演化為一種新的“經(jīng)濟(jì)要素”。
它被定價(jià)、被消耗、被囤積、被討論,甚至行業(yè)認(rèn)為它具備某種“準(zhǔn)商品”的屬性。
當(dāng)一個(gè)技術(shù)概念跨越工程邊界,開(kāi)始承擔(dān)起市場(chǎng)、產(chǎn)業(yè)乃至社會(huì)層面的功能時(shí),關(guān)于它的經(jīng)濟(jì)學(xué)敘事便悄然展開(kāi)。
本文將主要圍繞三個(gè)方向來(lái)探討:
今天的Token市場(chǎng),呈現(xiàn)怎樣的形態(tài)?
Token背后的定價(jià)邏輯如何?
當(dāng)我們把目光投向未來(lái),這個(gè)市場(chǎng)又會(huì)如何演化?
01
今天的“Token市場(chǎng)”長(zhǎng)什么樣?
一巨頭的“定價(jià)邏輯”各不相同
我們以前沿模型市場(chǎng)中幾家具有代表性的廠商為例——
OpenAI、Anthropic和Google,它們的定價(jià)策略主要圍繞“價(jià)值定價(jià)為主體、成本約束為底線、競(jìng)爭(zhēng)對(duì)標(biāo)為參照” 的混合策略。
但混合歸混合,三者的戰(zhàn)略側(cè)重點(diǎn)和“定價(jià)錨點(diǎn)”顯著不同。
OpenAI以競(jìng)爭(zhēng)對(duì)手價(jià)格為錨,采取“市場(chǎng)滲透 + 分層定價(jià)” 的打法。
低價(jià)的入門(mén)產(chǎn)品(如GPT-4o-mini)甚至可能戰(zhàn)略性虧損,目的是搶占市場(chǎng)份額和開(kāi)發(fā)者生態(tài) ;
高價(jià)產(chǎn)品則承擔(dān)盈利的任務(wù)。
其核心戰(zhàn)略意圖是建立生態(tài)霸權(quán),讓全球開(kāi)發(fā)者依賴其API。這是一種以未來(lái)?yè)Q現(xiàn)在的玩法。
Anthropic以自身價(jià)值為錨。
它不追求最低價(jià),而是強(qiáng)調(diào)安全性、可靠性和企業(yè)級(jí)服務(wù)的品質(zhì)溢價(jià)。
其定價(jià)反映的是“值得信賴的AI伙伴”的品牌定位——
你為之付費(fèi)的不只是Token,更是一種確定性。
Google以生態(tài)效益為錨。
Gemini的Token定價(jià)常常與Google Cloud打包,單看Token價(jià)格可能不是最優(yōu),但結(jié)合GCP生態(tài)的整體價(jià)值便構(gòu)成了獨(dú)特的競(jìng)爭(zhēng)力。
其核心戰(zhàn)略意圖是用AI驅(qū)動(dòng)云計(jì)算業(yè)務(wù)的增長(zhǎng)。
這里有一個(gè)被普遍忽視的現(xiàn)實(shí):
Token的“真實(shí)成本”可能連公司自身也難以精確核算。
訓(xùn)練成本、推理成本、研發(fā)人員分?jǐn)偂?shù)據(jù)采購(gòu)、安全對(duì)齊成本……
這些項(xiàng)目難以精確歸因到單個(gè)Token上,使得嚴(yán)格意義的“成本加成定價(jià)”在操作層面幾乎不可行。
換句話說(shuō),“成本”在Token經(jīng)濟(jì)里更像一條模糊的底線,而不是一把精確的尺子。
放眼長(zhǎng)遠(yuǎn),三家的策略將趨于收斂。
當(dāng)市場(chǎng)充分競(jìng)爭(zhēng)后,價(jià)格層面的博弈空間被壓縮,差異化將從Token價(jià)格本身轉(zhuǎn)向服務(wù)質(zhì)量、安全保障和生態(tài)價(jià)值。
而更根本的演進(jìn)方向,可能是定價(jià)單位本身的變革——
從“按Token計(jì)費(fèi)”轉(zhuǎn)向“按任務(wù)/結(jié)果計(jì)費(fèi)”。
屆時(shí)與我們現(xiàn)階段所討論的定價(jià)策略比較,可能會(huì)失去意義。
二市場(chǎng)結(jié)構(gòu)呈現(xiàn)“分層式寡頭壟斷”
如果非要給當(dāng)前的Token市場(chǎng)畫(huà)一張結(jié)構(gòu)圖,最貼切的描述是——
這是一個(gè)處于“分層式寡頭壟斷”狀態(tài)的市場(chǎng)。
在前沿模型這一高端層級(jí),市場(chǎng)集中度極高:
OpenAI、Anthropic、Google等核心玩家構(gòu)成穩(wěn)固的寡頭結(jié)構(gòu)。
而在中低端市場(chǎng),景象則完全不同,開(kāi)源模型與眾多云服務(wù)商提供了差異化的替代方案,呈現(xiàn)出壟斷競(jìng)爭(zhēng)的特征。
兩種完全不同的市場(chǎng)狀態(tài),在同一個(gè)產(chǎn)業(yè)里并存。
這種獨(dú)特的結(jié)構(gòu),也深刻地塑造了廠商的定價(jià)行為,并通過(guò)三重機(jī)制釋放影響:
第一重影響是價(jià)格引導(dǎo)。
比如在高端層級(jí),OpenAI往往率先調(diào)價(jià),Anthropic和Google隨后跟進(jìn),呈現(xiàn)“寡頭博弈”:
少數(shù)玩家彼此觀望、彼此試探,價(jià)格調(diào)整變成一種心照不宣的協(xié)同動(dòng)作。
第二重影響來(lái)自開(kāi)源模型構(gòu)筑的“價(jià)格天花板”。
閉源廠商的定價(jià)不能遠(yuǎn)離開(kāi)源替代品的水平,否則用戶便會(huì)用腳投票,遷移到自部署或第三方開(kāi)源托管服務(wù)機(jī)構(gòu)。
該領(lǐng)域無(wú)形的天花板,把所有閉源玩家的定價(jià)空間鎖定在一個(gè)相對(duì)克制的區(qū)間內(nèi)。
第三重影響是低鎖定成本約束溢價(jià)空間。
用戶切換AI提供商的成本極低,往往只需要修改幾行API代碼,這迫使即使是寡頭也不敢過(guò)度定價(jià)。
當(dāng)然,廠商并非束手無(wú)策,他們正在通過(guò)微調(diào)模型、專屬功能和生態(tài)工具鏈構(gòu)建“隱性鎖定”,試圖把用戶的遷移成本逐步壘高。
在更宏觀的視角下,Token市場(chǎng)同時(shí)受到兩種相反力量的拉扯:
一邊是“贏家通吃”——
最強(qiáng)模型吸引最多用戶,最多用戶產(chǎn)生最多數(shù)據(jù),最多數(shù)據(jù)訓(xùn)練出更強(qiáng)模型,這是一個(gè)自我強(qiáng)化的飛輪;
另一邊是“去中心化”——
開(kāi)源運(yùn)動(dòng)和垂直領(lǐng)域差異化不斷瓦解和削弱集中化的趨勢(shì)。
這兩種力量的角力,將決定市場(chǎng)的最終形態(tài)。
一個(gè)合理的猜測(cè)是:市場(chǎng)可能穩(wěn)定在“2-3家通用寡頭+開(kāi)源中低端生態(tài)+眾多垂直領(lǐng)域?qū)>婕摇钡娜龑咏Y(jié)構(gòu)上。
這其中,給我們留下的核心警示是:
AI行業(yè)的技術(shù)變革速度極快,市場(chǎng)結(jié)構(gòu)高度不穩(wěn)定。
一次重大技術(shù)突破,比如開(kāi)源模型達(dá)到閉源頂級(jí)水平,就可能瞬間顛覆現(xiàn)有格局。
任何關(guān)于市場(chǎng)結(jié)構(gòu)的分析,都應(yīng)該保持“有效期不超過(guò)兩年”的審慎態(tài)度。
三Token價(jià)格的地區(qū)差異:一場(chǎng)正在擴(kuò)大的全球算力分化
目前,Token價(jià)格的地區(qū)差異已經(jīng)存在且正在擴(kuò)大,“AI算力套利”和產(chǎn)業(yè)轉(zhuǎn)移的趨勢(shì)已經(jīng)開(kāi)始顯現(xiàn)。
2026年2月,OpenRouter平臺(tái)的數(shù)據(jù)已經(jīng)反映出這種趨勢(shì):
根據(jù)該平臺(tái)的全球AI模型調(diào)用量排名——
在2月16日至22日的周榜單中,平臺(tái)調(diào)用量排名前五的模型,有四款來(lái)自中國(guó)廠商,包括MiniMax的M2.5、月之暗面的Kimi K2.5、智譜的GLM-5、DeepSeek的V3.2。
同樣一個(gè)復(fù)雜編碼任務(wù),一個(gè)在Claude Opus 4上可能消耗數(shù)十美元的復(fù)雜編碼任務(wù),但在DeepSeek V3.2這類低價(jià)模型上可被壓到1美元以內(nèi)。
還有MiniMax、月之暗面等中國(guó)廠商,已經(jīng)將輸出價(jià)格普遍壓低至每百萬(wàn)token 2–3美元左右的區(qū)間。
a16z合伙人Martin Casado估計(jì),使用開(kāi)源AI棧的初創(chuàng)公司中大約有80%跑在中國(guó)模型上。
Token價(jià)格的地區(qū)差異已經(jīng)不再是臨時(shí)的市場(chǎng)現(xiàn)象,而是由能源成本、芯片獲取能力、產(chǎn)業(yè)政策共同塑造的長(zhǎng)期格局。
能源成本是最直接的變量。
中國(guó)中西部地區(qū)電力價(jià)格約為美國(guó)加州的1/3到1/2,且清潔能源占比持續(xù)提升,使得大規(guī)模AI訓(xùn)練集群的運(yùn)營(yíng)成本顯著降低。
DeepSeek等廠商正是依托這一優(yōu)勢(shì),將推理成本壓縮至美國(guó)同行的幾十分之一。
并且,芯片獲取能力則決定了算力供給的彈性。
在美國(guó)出口管制背景下,中國(guó)廠商無(wú)法獲得最先進(jìn)GPU,反而倒逼出算法層面的效率創(chuàng)新——
MoE(混合專家)架構(gòu)、量化壓縮、推理優(yōu)化等技術(shù)路線在中國(guó)率先規(guī)模化應(yīng)用。
這種“受限創(chuàng)新”反而形成了獨(dú)特的成本優(yōu)勢(shì):用次優(yōu)硬件跑出接近頂級(jí)的性能。
此外,產(chǎn)業(yè)政策進(jìn)一步放大了上述優(yōu)勢(shì)。
中國(guó)將AI定位為戰(zhàn)略性新興產(chǎn)業(yè),在數(shù)據(jù)中心用地審批、能耗指標(biāo)分配、稅收優(yōu)惠等方面給予支持;
地方政府競(jìng)相建設(shè)智算中心,以補(bǔ)貼電價(jià)、配套基礎(chǔ)設(shè)施等方式吸引AI企業(yè)入駐。
這種“政策-產(chǎn)業(yè)”正循環(huán),使得中國(guó)Token價(jià)格在全球市場(chǎng)形成結(jié)構(gòu)性洼地。
與此同時(shí),印度以及馬來(lái)西亞、印尼、泰國(guó)等部分東南亞市場(chǎng),也因土地、人工、電力和政策成本優(yōu)勢(shì),正在成為AI算力部署的新選擇。
整體來(lái)看,印度和東南亞的算力托管成本也顯著低于北美。
在這樣的背景下,這種價(jià)格差異正在驅(qū)動(dòng)產(chǎn)業(yè)的三類變化:
第一,API調(diào)用的跨境套利。
一些企業(yè)通過(guò)調(diào)用低價(jià)地區(qū)的API來(lái)降低成本。
比如用國(guó)產(chǎn)模型處理非敏感的基礎(chǔ)任務(wù),只在關(guān)鍵任務(wù)上使用GPT系列模型。這類似于IT外包,核心任務(wù)留在本國(guó),非核心任務(wù)外包到低成本地區(qū)。
第二,AI創(chuàng)業(yè)公司的區(qū)位選擇。
Token成本差異影響AI創(chuàng)業(yè)公司的選址。
如果一家AI應(yīng)用公司的主要成本是Token消耗,它可能選擇在Token價(jià)格更低的地區(qū)運(yùn)營(yíng)。
第三,數(shù)據(jù)中心的地理布局優(yōu)化。
企業(yè)根據(jù)電力成本、氣候條件(影響冷卻成本)和Token價(jià)格選擇數(shù)據(jù)中心位置。
但套利存在三個(gè)天然限制:
● 數(shù)據(jù)合規(guī):
跨境數(shù)據(jù)傳輸受到各國(guó)數(shù)據(jù)保護(hù)法約束(GDPR、中國(guó)數(shù)據(jù)出境安全評(píng)估等),限制了隨意跨區(qū)調(diào)用API。
● 延遲和品質(zhì):
遠(yuǎn)距離調(diào)用存在網(wǎng)絡(luò)延遲,且不同地區(qū)模型的語(yǔ)言和文化適配性不同。
● 地緣政治:
中美科技脫鉤趨勢(shì)下,依賴對(duì)方的AI基礎(chǔ)設(shè)施存在“斷供”風(fēng)險(xiǎn)。
長(zhǎng)期來(lái)看,Token價(jià)格差異將驅(qū)動(dòng)“AI算力的全球再平衡”,算力密集型產(chǎn)業(yè)向低成本地區(qū)流動(dòng),但受數(shù)據(jù)主權(quán)和地緣政治約束。
這類似于制造業(yè)的全球化和逆全球化的博弈——效率驅(qū)動(dòng)全球化,安全驅(qū)動(dòng)本地化,兩種力量并存。
02
Token定價(jià),
將演化為哪些模式?
了解了Token經(jīng)濟(jì)的輪廓,我們需要關(guān)注其背后的邏輯——
同樣是API,這個(gè)價(jià)格到底是怎么定出來(lái)的?
為什么同一家廠商的輸出Token要比輸入Token貴上數(shù)倍?
為什么按量計(jì)費(fèi)會(huì)逐步讓位于結(jié)果導(dǎo)向定價(jià),甚至催生出Token期貨這樣的金融衍生品?
這些問(wèn)題的答案,共同構(gòu)成了AI產(chǎn)業(yè)的商業(yè)底座。
一Token輸入與輸出:為什么價(jià)格不一樣?
觀察各家廠商的定價(jià)表,我們會(huì)發(fā)現(xiàn)一個(gè)普遍現(xiàn)象:
對(duì)于OpenAI、Anthropic、Google等海外前沿閉源模型,輸出Token的價(jià)格通常是輸入Token的5-8倍。
對(duì)于國(guó)內(nèi)模型廠商的定價(jià)還會(huì)進(jìn)一步壓低——
部分模型約為3到5倍,DeepSeek等高性價(jià)比模型甚至進(jìn)一步壓低到約2倍左右。
這種定價(jià)差主要是由成本、價(jià)值和策略三層經(jīng)濟(jì)學(xué)邏輯決定。
成本層面,輸出Token的生成需要模型逐個(gè)“預(yù)測(cè)”下一個(gè)Token(自回歸生成),計(jì)算密度遠(yuǎn)高于輸入Token的“理解”過(guò)程(并行處理)。
輸出每個(gè)Token的實(shí)際GPU計(jì)算量是輸入的數(shù)倍,成本差異是真實(shí)存在的。
價(jià)值層面,輸出Token承載了模型“思考”的成果——
回答問(wèn)題、生成代碼、提供建議。
輸入Token只是用戶提供的原始材料(問(wèn)題、上下文),輸出Token才是用戶真正為之付費(fèi)的“價(jià)值產(chǎn)出”。
這種差異定價(jià)反映了“原材料”和“成品”之間的價(jià)值差,類似于棉花和衣服的價(jià)格差。
策略層面,差異定價(jià)還具有行為引導(dǎo)功能。較低的輸入價(jià)格鼓勵(lì)用戶提供充分的上下文(長(zhǎng)提示詞),這有助于模型給出更好的輸出。
如果輸入和輸出同價(jià),用戶會(huì)傾向于壓縮輸入長(zhǎng)度,導(dǎo)致輸出質(zhì)量下降。
差異定價(jià)實(shí)際上是通過(guò)價(jià)格機(jī)制引導(dǎo)用戶的使用行為,優(yōu)化整體系統(tǒng)效率。
從經(jīng)濟(jì)學(xué)的角度看,這是典型的“差別定價(jià)”,對(duì)同一產(chǎn)品鏈條中的不同環(huán)節(jié),按照成本和價(jià)值的差異分別定價(jià)。
它類似于航空公司對(duì)“去程”和“回程”、甚至同一航班不同艙位采取的不同定價(jià),基于成本差異、需求彈性差異和行為引導(dǎo)的綜合考量。
未來(lái),隨著模型架構(gòu)創(chuàng)新(如非自回歸生成),輸入輸出的成本差異可能縮小,但價(jià)值差異定價(jià)的邏輯將長(zhǎng)期存在。
二定價(jià)模式走向“三浪疊加”
輸入與輸出的價(jià)差,只是Token定價(jià)的“靜態(tài)切片”。
如果把時(shí)間維度拉長(zhǎng),會(huì)看到一幅更宏大的圖景,定價(jià)模式本身正在發(fā)生結(jié)構(gòu)性遷移。
3-5年后的Token定價(jià)模式,將經(jīng)歷“三浪疊加”的演化。
第一浪:按量計(jì)費(fèi)與包月訂閱并行(已在發(fā)生)。
面向開(kāi)發(fā)者的API保持按量計(jì)費(fèi)——靈活、可控;
面向消費(fèi)者的產(chǎn)品走向包月訂閱——ChatGPT Plus就是典型。
這兩種模式針對(duì)不同用戶群體共存,井水不犯河水。
第二浪:結(jié)果導(dǎo)向定價(jià)崛起(2-3年內(nèi))。
隨著Agent和自動(dòng)化工作流成熟,定價(jià)單位將從“消耗了多少Token”轉(zhuǎn)向“完成了什么任務(wù)”。
例如,“幫你寫(xiě)一份合同”定價(jià)50元,而不是“消耗了10萬(wàn)Token定價(jià)X元”。
這種模式對(duì)用戶更友好(無(wú)需理解Token概念),對(duì)提供商也更有利(能力越強(qiáng)、效率越高,利潤(rùn)率越高)。
第三浪:金融化和衍生品市場(chǎng)(3-5年內(nèi)可能出現(xiàn)雛形)。
當(dāng)Token成為關(guān)鍵的企業(yè)生產(chǎn)要素,企業(yè)需要對(duì)沖Token價(jià)格波動(dòng)風(fēng)險(xiǎn),就像航空公司對(duì)沖燃油價(jià)格一樣。
Token期貨、算力互換合約等金融工具有明確的市場(chǎng)需求。
但完整的Token交易所需要標(biāo)準(zhǔn)化的Token定義和監(jiān)管框架,這需要更長(zhǎng)時(shí)間。
三浪疊加的終局是“混合定價(jià)體系”:
基礎(chǔ)層按量計(jì)費(fèi)(類似水電煤氣)、應(yīng)用層按結(jié)果/訂閱計(jì)費(fèi)(類似SaaS)、金融層有期貨和對(duì)沖工具(類似大宗商品市場(chǎng))。
Token定價(jià)將不再是一個(gè)單一模式,而是一個(gè)多層級(jí)的價(jià)格生態(tài)系統(tǒng)。
03
未來(lái)的Token市場(chǎng),
會(huì)變成一門(mén)怎樣的生意?
定價(jià)方式的演化,背后的邏輯發(fā)生在“競(jìng)爭(zhēng)范式”的轉(zhuǎn)變。
比如Anysphere公司開(kāi)發(fā)的Cursor,在短時(shí)間內(nèi)實(shí)現(xiàn)了數(shù)億美元級(jí)別的收入規(guī)模,并迅速進(jìn)入大量企業(yè)開(kāi)發(fā)團(tuán)隊(duì),被視為增長(zhǎng)最快的一批AI SaaS產(chǎn)品之一。
Cursor在兩年內(nèi)經(jīng)歷了多輪定價(jià)調(diào)整:
從最初的固定訂閱,到請(qǐng)求配額制,再到基于模型使用量的按量計(jì)費(fèi)。
與此同時(shí),Cursor的產(chǎn)品形態(tài)也在走向Background Agents等更完整的任務(wù)執(zhí)行模式。
從使用層面來(lái)看,用戶不再只是向模型提問(wèn),還有“修復(fù)Bug”“重構(gòu)一段代碼”“補(bǔ)齊測(cè)試”等這樣的開(kāi)發(fā)任務(wù)交給系統(tǒng)。
對(duì)用戶來(lái)說(shuō),重要的是這個(gè)任務(wù)是否被完成、代碼能不能合并、開(kāi)發(fā)時(shí)間是否被節(jié)省。
從它的付費(fèi)模式,我們可以看到明顯的變化:
Token仍是底層成本單位,用戶真正愿意付費(fèi)的對(duì)象,正在從“模型調(diào)用”轉(zhuǎn)向“任務(wù)完成”。
一從“賣(mài)Token到賣(mài)結(jié)果”:商業(yè)模式的根本轉(zhuǎn)向
從“賣(mài)Token”到“賣(mài)結(jié)果”的轉(zhuǎn)變是大勢(shì)所趨,但不會(huì)完全替代,兩種模式將長(zhǎng)期共存。
“賣(mài)結(jié)果”模式的驅(qū)動(dòng)力很明確:
用戶不關(guān)心Token,關(guān)心的是問(wèn)題有沒(méi)有解決。
當(dāng)AI能力可靠到一定程度,按任務(wù)/結(jié)果定價(jià)更符合用戶的心智模型。
比如企業(yè)客戶更愿意為“一次財(cái)務(wù)審計(jì)”付費(fèi)500元,而不是估算“這次審計(jì)大概需要多少Token”。
這種模式已經(jīng)在一些垂直場(chǎng)景出現(xiàn),法律AI按“合同審查”計(jì)費(fèi)、設(shè)計(jì)AI按“l(fā)ogo方案”計(jì)費(fèi)。
但“賣(mài)結(jié)果”面臨兩個(gè)核心難題:
第一,“結(jié)果”的定義和衡量。
什么算“任務(wù)完成”?
如果AI寫(xiě)的代碼有bug算不算完成?
如果AI的法律意見(jiàn)不夠全面算不算完成?
結(jié)果的質(zhì)量評(píng)估遠(yuǎn)比Token數(shù)量計(jì)量復(fù)雜。
第二,風(fēng)險(xiǎn)承擔(dān)的轉(zhuǎn)移。
按Token計(jì)費(fèi)時(shí),用戶為“過(guò)程”付費(fèi),風(fēng)險(xiǎn)主要由用戶承擔(dān):
即使模型輸出不理想,Token已經(jīng)被消耗,成本也已經(jīng)發(fā)生。
但按結(jié)果計(jì)費(fèi)時(shí),用戶為“結(jié)果”付費(fèi),風(fēng)險(xiǎn)會(huì)更多轉(zhuǎn)移到服務(wù)提供商一側(cè):
如果任務(wù)沒(méi)有完成、結(jié)果不達(dá)標(biāo),就很難收費(fèi),甚至需要退款或補(bǔ)償。
這意味著,提供商必須對(duì)模型能力、任務(wù)邊界和交付質(zhì)量有更強(qiáng)的控制力,也要有足夠信心承擔(dān)結(jié)果不確定性的成本。
最可能的演化路徑是“Token作為底層計(jì)費(fèi)協(xié)議、結(jié)果作為上層商業(yè)包裝”,這類似于電信行業(yè)用戶按“通話分鐘”(底層)或“套餐”(上層)付費(fèi),底層的流量計(jì)量一直存在,但用戶感知的是套餐價(jià)格。
Token不會(huì)消失,它將退居幕后成為AI產(chǎn)業(yè)鏈的底層計(jì)量標(biāo)準(zhǔn),而用戶看到的將是“任務(wù)完成”“訂閱套餐”“服務(wù)包”等上層定價(jià)形態(tài)。
二Token交易所:商品化的極限想象
當(dāng)Token開(kāi)始像商品一樣被大規(guī)模買(mǎi)賣(mài),一個(gè)自然而然的問(wèn)題就冒出來(lái)了。
2025年,GPU云計(jì)算公司CoreWeave在納斯達(dá)克上市,隨后四個(gè)月股價(jià)最高沖至187美元,市值一度逼近900億美元。
這家公司最初從事加密貨幣挖礦,后來(lái)轉(zhuǎn)型為面向AI工作負(fù)載的GPU云服務(wù),其中核心商業(yè)模式之一,簡(jiǎn)單概括就是買(mǎi)進(jìn)英偉達(dá)GPU,再租出算力。
稀奇的是資本市場(chǎng)給出的反應(yīng)——
投資人開(kāi)始像對(duì)待石油管道公司一樣,給算力基礎(chǔ)設(shè)施公司定價(jià):
不看增長(zhǎng)故事,只看長(zhǎng)期合同和可預(yù)測(cè)的現(xiàn)金流。
CoreWeave高度依賴多年期的“take-or-pay”合同,客戶承諾購(gòu)買(mǎi)固定的GPU容量,無(wú)論是否實(shí)際使用都必須付款。
“Take-or-pay”(照付不議)是石油天然氣管道行業(yè)的標(biāo)準(zhǔn)合同結(jié)構(gòu)。
如果算力是大宗商品,Token就是從這個(gè)商品里提煉出來(lái)的標(biāo)準(zhǔn)化單位。
那么未來(lái)會(huì)不會(huì)出現(xiàn)一個(gè)統(tǒng)一的“Token交易所”,讓算力像原油一樣在公開(kāi)市場(chǎng)上交易?
現(xiàn)實(shí)問(wèn)題是,技術(shù)上可行、經(jīng)濟(jì)上有需求,但實(shí)現(xiàn)需要克服標(biāo)準(zhǔn)化和監(jiān)管兩大障礙。
市場(chǎng)需求確實(shí)存在:
企業(yè)需要靈活采購(gòu)算力、對(duì)沖價(jià)格波動(dòng)、優(yōu)化成本。
算力中間商和轉(zhuǎn)售市場(chǎng)已經(jīng)在非正式形態(tài)中出現(xiàn)。
但建立正式交易所需要兩個(gè)前提:
第一,Token的標(biāo)準(zhǔn)化。
交易所交易的商品必須是同質(zhì)化的,但當(dāng)前不同模型的Token品質(zhì)差異巨大。
需要建立“Token等級(jí)標(biāo)準(zhǔn)”(類似于原油品質(zhì)分級(jí)),定義不同智能水平Token的可比性和互換比率。
第二,監(jiān)管框架。
Token交易涉及金融屬性(期貨、衍生品),需要金融監(jiān)管機(jī)構(gòu)的認(rèn)可和規(guī)則制定。
未來(lái),更可能先出現(xiàn)的是“算力現(xiàn)貨交易平臺(tái)”,而不是交易所。
類似于電力現(xiàn)貨市場(chǎng)的撮合平臺(tái),讓有閑置算力的企業(yè)和需要算力的企業(yè)直接對(duì)接。
事實(shí)上,Together AI、Replicate等平臺(tái)已經(jīng)在扮演類似角色。
長(zhǎng)期來(lái)看,完整的Token交易所(包含現(xiàn)貨、期貨、期權(quán))可能在5-10年內(nèi)出現(xiàn) ,但它交易的標(biāo)的物更可能是“標(biāo)準(zhǔn)化算力單位”(如GPU小時(shí))而非“Token”本身——
因?yàn)樗懔κ强蓸?biāo)準(zhǔn)化的物理資源,而Token的異質(zhì)性使其難以直接交易。
Token定價(jià)將錨定在算力市場(chǎng)價(jià)格上,疊加各模型的“智能溢價(jià)”。
03
未來(lái)的競(jìng)爭(zhēng)形態(tài):
“石油式”還是“電信式?”
當(dāng)算力和Token越來(lái)越像一種基礎(chǔ)商品,交易機(jī)制只是第一步。
更進(jìn)一步的問(wèn)題是:這個(gè)市場(chǎng)會(huì)形成怎樣的競(jìng)爭(zhēng)格局,又會(huì)如何影響價(jià)格?
目前,兩個(gè)常被援引的類比是“石油市場(chǎng)”和“電信市場(chǎng)” 。
前者是OPEC式的卡特爾協(xié)調(diào)定價(jià),后者是激烈的價(jià)格競(jìng)爭(zhēng)。
我的理解更傾向于后者。
因?yàn)門(mén)oken市場(chǎng)不太可能出現(xiàn)OPEC式的卡特爾協(xié)調(diào)定價(jià),原因有三:
第一,反壟斷約束嚴(yán)格。
AI行業(yè)處于全球監(jiān)管焦點(diǎn),任何顯性的價(jià)格協(xié)調(diào)都會(huì)招致嚴(yán)厲的反壟斷制裁。
第二,開(kāi)源“攪局者”無(wú)法被納入卡特爾。
OPEC能夠運(yùn)作,是因?yàn)槭椭挥猩贁?shù)國(guó)家生產(chǎn);
但Token的“生產(chǎn)者”包括成千上萬(wàn)的開(kāi)源部署者,這是一個(gè)無(wú)法被協(xié)調(diào)的群體。
第三,技術(shù)迭代速度太快。
石油的開(kāi)采技術(shù)變化緩慢,產(chǎn)量可預(yù)測(cè);
但AI領(lǐng)域一次技術(shù)突破就能改變供給格局,使任何協(xié)調(diào)定價(jià)迅速失效。
更可能的走向是電信市場(chǎng)式的“寡頭價(jià)格競(jìng)爭(zhēng) + 非價(jià)格差異化”模式——
少數(shù)巨頭在Token基礎(chǔ)價(jià)格上激烈競(jìng)爭(zhēng)(類似中移動(dòng)、聯(lián)通、電信的流量?jī)r(jià)格戰(zhàn)),同時(shí)通過(guò)增值服務(wù)(微調(diào)、安全、合規(guī)、專屬支持)構(gòu)建差異化。
但Token市場(chǎng)有一個(gè)電信市場(chǎng)不具備的特征:品質(zhì)差異極大。
電信的1GB流量是標(biāo)準(zhǔn)化的,但不同模型的1000 Token智能密度差異巨大。
這意味著Token市場(chǎng)可能發(fā)展為“分層級(jí)價(jià)格競(jìng)爭(zhēng)”:
每個(gè)智能層級(jí)內(nèi)部激烈競(jìng)爭(zhēng),層級(jí)之間保持價(jià)格梯度。
高端層級(jí)利潤(rùn)率高但競(jìng)爭(zhēng)者少,低端層級(jí)利潤(rùn)率薄但競(jìng)爭(zhēng)者多,中間層級(jí)最為動(dòng)蕩。
最終的格局,可能是“電信市場(chǎng)的競(jìng)爭(zhēng)烈度 + 石油市場(chǎng)的品質(zhì)分級(jí) + 軟件市場(chǎng)的版本策略” 的混合體,呈現(xiàn)出一種前所未有的市場(chǎng)形態(tài)。
04
碳排放:
被忽視的外部性賬單
還有一點(diǎn)需要強(qiáng)調(diào)的是,AI數(shù)據(jù)中心的碳排放問(wèn)題,正在從科技公司的“內(nèi)部尷尬”變成公開(kāi)的行業(yè)危機(jī)。
谷歌發(fā)布的《2024年環(huán)境報(bào)告》顯示,其碳排放量五年間上漲近五成;
微軟同年砸下逾百億美元購(gòu)買(mǎi)清潔能源,變相承認(rèn)AI帶來(lái)的能耗壓力已難以遮掩。
這些數(shù)字背后,是一個(gè)被長(zhǎng)期忽視的問(wèn)題:每一次AI調(diào)用,都有碳排放的代價(jià)。
Token消耗的碳排放外部性,應(yīng)該被納入定價(jià)嗎?
從經(jīng)濟(jì)學(xué)原理看,碳排放是典型的“負(fù)外部性”,通過(guò)“碳稅 + Token”模型將其內(nèi)部化在理論上完全合理。
AI數(shù)據(jù)中心已成為全球能源消耗增長(zhǎng)最快的領(lǐng)域之一,如果不將環(huán)境成本納入定價(jià),市場(chǎng)將過(guò)度消耗Token——這是經(jīng)典的“公地悲劇”。
但實(shí)操面臨三重挑戰(zhàn):
第一,碳排放的歸因復(fù)雜。
一個(gè)Token的碳排放取決于數(shù)據(jù)中心的能源結(jié)構(gòu)(風(fēng)電還是煤電)、冷卻效率、GPU利用率等多個(gè)變量,精確計(jì)量每個(gè)Token的碳足跡在技術(shù)上較為困難。
第二,競(jìng)爭(zhēng)中立性。
如果某些國(guó)家對(duì)Token征碳稅而其他國(guó)家不征,AI算力將流向低監(jiān)管地區(qū),形成“碳泄漏”,需要國(guó)際協(xié)調(diào)。
第三,時(shí)機(jī)考量。
AI產(chǎn)業(yè)正處于關(guān)鍵發(fā)展期,過(guò)早征收碳稅可能抑制創(chuàng)新,但過(guò)晚又會(huì)錯(cuò)過(guò)環(huán)境保護(hù)的窗口。
更可行的近期路徑是“自愿披露+ 綠色標(biāo)簽”——
要求AI公司披露Token的碳足跡信息,引入“綠色Token”認(rèn)證標(biāo)簽(類似有機(jī)食品標(biāo)簽),讓用戶自行選擇。
中期引入碳排放配額交易,長(zhǎng)期在國(guó)際協(xié)調(diào)框架下統(tǒng)一碳稅標(biāo)準(zhǔn)。
Token的碳定價(jià)不只是“要不要”的問(wèn)題,而是“何時(shí)以及如何”的問(wèn)題。
05
結(jié) 語(yǔ)
回望這篇文章梳理的全部線索,我們會(huì)發(fā)現(xiàn)Token經(jīng)濟(jì)學(xué)其實(shí)是一個(gè)由多重張力構(gòu)成的復(fù)雜圖景:
寡頭與開(kāi)源的張力,決定了價(jià)格天花板的高度;
價(jià)格競(jìng)爭(zhēng)與品質(zhì)分層的張力,決定了市場(chǎng)的競(jìng)爭(zhēng)形態(tài);
效率與碳排放的張力,決定了外部性如何被內(nèi)化;
全球化與本地化的張力,決定了算力的地理分布;
Token計(jì)費(fèi)與按結(jié)果計(jì)費(fèi)的張力,決定了商業(yè)模式的演化方向。
這些張力沒(méi)有標(biāo)準(zhǔn)答案,它們?cè)诿恳粋€(gè)時(shí)間節(jié)點(diǎn)上重新平衡,又在下一個(gè)技術(shù)突破、下一次政策調(diào)整、下一輪市場(chǎng)博弈中再次被打破。
Token經(jīng)濟(jì)學(xué)的劇本還在第一幕。
技術(shù)在降價(jià),開(kāi)源在倒逼,監(jiān)管在追趕,地緣在切割——
每一股力量都在逐步去重塑這張定價(jià)表背后的權(quán)力結(jié)構(gòu)。
在這個(gè)意義上,理解Token的定價(jià)、市場(chǎng)結(jié)構(gòu)與未來(lái)趨勢(shì),本質(zhì)上是在理解一種新型生產(chǎn)要素如何被嵌入到人類社會(huì)既有的經(jīng)濟(jì)、政治和文化秩序之中,形成智能經(jīng)濟(jì)新形態(tài)。
而它的故事,才剛剛開(kāi)始。
作者史占中:上海交通大學(xué)行業(yè)研究院“ 人工智能+”行業(yè)研究團(tuán)隊(duì)負(fù)責(zé)人、安泰經(jīng)管學(xué)院教授
· END ·
合 作 對(duì) 接
掃碼添加投資人說(shuō)運(yùn)營(yíng)者微信,備注「商務(wù)合作」詳細(xì)溝通。
超 級(jí) 社 群
【投資人說(shuō)】正在組建超級(jí)創(chuàng)業(yè)者社群、超級(jí)讀者群、超級(jí)媒體群等,目前總?cè)藬?shù)已超1000人。
關(guān)注【投資人說(shuō)】微信公眾號(hào),發(fā)送信息「進(jìn)群」,與各行業(yè)精英直接交流,共同進(jìn)步。
旗 下 媒 體
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.