日前,在國務院新聞辦公室的新聞發布會上,國家數據局局長劉烈宏正式宣布,AI領域核心術語“Token”的官方中文定名為“詞元”,并公布我國日均詞元調用量已突破140萬億,較2024年初增長超1400倍,較2025年底增長40%以上。這一里程碑式的定名與數據發布,標志著我國人工智能產業正從技術探索邁入規模化商業落地的新紀元,詞元作為智能時代的“價值錨點”與“結算單位”,正重塑著全球AI產業生態。
01
從千億到百萬億:
中國AI駛入規模化增長快車道
如今,中國AI發展的“數字脈搏”正以詞元調用量的形式清晰跳動。今年3月以來,我國日均詞元(Token)調用量已超過140萬億,相比2024年初的1000億增長了1000多倍,相比2025年底的100萬億,3個月時間又增長了40%多。“日均詞元調用量的大量增加,充分表明中國的人工智能發展進入了快速增長階段。”劉烈宏表示,人工智能應用場景在不斷深化,從能對話到能決策執行的智能體,中國人工智能產業的競爭力顯著增強,現在備受關注的Token出海,就是產業競爭力增強的一個標志。
據劉烈宏介紹,在各方共同努力下,我國高質量數據集的建設工作取得了階段性成效。截至2025年底,全國已建成的高質量數據集超過10萬個,總體量相當于中國國家圖書館數字資源總量的310倍。國家數據局將持續推進數據賦能人工智能創新發展,協同各方深入實施新一輪的高質量數據集建設行動計劃,以場景需求為牽引,加快推進先行先試的工作,打造技術可行、實用便捷、質量保障的AI-Ready(AI就緒度)高質量數據集,實現高質量數據集供給的量質提升。
02
解碼詞元:
AI大模型的“基本運算單元”與價值計量核心
究竟何為詞元?作為AI大模型處理信息的基本單位,我們以字為單位來讀書寫字,對于大模型,這個輸入輸出的單位就是Token。在AI的眼里,一個Token可能對應幾個漢字、單詞,也可能是一個標點、數字或者符號。它就像AI時代手機的流量一樣,每一個AI模型廠商都會提供自己的Token,并且以它的消耗量為單位向用戶收費。
無論是用戶的提問,還是AI生成的一段代碼,最終都要被拆解成Token來完成運算。例如火爆的“養龍蝦”(部署和使用本地AI智能體OpenClaw),想讓它變得更聰明,就得為大模型的服務付費,本質上就是在購買Token的使用量。
從技術本質來看,詞元是自然語言的數學化表達。一段文字、一個問題進入AI模型前,會先被“分詞器”拆解為若干詞元,拆分規則因模型分詞器設計而異:“朋友買了西瓜手機!”可能被拆分為“朋友”“買”“了”“西瓜”“手機”,而“Transformer”這類英文詞匯,可能被拆成“Trans”“former”。
這些拆分后的詞元,對人類而言是有意義的文字,對AI卻缺乏直觀認知。為了讓AI“理解”,大模型會先給每個Token分配一個數字編號,然后將這個編號轉化為一組數字坐標(向量)。這個坐標決定了AI如何“理解”這個詞。
更關鍵的是,AI對詞匯的理解并非固定不變,而是通過計算詞元坐標間的復雜關系實現動態解讀——比如“西瓜”,AI會根據上下文,將其坐標向“品牌”或“食物”相關方向調整,從而精準理解“西瓜手機”這類組合的含義。
總而言之,Token計量的,并不只是你看到的AI模型給出的答案,而是生成這個答案所需的全部計算資源。而進入以Openclaw(龍蝦)為代表的agent場景,這種Token的消耗會被指數級擴大。比如讓Openclaw替你干活,把“幫我整理一下文件夾”這句話甩給它之后,它可能需要先讀懂這個要求,然后拆解成十幾個子任務,每個子任務分別調用一次AI,每次調用都帶著完整的系統指令和上下文,必要的時候還要反復檢查有沒有做對、是否需要修正。這背后可能是幾十輪對話、幾萬個Token的連鎖消耗,這也是它看起來只干了點普通的活,但格外消耗Token的原因。
03
中國領跑全球:
詞元競爭背后的算力與產業優勢
全球AI產業的競爭,正以詞元調用量為標尺展開。全球最大AI模型API聚合平臺OpenRouter最新數據顯示,截至3月15日,中國AI大模型的周調用量達到4.69萬億個Token,連續第二周超越美國。全球詞元調用量排名前三的位置,更是被中國模型占據。國產大模型MiniMax M2.5連續五周位居全球大模型調用量榜首,在公司總部的辦公區,產品研發人員展示了直觀的價格差距圖。“達到同樣能力水平的海外模型跟我們的相比,價格可能有十幾倍的差距。”
我們要知道,Token并不是憑空產生的,它是由高性能的GPU在消耗大量的電能,完成數千億次的推理運算后產生的數字資產。每生成一個Token都對應著真實的推理過程,也對應著真實的電力消耗和算力消耗。
而中國大模型公司之所以能夠把Token價格做得更低,主要原因有:第一是我們的電力優勢。中國擁有更完善的電力基礎設施和技術體系,尤其是西部地區豐富的新能源綠電,正在與數據中心算力、樞紐加快耦合,把電直接轉化成AI時代的新型服務能力。第二是技術能力。近年來中國科技企業在推理芯片、模型架構和系統優化上持續突破,這意味著面對同樣一個問題,中國的大模型往往可以用更少的算力、更短的時延、更高的能效,就把答案給算出來。有人說Token將是AI時代新的能源單位,中國電力、中國算力正在以一種全新的方式參與著全球的競爭。
04
詞元成產業“晴雨表”:
重構AI商業邏輯與產業生態
在人工智能時代,用戶輸入的每一個字,大模型生成的每一段話、識別的每一幅圖像,都在消耗詞元。國家數據局專家咨詢委員會委員張向宏介紹,日均超140萬億的詞元調用量,相當于1000萬億個中文詞匯,也相當于250個中國國家圖書館的資源量。
國家發展改革委國家信息中心人工智能處工程師蔡馳宇介紹,詞元日均調用量大幅增長,充分表明人工智能正加速從實驗室走向千行百業和千家萬戶,變成了實實在在的生產力工具,像水、電、網絡一樣,成為智能社會運轉的基礎資源。詞元的消耗量是人工智能產業發展的重要指標和“晴雨表”。
詞元的普及,更在重構人工智能產業的商業邏輯。圍繞詞元的調用、分發與結算,一套新的價值體系正在加速演進形成,并成為人工智能產業可能變現的重要路徑。蔡馳宇介紹,過去一家企業使用信息服務,需要購買信息軟件;現在一家企業使用信息服務,可直接調用大模型接口,用多少詞元,就付多少費用,以詞元消耗量的多少作為計費依據。這種按需付費的模式,大幅降低了企業的AI應用門檻,也讓AI產業的商業變現更具靈活性。
與此同時,專家表示,詞元消耗量增長也對電力資源提出了更高要求。今年的政府工作報告提出,實施算電協同等新基建工程。專家表示,算電協同的本質含義,就是要依托我國具有超前優勢的綠電來發展算力產業和人工智能產業。
素材來源:央視新聞、央視財經、科普中國
編輯:董敏煒
審核:馮海波 劉肖勇
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.