![]()
整理 | 屠敏
出品 | CSDN(ID:CSDNnews)
過去一年,大模型行業最激烈的競爭,一直圍繞“誰更聰明”。
但現在,戰場開始迅速轉向另一個方向:誰更便宜。
5 月 27 日,小米旗下 AI 大模型平臺 MiMo 團隊宣布,對 MiMo-V2.5 系列 API 進行永久性降價,最高降幅達到 99%,不再區分上下文窗口長度。與此同時,小米還重做了 Token Plan 計費體系,在同樣價格下,開發者可用 Token 數量直接提升 5~8 倍。
隨后,雷軍轉發了這則消息,并歡迎更多開發者接入。
![]()
消息一出,引起海內外開發者熱議。有的人覺得,這已經不是普通意義上的“優惠活動”了,而更像是一次公開的“掀桌子”,將大模型的調用成本壓到一個前所未有的水平。但也有人在體驗后覺得,降價背后,自己的額度消耗速度明顯比以前快了很多。
爭議之下,這則公告究竟給眾多開發者帶來了怎樣的變化?
![]()
小米 MiMO-V2.5 大模型到底降了多少?
按照小米技術團隊的官方公告顯示,此次對 MiMO-V2.5 系列的調價共計涉及三個維度:
1. MiMo-V2.5 系列 API 永久降價
本次調價覆蓋 MiMo?V2.5、MiMo?V2.5?Pro 兩大主力版本,最大的變化之一,是不再按 ≤256k、256k?1M 等分段定價,現在統一價格了,開發者成本可預測、賬單更清晰。
以 MiMo-V2.5-Pro 為例:
緩存命中價格統一降到每百萬 Token 僅 0.025 元人民幣
輸出價格降到每百萬 Token 6 元人民幣
相比舊價格,部分場景下降約 86%~99%。
而普通版 MiMo-V2.5 的價格甚至更低。
這意味著,過去只有頭部公司才敢大規模跑的 AI Agent、自動編碼、長上下文推理,現在中小團隊也開始“跑得起”了。
此外,MiMo?V2.5?TTS 依然限時免費,MiMo?V2?Pro、MiMo?V2?Omni 維持原價,舊版 Token 套餐逐步下線,官方引導開發者遷移至更具性價比的 V2.5 系列。
![]()
根據公告,這次調價已于北京時間 5 月 27 日 0 時正式在全球同步生效。
2. Token 套餐計費體系優化
同時,小米對計費體系優化也進行了調整,Token Plan 全面升級,同等付費額度用量提升 5–8 倍。
![]()
3. 所有在用 Token 套餐額度全額重置
小米還宣布,存量用戶 Credits 自動重置適配新規則。無論當前套餐剩余用量多少,所有處于有效期內、已訂購 Token 套餐的用戶(包含參與小米此前百萬億 Token 創作者激勵計劃獲贈套餐的用戶,以及享有 Apache 軟件基金會專屬福利的用戶),其賬戶積分額度均將于北京時間 5 月 27 日 0 時全額重置,并統一按照新計費規則執行。
此外,小米也預告,針對 Token 套餐已到期的歷史付費用戶,其也準備了專屬驚喜福利,相關內容將在一周內公布。
免費領100 小時云算力|CSDN 讀者專屬福利
適配 DeepSeek、Qwen 等主流大模型
掃碼即刻領取,每月還有顯卡、AIPC等實物好禮抽獎
![]()
咖啡領取鏈接: https://s.csdn.cn/4nPsOp
![]()
以前最貴的,不是模型,而是“上下文”
很多普通用戶可能會覺得:“大模型調用不就是按字數收費嗎?”
但實際上,真正讓開發者頭疼的,往往不是一次提問,而是“反復喂上下文”。
尤其在 AI 編程、Agent 工作流里,一個任務往往會:
不斷讀取歷史上下文
重復調用工具
反復傳輸長代碼
多輪循環推理
而這些上下文數據,很多平臺都會重復收費。
于是你會發現:AI 本身不貴,真正貴的是“記憶”。
此前就有開發者在 Reddit 抱怨,小米早期 MiMo 的計費方式非常容易讓人誤判成本:“你以為只在為新增 Token 付費,但實際上整個上下文都在重復計費。”
![]()
尤其在 CLI Agent 場景下,成本會指數級上升。
而這次隨著小米的調整,也解決了這個問題。
![]()
為什么現在可以降價了,以前價格卻那么高?
如果只看價格,很多人會覺得:“小米也開始卷 AI 價格戰了。”
但如果把最近幾個月的動作放在一起看,會發現 MiMo 的目標可能遠不止“便宜”。
比如就在上個月,小米宣布開源 Xiaomi MiMo-V2.5 系列模型,采用 MIT 協議,支持商用部署和二次訓練,無需額外授權。
這意味著:開發者不僅能調用 API,還能直接拿模型自己部署。
此外,小米還推出了 Orbit 100T Token 激勵計劃。官方稱,該計劃上線不到一個月,100T Token 已被開發者全部領完。
這一系列動作背后,其實已經非常明顯:小米真正想爭奪的,并不是單一模型市場,而是未來 AI Agent 生態的開發入口。
對于這次永久性降價,小米技術團隊也專門解釋了原因。
核心關鍵詞只有一個:推理系統的持續優化。
目前,小米已全面搭載基于 SGLang 高緩存架構的滑動窗口注意力機制(SWA)。
按照官方說法:
這一技術將 KV 緩存數據在顯存、內存、固態硬盤等多級存儲之間的傳輸量,降至優化前的約七分之一;可緩存的 Token 數量提升至原先近 5 倍,大幅提高緩存命中率與整體推理效率。
與此同時,小米技術團隊還對專家并行方案、輸入長度分桶策略等進行優化,進一步提升集群的輸入吞吐能力。在保障服務質量的前提下,持續壓低單 Token 的服務成本。
![]()
價格戰背后:AI 行業開始進入“水電煤時代”
事實上,小米并不是第一個主動掀起價格戰的廠商。
更早之前,DeepSeek 已經率先開始下壓價格。
5 月 22 日,DeepSeek 宣布:DeepSeek-V4-Pro API 在結束限時優惠后,正式價格仍將維持在原定價的四分之一。
![]()
DeepSeek-V4-Pro 的定價和 MiMo?V2.5?Pro 相同。
這背后,其實反映出整個行業正在發生的一場深層變化。
過去兩年,AI 公司比拼的是參數規模、Benchmark 排名、推理能力、多模態能力。
但現在,一個越來越明顯的趨勢開始出現:模型能力差距,正在慢慢縮小。
于是競爭開始轉向:誰能把 Token 做成“基礎設施”。
這種變化,其實和當年云計算市場很像。
最開始大家比性能。后來大家比價格。
最后算力開始變成水、電、煤一樣的基礎資源。
而誰能把成本打下來,誰就能獲得最大規模的開發者生態。
免費領取 100 小時 AI 算力|CSDN 讀者福利
加入 AI 開發者計劃獲取:
? AI 算力資源
? 官方技術社群
? Workshop 與 AI Academy
? 開發者專屬福利
立即掃碼,前 50 名額外領取「瑞幸咖啡」
咖啡領取鏈接: https://s.csdn.cn/4nPsOp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.