網易首頁 > 網易號 > 正文申請入駐

最高降幅達99%！小米官宣MiMo?V2.5大模型API永久降價

2026-05-27 15:54:52　來源: CSDN

北京舉報

分享至

整理 | 屠敏

出品 | CSDN（ID：CSDNnews）

過去一年，大模型行業最激烈的競爭，一直圍繞“誰更聰明”。

但現在，戰場開始迅速轉向另一個方向：誰更便宜。

5 月 27 日，小米旗下 AI 大模型平臺 MiMo 團隊宣布，對 MiMo-V2.5 系列 API 進行永久性降價，最高降幅達到 99%，不再區分上下文窗口長度。與此同時，小米還重做了 Token Plan 計費體系，在同樣價格下，開發者可用 Token 數量直接提升 5～8 倍。

隨后，雷軍轉發了這則消息，并歡迎更多開發者接入。

消息一出，引起海內外開發者熱議。有的人覺得，這已經不是普通意義上的“優惠活動”了，而更像是一次公開的“掀桌子”，將大模型的調用成本壓到一個前所未有的水平。但也有人在體驗后覺得，降價背后，自己的額度消耗速度明顯比以前快了很多。

爭議之下，這則公告究竟給眾多開發者帶來了怎樣的變化？

小米 MiMO-V2.5 大模型到底降了多少？

按照小米技術團隊的官方公告顯示，此次對 MiMO-V2.5 系列的調價共計涉及三個維度：

1. MiMo-V2.5 系列 API 永久降價

本次調價覆蓋 MiMo?V2.5、MiMo?V2.5?Pro 兩大主力版本，最大的變化之一，是不再按 ≤256k、256k?1M 等分段定價，現在統一價格了，開發者成本可預測、賬單更清晰。

以 MiMo-V2.5-Pro 為例：

緩存命中價格統一降到每百萬 Token 僅 0.025 元人民幣
輸出價格降到每百萬 Token 6 元人民幣

相比舊價格，部分場景下降約 86%～99%。

而普通版 MiMo-V2.5 的價格甚至更低。

這意味著，過去只有頭部公司才敢大規模跑的 AI Agent、自動編碼、長上下文推理，現在中小團隊也開始“跑得起”了。

此外，MiMo?V2.5?TTS 依然限時免費，MiMo?V2?Pro、MiMo?V2?Omni 維持原價，舊版 Token 套餐逐步下線，官方引導開發者遷移至更具性價比的 V2.5 系列。

根據公告，這次調價已于北京時間 5 月 27 日 0 時正式在全球同步生效。

2. Token 套餐計費體系優化

同時，小米對計費體系優化也進行了調整，Token Plan 全面升級，同等付費額度用量提升 5–8 倍。

3. 所有在用 Token 套餐額度全額重置

小米還宣布，存量用戶 Credits 自動重置適配新規則。無論當前套餐剩余用量多少，所有處于有效期內、已訂購 Token 套餐的用戶（包含參與小米此前百萬億 Token 創作者激勵計劃獲贈套餐的用戶，以及享有 Apache 軟件基金會專屬福利的用戶），其賬戶積分額度均將于北京時間 5 月 27 日 0 時全額重置，并統一按照新計費規則執行。

此外，小米也預告，針對 Token 套餐已到期的歷史付費用戶，其也準備了專屬驚喜福利，相關內容將在一周內公布。

免費領100 小時云算力｜CSDN 讀者專屬福利

適配 DeepSeek、Qwen 等主流大模型

掃碼即刻領取，每月還有顯卡、AIPC等實物好禮抽獎

咖啡領取鏈接： https://s.csdn.cn/4nPsOp

以前最貴的，不是模型，而是“上下文”

很多普通用戶可能會覺得：“大模型調用不就是按字數收費嗎？”

但實際上，真正讓開發者頭疼的，往往不是一次提問，而是“反復喂上下文”。

尤其在 AI 編程、Agent 工作流里，一個任務往往會：

不斷讀取歷史上下文
重復調用工具
反復傳輸長代碼
多輪循環推理

而這些上下文數據，很多平臺都會重復收費。

于是你會發現：AI 本身不貴，真正貴的是“記憶”。

此前就有開發者在 Reddit 抱怨，小米早期 MiMo 的計費方式非常容易讓人誤判成本：“你以為只在為新增 Token 付費，但實際上整個上下文都在重復計費。”

尤其在 CLI Agent 場景下，成本會指數級上升。

而這次隨著小米的調整，也解決了這個問題。

為什么現在可以降價了，以前價格卻那么高？

如果只看價格，很多人會覺得：“小米也開始卷 AI 價格戰了。”

但如果把最近幾個月的動作放在一起看，會發現 MiMo 的目標可能遠不止“便宜”。

比如就在上個月，小米宣布開源 Xiaomi MiMo-V2.5 系列模型，采用 MIT 協議，支持商用部署和二次訓練，無需額外授權。

這意味著：開發者不僅能調用 API，還能直接拿模型自己部署。

此外，小米還推出了 Orbit 100T Token 激勵計劃。官方稱，該計劃上線不到一個月，100T Token 已被開發者全部領完。

這一系列動作背后，其實已經非常明顯：小米真正想爭奪的，并不是單一模型市場，而是未來 AI Agent 生態的開發入口。

對于這次永久性降價，小米技術團隊也專門解釋了原因。

核心關鍵詞只有一個：推理系統的持續優化。

目前，小米已全面搭載基于 SGLang 高緩存架構的滑動窗口注意力機制（SWA）。

按照官方說法：

這一技術將 KV 緩存數據在顯存、內存、固態硬盤等多級存儲之間的傳輸量，降至優化前的約七分之一；可緩存的 Token 數量提升至原先近 5 倍，大幅提高緩存命中率與整體推理效率。

與此同時，小米技術團隊還對專家并行方案、輸入長度分桶策略等進行優化，進一步提升集群的輸入吞吐能力。在保障服務質量的前提下，持續壓低單 Token 的服務成本。

價格戰背后：AI 行業開始進入“水電煤時代”

事實上，小米并不是第一個主動掀起價格戰的廠商。

更早之前，DeepSeek 已經率先開始下壓價格。

5 月 22 日，DeepSeek 宣布：DeepSeek-V4-Pro API 在結束限時優惠后，正式價格仍將維持在原定價的四分之一。

DeepSeek-V4-Pro 的定價和 MiMo?V2.5?Pro 相同。

這背后，其實反映出整個行業正在發生的一場深層變化。

過去兩年，AI 公司比拼的是參數規模、Benchmark 排名、推理能力、多模態能力。

但現在，一個越來越明顯的趨勢開始出現：模型能力差距，正在慢慢縮小。

于是競爭開始轉向：誰能把 Token 做成“基礎設施”。

這種變化，其實和當年云計算市場很像。

最開始大家比性能。后來大家比價格。

最后算力開始變成水、電、煤一樣的基礎資源。

而誰能把成本打下來，誰就能獲得最大規模的開發者生態。

免費領取 100 小時 AI 算力｜CSDN 讀者福利

加入 AI 開發者計劃獲取：

? AI 算力資源

? 官方技術社群

? Workshop 與 AI Academy

? 開發者專屬福利

立即掃碼，前 50 名額外領取「瑞幸咖啡」

咖啡領取鏈接： https://s.csdn.cn/4nPsOp

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.