5月27日,小米技術發布公告,宣布對其自研大模型MiMo-V2.5系列API實施永久降價,最高降幅達99%,同時全面優化計費體系。這也是繼DeepSeek之后,又一家宣布API永久降價的大模型公司。
此次調價于北京時間2026年5月27日0:00正式生效,全球同步調整。
此次的最大變化是取消了傳統定價中區分上下文窗口長度的做法,還對Token Plan計費體系進行優化:在同等付費價格下,Token用量可提升至原來的5至8倍。
![]()
▲2026年4月24日,小米MiMo-V2.5系列大模型正式發布 圖據視覺中國
本次調價主要聚焦MiMo-V2.5核心系列
從具體定價與降幅細節來看,MiMo-V2.5-Pro調價后輸入緩存命中價格僅0.025元/百萬tokens,相較于原價≤256k規格1.40元降幅達98%,對比256k-1M規格2.80元降幅更是觸及99%;輸入未命中緩存定價3.000元/百萬tokens,較原價7.00元下降57%,對比長窗口原價14.00元降幅79%;輸出定價6元/百萬tokens,相較原價21元、42元分別下降71%與86%。
![]()
標準版MiMo-V2.5降價力度同樣不小,輸入緩存命中調價后為0.020元/百萬tokens,較≤256k原價0.56元降幅96%,較256k-1M原價1.12元降幅98%;輸入未命中緩存定價1.000元/百萬tokens,相比原價2.80元降幅64%,對比長窗口原價5.60元降幅82%;輸出定價2元/百萬tokens,較原價14元、28元分別下滑86%與93%。
值得注意的是,本次調價主要聚焦MiMo-V2.5核心系列,MiMo-V2.5-TTS系列依舊保持限時免費接入政策,而MiMo-V2-Pro與MiMo-V2-Omni兩款高階模型API價格維持原價不變,同時其Token Plan套餐也不再參與調整并即將下線,引導開發者向高性價比的V2.5系列遷移。
雷軍:未來三年在AI領域投入600億元
5月27日凌晨,小米創辦人、董事長兼CEO雷軍微博轉發@小米技術關于API降價的文章表示:今天凌晨,MiMo-V2.5系列做了一次大幅度的價格調整,最高降幅達到99%,不再區分上下文窗口。歡迎更多開發者接入Xiaomi MiMo大模型。
![]()
降價消息前一天晚間,小米集團發布一季度業績:總收入991.42億元,同比下滑10.9%,環比下滑15.2%;經調整凈利潤60.72億元,同比下滑43.1%,環比下滑4.4%。其中,小米手機×AIoT(人工智能物聯網)分部收入793億元,毛利率為22.5%,智能電動汽車及AI(人工智能)等創新業務分部收入199億元。當季新車交付80856輛;研發投入90億元,同比增長33.4%。
其中,AI已成為小米投入力度最大的領域,公司表示,今年AI領域至少投入160億元,與此同時,雷軍宣布,未來三年在AI領域投入600億元,預計全年研發投入超400億元。目前,MiMo-V2.5-Pro已在Artificial Analysis榜單綜合智能指數、Agent指數上位列全球開源模型并列第一。
而在小米宣布大模型MiMo-V2.5系列API實施永久降價后,小米集團合伙人、總裁,手機部總裁,小米品牌總經理盧偉冰也轉發了@小米技術微博表示,一早看到好消息,幫大家劃下重點:小米MiMo-V2.5系列API永久降價,Token plan用量提升5-8倍,已訂閱用戶額度全部重置!這背后是我們在模型推理系統上的持續優化。有技術的精進,才能有更好Token Plan,更香的價格,繼續加油!
![]()
DeepSeek已先一步開啟“永久降價”
MiMo是小米公司2026年3月正式推出的自研大模型系列,由前DeepSeek核心技術人才羅福莉帶隊研發
2025年11月,曾任職DeepSeek的95后AI技術人才羅福莉正式加盟小米,出任MiMo大模型負責人,組建起平均年齡25歲、清北畢業生占比超六成的研發團隊。有消息顯示,雷軍以千萬年薪力邀羅福莉加入小米。
在羅福莉的統籌下,小米MiMo大模型完成多代快速迭代,今年3月正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基礎模型,后續迭代升級出V2.5進階版本,補齊高性能推理、輕量化通用交互、語音合成等全場景能力,成為小米大模型陣列中面向商用普惠市場的主力產品。
小米宣布降價前,國內另一頭部大模型公司DeepSeek已先一步開啟“永久降價”,主要針對DeepSeek-V4-Pro模型,對應API于5月31日結束限時優惠后,整體調整為原定價的四分之一。調價后,輸入緩存命中0.025元/百萬tokens、未命中緩存3元/百萬tokens、輸出6元/百萬tokens,相較原價實現75%的降幅。
![]()
除小米與DeepSeek外,國內大模型市場也呈現出明顯的K型分化特征。阿里云通義千問、字節跳動豆包等通用型大模型相繼下調API調用價格,而智譜GLM、騰訊混元等主打企業定制服務的模型則維持價格穩定甚至小幅上調,形成“通用模型降價走量、高端模型溢價保值”的新格局。
編輯 包程立 綜合界面新聞、齊魯晚報、21世紀經濟報道等
審核 馮玲玲
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.