小米 MiMo 官方今日正式宣布,將對整個模型價格體系進(jìn)行一次永久性的全面翻新。自北京時間5月27日0:00起,小米 MiMo-V2.5 系列 API 實(shí)行永久降價,新定價相比原始 API 定價最高降幅可達(dá) 99%,且不再區(qū)分上下文窗口長度。本次調(diào)價全球同步生效,標(biāo)志著小米在AI基礎(chǔ)設(shè)施普惠化上邁出了關(guān)鍵一步。
![]()
此次調(diào)價并非簡單的折扣,而是對計費(fèi)邏輯的徹底重構(gòu)。在具體的定價策略上,小米展現(xiàn)了極強(qiáng)的誠意與競爭力。以 MiMo-V2.5-Pro 為例,調(diào)價后輸入價格僅為 0.025元/百萬Tokens,相比此前 256k 上下文窗口的定價降幅高達(dá) 98%,相比 1M 長上下文窗口更是直降 99%。即便是未命中緩存的輸入與輸出環(huán)節(jié),降幅也分別達(dá)到了 86% 和 71%。更值得關(guān)注的是,新計費(fèi)體系徹底打破了行業(yè)內(nèi)普遍存在的“上下文窗口長度”限制。以往開發(fā)者在使用超長文本或多輪對話時往往需要承擔(dān)高昂的溢價,而此次調(diào)整后,無論輸入長度如何,都將執(zhí)行統(tǒng)一的超低費(fèi)率。這一舉措極大地簡化了開發(fā)者的成本核算,讓AI能力的調(diào)用變得更加透明、可控。
除了 API 的直接降價,小米還同步優(yōu)化了 Token Plan 計費(fèi)體系。在新的計費(fèi)規(guī)則下,同等價格對應(yīng)的 Token 用量將提升至原來的 5-8 倍。官方表示,這一調(diào)整旨在讓計費(fèi)規(guī)則更加“所見即所得”,清晰易懂。為了保障用戶權(quán)益,所有已訂閱 Token Plan 且當(dāng)前仍在有效期的用戶(包括參與“百萬億 Token 創(chuàng)造者激勵計劃”及 Apache 軟件基金會專屬福利的用戶),其 Credits 額度將于北京時間 5 月 27 日 0:00 全量重置,并直接按新計費(fèi)規(guī)則執(zhí)行。這意味著,老用戶不僅享受到了降價紅利,手中的 Token 資產(chǎn)價值也獲得了實(shí)質(zhì)性的翻倍。此外,針對 Token Plan 已過期的歷史付費(fèi)用戶,官方也預(yù)告將在未來一周內(nèi)公布專屬的驚喜好禮。
此次“骨折式”降價的背后,是小米在底層推理技術(shù)上的持續(xù)精進(jìn)。通過支持 SWA 等前沿技術(shù),小米技術(shù)團(tuán)隊成功將 KV Cache 的數(shù)據(jù)搬運(yùn)量降低至優(yōu)化前的近 1/7,并將可緩存 Token 數(shù)量提升至近 5 倍,同時通過優(yōu)化專家并行方案大幅提升了集群吞吐能力。正是這些技術(shù)層面的降本增效,為此次價格體系的重構(gòu)提供了堅實(shí)的底層支撐。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.