![]()
![]()
夏至未至,大模型行業的價格戰已經打到了白熱化的程度。
過去一年,企業級大模型的Token調用成本暴跌了67%,開源模型拿下了企業Token調用量38%的份額。
就在一周前,DeepSeek扔下一顆深水炸彈——V4-Pro模型的API從臨時打折變成永久降價,百萬Token的輸入緩存命中價格壓到0.025元,網友戲稱“收了個電費”。
當行業還沒緩過神的時候,5月27日凌晨,小米突然宣布MiMo-V2.5系列API永久降價,最高降幅高達99%,且不再區分上下文窗口長度。
短短幾天時間,兩條重磅消息把大模型賽道的價格錨點徹底打穿了。
![]()
MiMo亮劍,深夜降價
先說這次降價本身。
小米技術官方公告顯示,MiMo-V2.5-Pro的輸入緩存命中價格調整后僅為0.025元/百萬tokens,相比原來256k規格的1.40元降了98%,對比長窗口的2.80元達到了99%的降幅。
標準版MiMo-V2.5也不含糊,輸入緩存命中價格降到0.020元,較原價最高降了98%。
![]()
●圖源:小米技術
也就是說,過去調用一次大模型的成本,現在能調用幾十次甚至上百次。對此小米技術官方表示,這是一次對整個模型價格體系進行永久性翻新。
與此同時,TokenPlan計費體系也得到了優化。
此前不少開發者吐槽套餐價格偏貴、Token不夠用,這次小米給出了“加量不加價”的方案:
同等付費價格下,可用Token數量提升到原來的5-8倍,計費規則簡化為:不再區分上下文窗口長度,所見即所得。
此外,所有當前有效的TokenPlan用戶額度在5月27日零點全部重置,按新規則執行,已經過期的歷史付費用戶據說也有驚喜。
![]()
●圖源:小米技術
小米此次降價并非單純的低價競爭,背后是技術底座的持續迭代。
小米技術團隊基于SGLangHiCache完整支持了SWA,將KVCache在多級存儲之間的數據搬運量降到優化前的近1/7,可緩存Token數量提升近5倍,同時通過專家并行方案、輸入長度分桶策略等優化,持續降低了單位Token服務成本。
目前MiMo-V2.5系列,已經覆蓋商用普惠市場的主要場景。
可能很多人對Xiaomi MiMo的印象,還停留在“小米也做了個模型”上。
但實際上,XiaomiMiMo-V2.5-Pro在ArtificialAnalysis榜單上綜合智能指數和Agent指數均位列全球開源模型并列第一,躋身全球所有大模型總榜前五,與ClaudeOpus4.6、GPT-5.4等閉源旗艦比肩。
![]()
![]()
同一時期,MiMo-V2-Pro以超過30%的市占率登頂OpenRouter平臺周榜第一,周調用量達到4.82萬億Token。
從追趕者到領跑者,小米AI只用了一年多的時間。
![]()
六百億豪賭,雷軍下注了
就在降價消息炸開的前一晚,5月26日,小米發布了2026年第一季度財報。
核心數據顯示:總營收991億元,經調整凈利潤61億元,研發投入90億元同比增長33.4%,研發人員總數突破2.6萬人,硬核科技投入力度可見一斑。
財報明確提到,Xiaomi MiMo-V2.5-Pro已躋身全球開源模型雙料第一,MiMo大模型助力HermesAgent登頂全球調用量榜首,成為第一貢獻模型。
雷軍明確對外表態:未來三年,小米在AI領域的投入將超過600億元,今年至少160億元。
![]()
●圖源:小米
據悉,小米2025年全年總收入4573億元,凈利潤不到300億。這意味著小米未來三年要在AI上燒掉兩年多的利潤。
即便當年all in造車時,雷軍也才說十年投入100億美元,而AI的三年投入,年均超過200億,力度之大前所未有。
小米AI業務的快速崛起,離不開核心人才的加持。
此前95后頂尖AI技術人才羅福莉加盟小米,曾在業內引發不小震動,傳聞雷軍以千萬年薪力邀其加入。
在她的統籌下,MiMo從V2系列一路迭代到V2.5系列,4月23日更是一口氣官宣了四款新模型,時隔上一代發布僅36天。
![]()
●圖源:小米
如今,小米MiMo研發團隊平均年齡僅25歲,清北畢業生占比超六成,年輕且頂尖的人才陣容為模型快速迭代提供了核心動力。
而羅福莉本人曾在多個公開場合表達過對AI前景的大膽判斷,她認為大模型完全可能“自己左腳踩右腳提升”,甚至預言AGI將在兩年內到來。這樣的技術野心,顯然需要真金白銀來支撐。
預計小米全年研發投入將超過400億元,而其中相當大的一部分會花在AI上。
![]()
●圖源:小米
在AI加速重構“人車家全生態”的戰略下,小米正把大模型能力注入手機、汽車、IoT全場景,從跨端AI Agent到車載語音助手,從智能家居到工業質檢,每一塊都在鋪AI的底座。
![]()
汽車盈轉虧,雷軍慌不
如果說大模型降價是小米在進攻,那么Q1財報的另一面則揭露了這家公司正在承受的壓力。
財報顯示,小米集團總營收同比下滑10.9%至991.42億元,經調整凈利潤60.72億元,同比大跌43.1%,毛利同比下降14.2%,經營利潤更是從去年同期的131.3億元驟降至53.1億元。
![]()
●圖源:小米集團
可以看到,各條業務線的冷熱分化非常明顯。
手機×AIoT分部收入792.8億元,同比下滑14.5%;智能手機出貨量3380萬臺,同比下降19.2%。
但手機的平均售價卻逆勢漲到了1310元,創下歷史新高,中國大陸高端智能手機銷量占比也達到了23.5%。
這說明小米在主動收縮中低端機型、向高端要利潤。
![]()
●圖源:小米
IoT業務相對穩健,毛利率達到了25.2%的歷史高位,境外IoT收入創下新高。但外界最關心的還是汽車。
一季度智能電動汽車及AI等創新業務收入198.6億元,營收占比飆升至20%,已正式成為小米的第二大業務支柱。
當季交付80,856輛新車,在行業淡季和產品切換的雙重壓力下實現了同比增長6.6%。
然而,由于巨大的工廠折舊、產能爬坡和前瞻研發投入,汽車業務一季度凈經營虧損達到了31.3億元,在連續兩個季度盈利之后,再度轉虧。
怎么理解這個數字?
放眼同級新勢力,一季度零跑以11.02萬輛登頂銷冠,理想以9.51萬輛穩居第二,蔚來交付8.35萬輛,小米以7.86萬輛排名第四。
![]()
●圖源:中汽數研
但零跑背后是五個以上的產品線在同時跑量,理想也是L系列加純電五六個系列打天下,蔚來更是主品牌疊加樂道、螢火蟲超過六個系列。
而小米就SU7和YU7兩個系列。論每款車型的平均貢獻效率,小米甩開所有對手不止一個身位;論產品線單一帶來的結構性風險,小米同樣甩開了所有對手不止一個身位。
一季度小米汽車的處境很微妙。老SU7已經停產,交付全靠YU7系列扛著;新一代SU7雖然在3月下旬開啟交付后,4月單月賣了26826輛、占當月總銷量的73%,但YU7在4月的零售量已從年初巔峰的3.7萬輛回落至9876輛。
兩款車的此消彼長,像極了青黃不接的過渡期。
![]()
●圖注:YU7與Model Y銷量對比,八敗兩勝
但從財報電話會上釋放的信號來看,雷軍并不慌張。
小米CFO林世偉在會上透露,董事會已啟動總額不超過200億港元的股份回購計劃,截至披露時小米2026年累計回購已超過80億港元,回購力度位居港股第二。
真金白銀回購股票,確實比任何口頭表態都更有說服力。更何況小米汽車的毛利率一季度達到了20.1%,放在整車行業已經是一個相當拿得出手的工業化起點,單車均價23.5萬元也在行業中處于第一梯隊。
管理層在電話會上坦言,虧損主要來自跨年訂單的購置稅補貼、SU7 Ultra高端車型交付占比下降、以及核心零部件價格上漲的三重疊加,屬于階段性因素而非結構性問題。
![]()
價格戰打到頭,然后呢
隨著DeepSeek和小米前后降價,一個清晰的信號浮出了水面:大模型API正在從高毛利的收費入口,變成基礎設施級別的水電煤。
梁文鋒此前說過一句話,公司的定價哲學很簡單:核算成本后定價,不貼錢,也不賺暴利,AI應該是普惠的、人人用得起的。
此次小米的降價幅度比DeepSeek更猛,背后是同樣的邏輯:技術的價值,最終要體現在被使用的廣度上。
降價不意味著不賺錢。當調用成本降到足夠低,下游的應用生態才會真正爆發。
Agent開發、代碼輔助、智能客服、語音交互......這些場景的商業化,靠的不是高價賣Token,而是海量調用帶來的規模效應。
小米的算盤很清楚:用降價把開發者拉進自己的生態,用生態的繁榮反哺模型迭代,再用模型能力的領先守住定價的話語權。
而相比于雷軍的豪賭最終能否讓小米在AI時代站穩腳跟,開發者們可能更關心下一個降價的會是誰。
*編排 | 黃家俊 審核 | 黃家俊
行業資訊、案例資料、運營干貨,精彩不停
![]()
2000萬品牌經理人內參!
聚焦頭部與標桿,助力品牌高端化。
品牌專訪微信:jiangnan254(備注:專訪)
百萬品牌經理人都在看
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.