![]()
![]()
你刷到這條新聞沒?AI算力,那個過去兩年在打價格戰的東西,突然漲價了。而且不是小漲。
2025年10月,租一塊英偉達H100芯片一年,一小時只要1.70美元。到了2026年3月,漲到2.35美元,半年漲了近40%。更高級的Blackwell系列更夸張,兩個月漲了48%。更關鍵的是,所有云廠商的閑散算力,一夜之間全賣光了——不是“不賺錢”,是“想租都租不到”。
騰訊云先動手,混元模型API輸入價格直接翻了超4倍。阿里云、百度智能云跟著上,漲5%到34%。阿里云平頭哥真武810E算力卡漲34%,智譜AI年內三度提價。
算力便宜的“好日子”,到頭了。
![]()
云廠商漲價全景時間軸——創始人必須算清的賬
算力漲價不是“狼來了”。各家云廠商的調價時間表已經擺在桌面上,創始人必須立刻算清楚自己的成本會漲多少、什么時候漲。
已經生效的漲價:阿里云和百度智能云的AI算力產品(平頭哥真武810E等算力卡、CPFS智算版)已正式漲價,幅度5%-34%。智譜AI的GLM Coding Plan套餐價格已調整,科大訊飛智算平臺的AI推理服務已上調8%。
距離現在只剩約兩周(5月9日)的漲價:騰訊云將對AI算力、容器服務、彈性MapReduce(EMR)統一上調5%。如果你還在用“去年的預算”做今年的算力規劃,你的利潤很可能已經被吃掉了。如果你的企業依賴騰訊云API服務,必須在5月9日前完成2026年下半年預算調整。
![]()
算力“賣方市場”已成定局——你有算力嗎?你有“鎖倉”嗎?
比漲價更可怕的,是就算你愿意出錢,也不一定能買到。
據SemiAnalysis最新報告,按需GPU租賃容量已在所有GPU類型中全線售罄。即便價格上漲,那些已經鎖定按需實例的客戶也不愿釋放資源。研究人員將2026年初尋找GPU算力的難度,類比為預訂“最后一班離開航班”的機票——價格高昂,且幾乎沒有可用資源。
與此同時,英偉達H100的合同正在按2-3年前簽約的原價續簽,個別合同期限甚至延至2028年。算力已經從“隨用隨買”變成“提前鎖倉、長期鎖定”。
這意味著什么?算力市場已徹底從“買方市場”轉為“賣方市場”。如果你的企業依賴彈性算力,卻又沒有提前“鎖倉”,正在面臨被“擠下牌桌”的風險。創始人需要立即回答三個問題:你的算力合同鎖到什么時候了?你鎖定的價格是多少?跟今天的市場價比,你還有“成本護城河”嗎?
![]()
AI智能體“吃垮”了算力——產業鏈正在全域承壓
算力漲價的本質,是AI從“聊天機器人”變成“干活的人”。
2026年被業內稱為“Agent元年”。以OpenClaw為代表的AI智能體不再被動回答,而是主動分解任務、調動工具、反復推演。你讓它訂個機票,它自己琢磨半天,背后的Token消耗量呈指數級往上翻——據OpenRouter統計,2026年4月其平臺周度Token消耗量比去年同期狂漲7-8倍。
算力壓力已經從“服務器端”傳導到“消費端”。財新報道指出,包含MiniMax、Kimi、智譜等在內的多家主流模型廠商的API調用已出現過載或中斷。智譜在近期推出GLM-5-Turbo模型時,新一批模型價格較上一代上漲了20%至50%。CEO張鵬的解釋很直接:“復雜任務的Token消耗量很大,是原來回答一個簡單問題的十倍甚至百倍。”
算力已經不只是服務器采購問題,而是滲透到了每一家公司的月度辦公預算里。以微軟為例,目前只有35.8%擁有Microsoft 365 Copilot訪問權限的員工在主動使用它,而微軟聲稱的產能瓶頸正源于算力。甲骨文5年期信用違約互換價格一度大幅攀升,債券違約風險陡增——這些體量巨大、融資能力一流的科技巨頭也開始被算力成本壓得喘不過氣。算力漲價的“全球化傳導鏈”,正在把所有玩家拉入這場風暴。
![]()
國產芯片“雖遲但到”——算力缺口也是機會窗口
好在,算力缺口是道裂縫,也是光照進來的地方。
以前中國企業得看英偉達眼色行事。美國的出口管制步步收緊,2025年中國AI加速卡出貨量約400萬張,其中國產廠商已拿下165萬張,市場份額從零飆升至41%,英偉達從壟斷95%的份額暴跌至約55%。
具體來看,華為以約81萬張出貨量領跑國產陣營(市占率約20%),阿里平頭哥約27萬張(約7%),百度昆侖芯約12萬張(約3%),寒武紀約12萬張(約3%),海光信息約8萬張(約2%)。值得注意的是,這些出貨量數據統計口徑有所不同。華為的81萬張包含了大量訓練卡,主要面向大型數據中心;而百度昆侖芯出貨量僅統計了AI加速卡品類。部分媒體直接將兩者簡單相加推導市占率的做法,可能導致對國產替代真實進度的誤判。如果去掉非完全對標的品類,華為在AI推理芯片市場的真實市占率仍有較大提升空間,國產替代依然任務艱巨。
更激進的是,Bernstein Research等多家機構預測,華為昇騰芯片將在2026年一舉拿下50%的中國AI芯片市場份額,而英偉達將僅剩8%。美國卡得越緊,國產替代沖得越兇。
2026年3月,華為正式發布了搭載全新昇騰950PR的AI訓練推理加速卡Atlas 350,性能是英偉達H20的近三倍。更關鍵的是,昇騰950PR已在客戶端測試進展順利,包括字節跳動、阿里巴巴在內的多家科技巨頭計劃下訂單。華為計劃2026年全年出貨約75萬顆昇騰950PR。目前,華為已向客戶寄送了樣品并投入量產。
同時,華為昇騰950PR首次實現了與英偉達CUDA生態深度兼容,這意味著此前普遍使用英偉達軟件系統的開發者可以更輕松地遷移模型。盡管大規模遷移仍存在時間成本和工程風險,但這一打通無疑邁出了最關鍵的一步。
![]()
掐指一算:創始人的算力成本賬必須重算
如果你正在創業,或負責公司的戰略規劃,有三件事必須馬上想清楚。否則,你可能在下一波漲價的浪潮中直接被沖垮。
第一件:你的算力成本模型,多久沒更新了?
很多AI應用公司早期用免費或極低價格的Token吸引用戶,流量起飛時無比風光,但付費轉化跟不上算力成本膨脹的速度。問題是,絕大多數人只盯著“訓練”成本,卻沒算清“推理”這筆大賬。據行業預測,2026年AI推理計算需求將達到訓練需求的4到5倍,IDC也認為到2028年推理工作量占比會高達73%。光靠省錢,救不了算力黑洞。你的利潤模型里,Token消耗量與用戶增長的比例關系需要重算。
第二件:你的算力供應鏈,有沒有“第二種選擇”?
中國企業正面臨前所未有的“芯片斷供”風險。如果你完全依賴英偉達,一旦禁令升級,你的業務會瞬間陷入有訂單沒后勁的尷尬。華為昇騰、寒武紀、海光、阿里平頭哥等國產芯片的性能差距正在縮小。現在就開始著手評估并行開發,至少給自己留兩條退路。算力供應鏈“雙軌制”,是未來企業技術負責人的必考題。
第三件:如果算力再翻一倍,你的商業模式還成立嗎?
這個壓力測試聽起來嚴苛,卻是避免未來措手不及的必修課。一個殘酷但現實的命題是:當算力成為稀缺資源,資本市場的邏輯也在變。投資人不會再聽“我有創意、我有流量”的空洞敘事,他們要看到你算力模型的結構性優勢。如果算力再漲一倍你就得關門歇業,那你根本沒準備好迎接下一輪競爭。
算力不再是廉價的公共資源。它的全面漲價,是整個AI行業從“先占地盤”轉向“精打細算”的分水嶺。這場算力資源的價格重構,正在倒逼所有參與者重新做一道題:你的核心競爭力,到底在哪?
說到底,不是算力變貴了,而是靠算力便宜才能活下來的那批企業,該醒醒了。
數據來源:SemiAnalysis、OpenRouter、IDC、中信證券、財新、芯智訊、東方財富等多家機構及媒體2026年4月最新報道,關鍵數據均已交叉驗證。
免責聲明:本文僅為個人分析,不構成任何投資建議。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.