![]()
英偉達Rubin進入量產,下一代Feynman進一步推升算力硬件需求,服務器架構從訓練主導轉向訓推兼顧,從GPU主導轉向GPU+LPU架構,并推出存儲機柜、CPU機柜、LPX機柜等,實現系統方案的進一步優化。谷歌/AWS/Meta等廠商的ASIC亦在加速迭代。算力芯片需求持續強勁增長,先進制程、先進存儲、先進封裝、PCB、光通信等仍是硬件需求增量、技術創新最顯著的環節,臺積電、三星、英特爾等開發并擴產2nm先進制程,HBM演進到HBM4并衍生出定制芯片,CoPoS、CoWoP等先進封裝形式涌現,CPU、傳統存儲的供需也逐步緊俏。
來源:中信建投證券研究
作者:劉雙鋒 孫芳芳 章合坤 王定潤 何昱靈 郭彥輝 趙子鵬 梁藝 何昊
隨著AI訓練、推理需求的持續膨脹,存儲已成為算力增長的主要瓶頸,HBM/DDR、SSD、HDD陸續成為服務器的最緊缺物料。除了HBM、DDR外,產業內還在開發AI SSD、CMX、HBF、SRAM等存儲器(或方案),以滿足AI訓練和推理過程中數據吞吐的高要求。
01
內存仍然是AI算力核心卡口,HBM需求持續高景氣
隨著英偉達GPU的發布周期固定在每年一次,算力提升對內存容量和帶寬提出了接近每年翻倍的高要求;根據TrendForce數據,GPU的計算能力在過去20年間增長了60000倍,但同期DRAM內存帶寬僅提高了100倍——“內存墻”仍將長期存在,通過HBM路線實現低功耗高帶寬趨勢明確。以位元計算,目前HBM占整個DRAM市場比重仍在個位數,滲透率存在較大提升空間;TrendForce預計2026年HBM出貨量將超過300億Gb。
DRAM產能供給緊缺趨勢不變,SK海力士等龍頭廠商加速擴產。從供給端看,HBM供應仍然緊缺,相應持續擠占DRAM產能,25Q4-26Q1 DRAM廠商現貨報價加速攀升;部分美國與國內廠商已經開始和晶圓廠簽訂2-3年的長期合同進行鎖價。根據Trendforce援引The Bell報道,SK海力士計劃通過清州DRAM工廠M15X和利川M16的擴產,在26H2將其DRAM晶圓產量提高到60萬片/月,和三星的DRAM晶圓產能處于同一水平。具體來看,M15X在投產初期將保持在10000片/月的DRAM晶圓,到26Q4將爬坡至5萬片/月。
HBM迭代周期隨之顯著縮短,HBM4開始大規模商用。2025年下半年,英偉達量產的GB300搭載的是12層24GB的HBM3e,2026年英偉達將發布的Rubin系列和AMD將發布的MI400系列均將搭載HBM4/4e。其中英偉達計劃在26Q1完成HBM4的最終資格測試。從更新周期來看,JEDEC于2025年4月正式發布了JESD 270-4高帶寬存儲器(HBM4)標準,(接口寬度從HBM3/HBM3e的1024位翻倍至2048位;堆棧通道數從16個增加到32個,支持24Gb或32Gb芯片的4到16層堆棧配置),較HBM3規范發布晚約三年,計劃落地時間較HBM3落地時點亦在三年左右。根據EETimes的預測,HBM的迭代周期從前期的每四年一代提高并穩定到每兩年到兩年半一代。
![]()
全球龍頭存儲廠商競逐HBM4,SK海力士仍居領先地位,三星美光加速追趕。根據Trendforce預測,2025年SK海力士將以59%的HBM出貨量保持行業領先地位,而三星和美光將各占20%左右份額。從時點上看,SK海力士于2025年3月交付了全球首批12層HBM4樣品、6月小批量出貨,計劃10月快速進入量產;美光也在25Q2向主要客戶交付了HBM4樣品;三星的HBM4樣品25Q2交付給英偉達,當前進入最終的預生產(PP)階段。預計2026年,領先的GPGPU如Rubin將大范圍采用HBM4,Yole預計2026年HBM4滲透率將達到51%。
從技術上看,SK海力士的HBM4擁有2048個I/O終端,帶寬翻倍,引腳速度在6.4Gbps以上。美光目前交付HBM4樣品超過2.8 TBps帶寬和超過11 Gbps引腳速度,計劃在2027年同時推出標準版和定制版的HBM4e。三星同樣計劃于2027年推出HBM4e產品,目標引腳速度超過13Gbps,目標最大吞吐量3.25TB/s,較當前HBM3e快2倍以上。
![]()
遠期看,英偉達等廠商計劃自研Base Die,將存算架構進一步整合。除傳統晶圓廠外,為了進一步提高傳輸速率,AI算力芯片廠商也開始協同進行HBM設計。2025年8月,英偉達宣布計劃自研HBM內存Base Die,采用3nm工藝,預計于2027年下半年開始小規模試產。英偉達此次自研HBM內存Base Die的計劃,旨在優化AI芯片的內存帶寬與能效匹配度;未來英偉達的HBM內存有望采用內存原廠DRAM Die與英偉達Base Die的組合模式,標志著其在高性能計算存儲架構領域的垂直整合進一步深化。
02
為解決HBM高成本低容量的問題,HBF應運而生
HBM帶寬大、延遲低,但容量低、成本高。隨著AI大模型參數規模向萬億級邁進,推理部署環節的市場規模和應用場景變得極為廣闊,但傳統的存儲體系正面臨嚴峻的“內存墻”困境。HBM雖能提供極致的帶寬和納秒級訪問延遲,但其容量有限(單堆棧通常為16-64GB),且成本高昂,難以線性擴展。與此同時,傳統SSD雖然容量大、成本低,但帶寬嚴重不足(如NVMe PCIe 4.0 SSD僅約7GB/s),無法滿足大模型推理時對海量權重數據和鍵值緩存(KV Cache)的高速讀取需求。在AI推理場景中,數據訪問模式呈現出“讀多寫少”的特點,且需要單次加載的模型容量極高——例如運行405B參數的Llama 3.1模型時,僅權重存儲就需要數百GB空間。HBM很快會被KV緩存占滿,而依賴遠端SSD或向量重計算又會引入顯著延遲。
正是在這一供需失衡的背景下,HBF(High Band Flash,高帶寬閃存)應運而生。HBF旨在填補HBM與SSD之間的巨大空白,以接近HBM的帶寬和成本水平,提供其8至16倍的超大容量。SK海力士的仿真測試表明,在H3混合架構中引入HBF后,原本需要32顆GPU才能完成的工作負載,僅需2顆GPU即可實現,能效比提升最高達2.69倍。HBF的出現,不僅有望破解推理階段的存儲瓶頸,更可能從根本上改變AI算力集群的經濟模型,成為銜接HBM與SSD的新一代核心存儲方案。
HBF通過封裝創新、3D堆疊和分布式控制,在容量、帶寬和成本三個維度上實現了獨特的再平衡,成為AI推理場景的理想存儲載體。HBF是一種基于3D NAND閃存的高帶寬堆疊存儲技術,其設計理念借鑒了HBM的垂直堆疊架構,但將存儲介質從易失性的DRAM替換為非易失性的NAND閃存。在物理結構上,HBF通過硅通孔(TSV)或CMOS直接鍵合陣列(CBA)工藝,將多層高性能NAND閃存芯片垂直堆疊起來,并通過邏輯芯片與中介層連接至GPU或處理器,形成密集互連的存儲結構。單堆疊可達16層die,首代產品即可實現512GB的容量和1.6TB/s的讀取帶寬——這一帶寬水平已接近HBM3e的性能,而容量則是同等物理空間下HBM的8至16倍。與傳統SSD依賴單控制器串行調度不同,HBF采用分布式控制結構,每一組NAND die可獨立并行訪問,結合優化的控制器算法,將NAND固有延遲從毫秒級壓縮至約5微秒級,匹配AI推理場景對高帶寬讀的需求。由于基于NAND閃存,HBF具備非易失特性,無需像HBM那樣持續刷新供電,靜態功耗僅為HBM的64%至80%。當然,HBF也存在先天短板:NAND的寫入耐久性有限(約10萬次擦寫),訪問延遲(微秒級)遠高于DRAM的納秒級,因此業界主流設計思路是將HBF用于只讀數據或低頻寫入的鍵值緩存,而將頻繁讀寫的動態數據留在HBM中。
![]()
目前,全球存儲巨頭已圍繞HBF形成技術競賽格局,標準化與量產進程正在加速推進:
閃迪是HBF概念的率先提出者,2025年2月在投資者日上正式介紹HBF技術,依托自家BiCS 3D NAND和CBA工藝構建核心架構,采用16層核心芯片堆疊。閃迪計劃于2026年下半年交付首批HBF模塊樣品,目標2027年初推出首批集成HBF的AI推理服務器。
SK海力士是當前HBF研發最為積極的廠商之一,2025年8月與閃迪簽署諒解備忘錄,共同推進HBF技術標準化;同年10月在OCP全球峰會上正式發布包含HBF技術的“AIN B”系列存儲器,并舉辦“HBF之夜”活動推動生態合作。SK海力士還提出了創新的H3混合架構(Hybrid HBM+HBF),將HBM與HBF并列部署于GPU兩側,通過雙存儲層級協同工作,并已完成早期測試驗證。公司目標在2026年推出第一代HBF樣品,2027年實現量產。
三星電子雖態度相對審慎,但已啟動HBF產品的早期概念設計工作,并依托其在邏輯代工領域的4nm至2nm工藝優勢,探索自研控制邏輯與下一代NAND方案的能效優化。三星計劃在2027年底至2028年初將HBF集成到英偉達、AMD及谷歌的實際產品中。
此外,主控芯片方面,HBF需要配套極高吞吐能力的控制器來駕馭其超高帶寬,閃迪、SK海力士等廠商均在研發專用的分布式控制架構,確保NAND陣列的并行訪問效率。行業標準方面,三大廠商已就HBF標準化展開合作,閃迪與SK海力士、三星正共同推動HBF成為行業通用標準,目標在2027年完成產業級標準落地。
03
AI服務器擠兌傳統應用需求,傳統存儲缺貨漲價,漲價周期顯著拉長
復盤存儲器歷史,存儲器周期大致4-5年,上行、下行周期大致2年上下。上輪周期起始于20Q1,21Q3存儲器價格見頂,此后價格持續下滑,至2023Q2持續7個季度。本輪周期,存儲器23Q3開始漲價,期間24Q2-24Q4因庫存問題,價格有所回落。24Q4-25Q3,除了HBM,DRAM和NAND價格漲跌更多來自庫存周期,直到25Q4,北美云廠商對于2026年的需求展望大幅提升,內存條、eSSD缺貨漲價,存儲隨著產能被服務器占用,傳統應用(手機、電腦等)開始缺存儲器,漲價蔓延至非AI領域的存儲器。
![]()
需求側,對于DRAM而言,單GPU配置的HBM、DDR規格和容量提升,2023年以來需求跟隨GPU持續強勁增長;對于NAND而言,推理側的爆發和QLC NAND成本的下降加強了對高速率、低延遲SSD對HDD的優勢,SSD需求跟隨token爆發。
催動本輪存儲上行的核心因素是AI,特別是推理需求的爆發。大模型訓練階段的存儲需求主要來自預訓練數據集和checkpoint(模型狀態快照),原始數據集規模約10-30TB,而checkpoint存儲量與模型參數量線性相關(如6000億參數模型每個checkpoint約7TB,100個總計約700TB),這些數據主要存儲在SSD和HDD中,因HBM容量不足而需從HBM經DRAM逐步offload至SSD。推理階段的存儲需求則主要來自KV Cache、RAG等,其規模比原始數據大1000倍左右(取決于向量維度),隨著思維鏈發展和用戶上下文增長,單次提問token數激增至上萬,KV Cache需長期存儲在SSD中,當用戶30分鐘未交互時自動從HBM存入SSD,后續提問時再加載回HBM。推理階段的KV Cache存儲策略采用精確匹配(用戶歷史對話)和向量空間模糊匹配(多用戶共享問題),通過共享相同問題的KV Cache和將長期未使用數據轉存至HDD來優化存儲,而訓練階段的存儲需求則隨模型參數量增加而等比例上升。
![]()
其次是HDD(機械硬盤)供應短缺,eSSD需求爆發。SSD相比HDD的核心優勢在于顯著的讀寫速度和低延遲特性,SSD的讀寫速度可達十幾GB級別,而HDD僅約幾百兆,這使其在AI推理、高頻數據訪問等場景中具有明顯優勢。HDD被SSD替代的主要原因是AI應用爆發式增長,尤其是數據中心對高性能存儲的剛性需求,同時HDD產能面臨嚴重瓶頸,HDD廠商因行業處于"夕陽產業"狀態普遍不愿擴產,而是致力于優化成本和增加單盤容量,導致HDD供應緊張。在AI應用推動下,大量新增存儲需求從HDD轉向SSD,特別是數據中心企業級存儲中,HDD與SSD的容量比正從1:5-1:6向1:1轉變,預計2026年將出現QLC SSD替代HDD的爆發式增長。
![]()
供給側,存儲IDM資本開支計劃謹慎,且產能釋放速度較慢。2023-2025年,大容量、小容量存儲廠商資本開支維持低增長或者負增長狀態,其中SK海力士資本開支增長較大,主要用于擴產前兩年開始持續緊缺的HBM、DRAM。存儲廠商的擴產意愿與供需缺口和盈利水平相關,目前各家DRAM和NAND的毛利率水平接近80%,存儲廠商擴產動作開始變得頻繁,但是存儲器的擴產周期從購買設備到產能釋放需要2年以上,因此新增的資本開支難以體現在2026年的供給上,預計產能釋放的高峰期在2027年下半年及以后。
![]()
![]()
![]()
我們預計2026-2027年HBM、DRAM、NAND甚至小容量存儲均會出現不同程度的供給緊缺,本輪存儲漲價周期將不同于以往,漲價時間和漲價幅度將遠超預期。供需缺口將催化價格大幅度上漲,根據Trendforce預測, DRAM 2026Q2的合約價在2026Q1上漲93-96%的基礎上繼續上漲58-63%,NAND 26Q2的合約價在2026Q1上漲85-90%的基礎上繼續上漲70-75%。
![]()
![]()
2026年,DRAM市場規模將增長至4570億美元,同比+121%,預計NAND市場規模將增長至1420億美元,同比+103%, NAND、DRAM的單GB價格均有大幅度提升。從 市場結構看,服務器在存儲市場的占比有望進一步提升,成為存儲器的第一大應用。
風險提示
1、未來中美貿易摩擦可能進一步加劇,存在美國政府將設置進出口限制條件或其他貿易壁壘風險;
2、AI上游基礎設施投入了大量資金做研發和建設,端側尚未有殺手級應用和剛性需求出現,存在AI應用不及預期風險;
3、宏觀環境的不利因素將可能使得全球經濟增速放緩,居民收入、購買力及消費意愿將受到影響,存在下游需求不及預期風險;
4、大宗商品價格仍未企穩,不排除繼續上漲的可能,存在原材料成本提高的風險;
5、全球政治局勢復雜,主要經濟體爭端激化,國際貿易環境不確定性增大,可能使得全球經濟增速放緩,從而影響市場需求結構,存在國際政治經濟形勢風險。
本文所提及的任何資訊和信息,僅為作者個人觀點表達或對于具體事件的陳述,不構成推薦及投資建議,不代表本社觀點。投資者應自行承擔據此進行投資所產生的風險及后果。
《新財富》雜志5月號
《2025新財富雜志上市公司
共舞“人工智能 +”》
(點擊下方圖片可直接購買,下單請備注郵箱)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.