高帶寬閃存：面向AI數(shù)據(jù)中心與邊緣計算的全新存儲技術(shù)

2026-05-25 13:14:17　來源: 微型計算機

重慶舉報

分享至

人工智能（AI）正勢不可擋地席卷整個計算領(lǐng)域。盡管目前全球僅約七分之一的數(shù)據(jù)中心具備承載AI工作負載的能力，但到2030年，這一比例預計將接近70%1。AI正從超大規(guī)模數(shù)據(jù)中心遷移至企業(yè)級數(shù)據(jù)中心，并進一步部署至網(wǎng)絡(luò)邊緣——邊緣AI應(yīng)用預計在2030年底將創(chuàng)造近665億美元的價值2。數(shù)據(jù)是這一全新計算時代的驅(qū)動力。海量數(shù)據(jù)必須高速傳輸至需求迫切且快速擴展的AI計算基礎(chǔ)設(shè)施中。

然而，海量內(nèi)容庫正在讓傳統(tǒng)存儲架構(gòu)不堪重負，其固有的架構(gòu)劣勢也徹底顯現(xiàn)。數(shù)據(jù)中心內(nèi)存（DRAM 及專用高帶寬內(nèi)存HBM）在密度、存儲容量與可擴展性方面，逐漸難以應(yīng)對大型AI模型日益增長的需求。與此同時，超大規(guī)模計算廠商正面對DRAM與HBM攀升的生產(chǎn)成本、提升的設(shè)計復雜度及增加的能耗。在企業(yè)級數(shù)據(jù)中心與邊緣AI應(yīng)用場景中，這一挑戰(zhàn)更為嚴峻 —— 受限于更小的物理空間，此類場景難以承受持續(xù)上漲的內(nèi)存成本與功耗。

同時，AI推理也帶來了一些亟待解決的問題。作為當下主流的AI工作負載，AI推理在數(shù)據(jù)管理方面的要求與AI訓練截然不同：推理需要存儲規(guī)模持續(xù)擴大的AI模型，而基于HBM與DRAM的內(nèi)存方案已難以滿足這些新需求，其在容量與成本可擴展性上存在明顯短板。面對這些顯著差異的內(nèi)存特性，市場亟需一種專為AI推理優(yōu)化的內(nèi)存技術(shù)。

為何DRAM與HBM無法滿足AI推理工作負載需求？

要理解為何僅DRAM與HBM并不適合AI的長期部署，可參考以下弊端3。這些問題起初只是細微隱患，但若不加以解決，將隨時間推移不斷擴大，最終動搖以AI為核心的下一代存儲架構(gòu)根基。

密度瓶頸：DRAM容量擴展已陷入停滯，而支撐AI推理所需的容量需求卻持續(xù)攀升。3

與AI推理不匹配：DRAM在低時延、隨機訪問方面的優(yōu)勢，對AI推理而言并不適用。AI推理的訪問模式具備確定性，借助數(shù)據(jù)預取等技術(shù)對時延有更高的包容度。3

面向AI推理優(yōu)化的內(nèi)存架構(gòu)特性

規(guī)模達1,200億美元的DRAM產(chǎn)業(yè)?正面臨上述深層矛盾。鑒于超大規(guī)模服務(wù)商在AI基礎(chǔ)設(shè)施領(lǐng)域的支出有望在2030年底達到6.7萬億美元?，該產(chǎn)業(yè)迫切希望穩(wěn)固自身在數(shù)據(jù)中心領(lǐng)域的既有地位。

如果現(xiàn)在正是徹底重新打造一款貼合應(yīng)用需求的全新存儲解決方案的時機，而非讓應(yīng)用去適配現(xiàn)有存儲，結(jié)果會如何？一款為AI優(yōu)化的存儲級內(nèi)存應(yīng)具備以下特性：

更大規(guī)模且可擴展的內(nèi)存容量，專為推理工作負載配置
更高的內(nèi)存密度（GB/mm2）
高帶寬，滿足AI推理需求
更低的系統(tǒng)級功耗
高性價比指標（美元/ TB）

高帶寬閃存意指AI數(shù)據(jù)中心

高帶寬閃存（HBF?）是一款顛覆性的新型內(nèi)存架構(gòu)，專為支持推動新一代AI計算而設(shè)計。HBF滿足了高級計算及數(shù)據(jù)密集型應(yīng)用對容量、能耗、吞吐量及可擴展性的核心要求。相較于HBM，HBF在保持同等帶寬的前提下，提供了更高的容量與存儲密度，更貼合AI推理的發(fā)展趨勢。作為一種持久性存儲介質(zhì)，HBF在斷電時仍能保留數(shù)據(jù)，且具備熱穩(wěn)定性，可支持高溫運行環(huán)境?。

為實現(xiàn)這些優(yōu)勢，HBF通過優(yōu)化高帶寬特性與推理內(nèi)存屬性，對NAND閃存進行了高效重構(gòu)。采用外圍電路直接鍵合到存儲陣列（CBA）晶圓技術(shù)，進一步提升了能效與帶寬。

HBF重塑面向AI應(yīng)用的NAND閃存

相較于傳統(tǒng)NAND閃存，HBF通過并行架構(gòu)、先進邏輯縮放工藝與定制化堆疊技術(shù)，實現(xiàn)更低時延與超高的讀取帶寬，讓大語言模型以接近DRAM的速度流式讀取數(shù)據(jù)?。

HBF還支持大型KV緩存，可高效處理冗長復雜的用戶提示詞，以及客戶專屬與領(lǐng)域?qū)贁?shù)據(jù)，助力提升AI推理準確率。

以內(nèi)存為中心的AI延伸至企業(yè)級場景與網(wǎng)絡(luò)邊緣

由于受密度、成本與功耗限制，HBM通常無法用于邊緣與移動環(huán)境，而HBF可憑借更大存儲容量，實現(xiàn)處理更復雜AI推理任務(wù)的價值。這為智能手機等邊緣設(shè)備打開了應(yīng)用空間，幫助其能夠?qū)崟r決策并執(zhí)行各類復雜任務(wù)。憑借持久性存儲的特性，HBF支持從歷史查詢中無縫調(diào)取過往上下文，以解決新問題。

HBF的優(yōu)勢可同樣延伸至企業(yè)級計算場景。這類場景的用戶規(guī)模遠小于超大規(guī)模數(shù)據(jù)中心，而依托HBM的大型GPU集群成本過高。通過采用搭載HBF的加速方案，小型企業(yè)有望對大型預訓練模型進行調(diào)優(yōu)，以支持領(lǐng)域?qū)賾?yīng)用需求。

優(yōu)化的存儲解決方案突破AI計算增長的阻礙

在我們身邊，數(shù)據(jù)中心與邊緣AI設(shè)備正自主運行，支撐從“晚餐食譜”查詢到“突破性科學發(fā)現(xiàn)”的各類任務(wù)。網(wǎng)站托管、企業(yè)數(shù)據(jù)管理等常規(guī)任務(wù)，正逐步讓位于依托機器學習、深度學習與數(shù)據(jù)分析來生成實用洞察的智能工作負載。

如今的數(shù)據(jù)中心與邊緣存儲亟需重新規(guī)劃，以支撐大規(guī)模推理模型執(zhí)行預測與生成任務(wù)。相較于HBM，HBF在具備顯著容量優(yōu)勢的同時，可提供AI推理應(yīng)用所需的高吞吐量?。作為可擴展的全新系統(tǒng)級存儲技術(shù)，HBF有助于減少性能瓶頸，加快現(xiàn)代數(shù)據(jù)中心與邊緣網(wǎng)絡(luò)中AI應(yīng)用的洞察生成速度。

參考文獻

1 B. Srivathsan 、M. Sorel 、 P. Sachdeva，聯(lián)合 A. Bhan 、 H. Batra 、 R. Sharma 、 R. Gupta 以及 S. Choudhary，麥肯錫咨詢公司，《AI 算力：擴容數(shù)據(jù)中心以滿足日益增長的需求》（2024 年 10 月）

2 Grand View Research，《邊緣 AI 市場規(guī)模、份額及趨勢分析報告 —— 按組件（硬件、軟件、服務(wù)）、終端行業(yè)（消費電子、智慧城市、汽車）、地區(qū)及細分領(lǐng)域預測，2025—2030》

3 S. Legtchenko 、I. Stefanovici 、R. Black 、A. Rowstron 、J. Liu 、P. Costa 、B. Canakci 、D. Narayanan 、X. Wu，微軟研究院，《受控保留內(nèi)存：面向 AI 時代的全新內(nèi)存品類》，康奈爾大學（2025 年 1 月）

4FortuneBusinessInsights，《DRAM 市場規(guī)模、份額及行業(yè)分析……》（2026 年 2 月）

5 J. Noffsinger、M. Patel、P. Sachdeva、聯(lián)合A. Bhan、H. Chang以及M. Goodpaster，麥肯錫咨詢公司，《計算成本：一場7 萬億美元規(guī)模的數(shù)據(jù)中心擴張競賽》（2025 年 4 月）

6 HBF 技術(shù)資料頁，閃迪，《閃迪發(fā)布面向 AI 的未來存儲架構(gòu)：高帶寬閃存（HBF）》（2025 年 7 月）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.