人工智能(AI)正勢不可擋地席卷整個計算領(lǐng)域。盡管目前全球僅約七分之一的數(shù)據(jù)中心具備承載AI工作負載的能力,但到2030年,這一比例預計將接近70%1。AI正從超大規(guī)模數(shù)據(jù)中心遷移至企業(yè)級數(shù)據(jù)中心,并進一步部署至網(wǎng)絡(luò)邊緣——邊緣AI應(yīng)用預計在2030年底將創(chuàng)造近665億美元的價值2。數(shù)據(jù)是這一全新計算時代的驅(qū)動力。海量數(shù)據(jù)必須高速傳輸至需求迫切且快速擴展的AI計算基礎(chǔ)設(shè)施中。
然而,海量內(nèi)容庫正在讓傳統(tǒng)存儲架構(gòu)不堪重負,其固有的架構(gòu)劣勢也徹底顯現(xiàn)。數(shù)據(jù)中心內(nèi)存(DRAM 及專用高帶寬內(nèi)存HBM)在密度、存儲容量與可擴展性方面,逐漸難以應(yīng)對大型AI模型日益增長的需求。與此同時,超大規(guī)模計算廠商正面對DRAM與HBM攀升的生產(chǎn)成本、提升的設(shè)計復雜度及增加的能耗。在企業(yè)級數(shù)據(jù)中心與邊緣AI應(yīng)用場景中,這一挑戰(zhàn)更為嚴峻 —— 受限于更小的物理空間,此類場景難以承受持續(xù)上漲的內(nèi)存成本與功耗。
同時,AI推理也帶來了一些亟待解決的問題。作為當下主流的AI工作負載,AI推理在數(shù)據(jù)管理方面的要求與AI訓練截然不同:推理需要存儲規(guī)模持續(xù)擴大的AI模型,而基于HBM與DRAM的內(nèi)存方案已難以滿足這些新需求,其在容量與成本可擴展性上存在明顯短板。面對這些顯著差異的內(nèi)存特性,市場亟需一種專為AI推理優(yōu)化的內(nèi)存技術(shù)。
為何DRAM與HBM無法滿足AI推理工作負載需求?
要理解為何僅DRAM與HBM并不適合AI的長期部署,可參考以下弊端3。這些問題起初只是細微隱患,但若不加以解決,將隨時間推移不斷擴大,最終動搖以AI為核心的下一代存儲架構(gòu)根基。
密度瓶頸:DRAM容量擴展已陷入停滯,而支撐AI推理所需的容量需求卻持續(xù)攀升。3
與AI推理不匹配:DRAM在低時延、隨機訪問方面的優(yōu)勢,對AI推理而言并不適用。AI推理的訪問模式具備確定性,借助數(shù)據(jù)預取等技術(shù)對時延有更高的包容度。3
面向AI推理優(yōu)化的內(nèi)存架構(gòu)特性
規(guī)模達1,200億美元的DRAM產(chǎn)業(yè)?正面臨上述深層矛盾。鑒于超大規(guī)模服務(wù)商在AI基礎(chǔ)設(shè)施領(lǐng)域的支出有望在2030年底達到6.7萬億美元?,該產(chǎn)業(yè)迫切希望穩(wěn)固自身在數(shù)據(jù)中心領(lǐng)域的既有地位。
如果現(xiàn)在正是徹底重新打造一款貼合應(yīng)用需求的全新存儲解決方案的時機,而非讓應(yīng)用去適配現(xiàn)有存儲,結(jié)果會如何?一款為AI優(yōu)化的存儲級內(nèi)存應(yīng)具備以下特性:
- 更大規(guī)模且可擴展的內(nèi)存容量,專為推理工作負載配置
- 更高的內(nèi)存密度(GB/mm2)
- 高帶寬,滿足AI推理需求
- 更低的系統(tǒng)級功耗
- 高性價比指標(美元/ TB)
高帶寬閃存意指AI數(shù)據(jù)中心
高帶寬閃存(HBF?)是一款顛覆性的新型內(nèi)存架構(gòu),專為支持推動新一代AI計算而設(shè)計。HBF滿足了高級計算及數(shù)據(jù)密集型應(yīng)用對容量、能耗、吞吐量及可擴展性的核心要求。相較于HBM,HBF在保持同等帶寬的前提下,提供了更高的容量與存儲密度,更貼合AI推理的發(fā)展趨勢。作為一種持久性存儲介質(zhì),HBF在斷電時仍能保留數(shù)據(jù),且具備熱穩(wěn)定性,可支持高溫運行環(huán)境?。
![]()
為實現(xiàn)這些優(yōu)勢,HBF通過優(yōu)化高帶寬特性與推理內(nèi)存屬性,對NAND閃存進行了高效重構(gòu)。采用外圍電路直接鍵合到存儲陣列(CBA)晶圓技術(shù),進一步提升了能效與帶寬。
HBF重塑面向AI應(yīng)用的NAND閃存
相較于傳統(tǒng)NAND閃存,HBF通過并行架構(gòu)、先進邏輯縮放工藝與定制化堆疊技術(shù),實現(xiàn)更低時延與超高的讀取帶寬,讓大語言模型以接近DRAM的速度流式讀取數(shù)據(jù)?。
HBF還支持大型KV緩存,可高效處理冗長復雜的用戶提示詞,以及客戶專屬與領(lǐng)域?qū)贁?shù)據(jù),助力提升AI推理準確率。
以內(nèi)存為中心的AI延伸至企業(yè)級場景與網(wǎng)絡(luò)邊緣
由于受密度、成本與功耗限制,HBM通常無法用于邊緣與移動環(huán)境,而HBF可憑借更大存儲容量,實現(xiàn)處理更復雜AI推理任務(wù)的價值。這為智能手機等邊緣設(shè)備打開了應(yīng)用空間,幫助其能夠?qū)崟r決策并執(zhí)行各類復雜任務(wù)。憑借持久性存儲的特性,HBF支持從歷史查詢中無縫調(diào)取過往上下文,以解決新問題。
HBF的優(yōu)勢可同樣延伸至企業(yè)級計算場景。這類場景的用戶規(guī)模遠小于超大規(guī)模數(shù)據(jù)中心,而依托HBM的大型GPU集群成本過高。通過采用搭載HBF的加速方案,小型企業(yè)有望對大型預訓練模型進行調(diào)優(yōu),以支持領(lǐng)域?qū)賾?yīng)用需求。
![]()
優(yōu)化的存儲解決方案突破AI計算增長的阻礙
在我們身邊,數(shù)據(jù)中心與邊緣AI設(shè)備正自主運行,支撐從“晚餐食譜”查詢到“突破性科學發(fā)現(xiàn)”的各類任務(wù)。網(wǎng)站托管、企業(yè)數(shù)據(jù)管理等常規(guī)任務(wù),正逐步讓位于依托機器學習、深度學習與數(shù)據(jù)分析來生成實用洞察的智能工作負載。
如今的數(shù)據(jù)中心與邊緣存儲亟需重新規(guī)劃,以支撐大規(guī)模推理模型執(zhí)行預測與生成任務(wù)。相較于HBM,HBF在具備顯著容量優(yōu)勢的同時,可提供AI推理應(yīng)用所需的高吞吐量?。作為可擴展的全新系統(tǒng)級存儲技術(shù),HBF有助于減少性能瓶頸,加快現(xiàn)代數(shù)據(jù)中心與邊緣網(wǎng)絡(luò)中AI應(yīng)用的洞察生成速度。
參考文獻
1 B. Srivathsan 、M. Sorel 、 P. Sachdeva,聯(lián)合 A. Bhan 、 H. Batra 、 R. Sharma 、 R. Gupta 以及 S. Choudhary,麥肯錫咨詢公司,《AI 算力:擴容數(shù)據(jù)中心以滿足日益增長的需求》(2024 年 10 月)
2 Grand View Research,《邊緣 AI 市場規(guī)模、份額及趨勢分析報告 —— 按組件(硬件、軟件、服務(wù))、終端行業(yè)(消費電子、智慧城市、汽車)、地區(qū)及細分領(lǐng)域預測,2025—2030》
3 S. Legtchenko 、I. Stefanovici 、R. Black 、A. Rowstron 、J. Liu 、P. Costa 、B. Canakci 、D. Narayanan 、X. Wu,微軟研究院,《受控保留內(nèi)存:面向 AI 時代的全新內(nèi)存品類》,康奈爾大學(2025 年 1 月)
4FortuneBusinessInsights,《DRAM 市場規(guī)模、份額及行業(yè)分析……》(2026 年 2 月)
5 J. Noffsinger、M. Patel、P. Sachdeva、聯(lián)合A. Bhan、H. Chang以及M. Goodpaster,麥肯錫咨詢公司,《計算成本:一場7 萬億美元規(guī)模的數(shù)據(jù)中心擴張競賽》(2025 年 4 月)
6 HBF 技術(shù)資料頁,閃迪,《閃迪發(fā)布面向 AI 的未來存儲架構(gòu):高帶寬閃存(HBF)》(2025 年 7 月)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.