文 | 半導體產業縱橫
一直以來,LPDDR(低功耗雙倍數據率同步動態隨機存儲器)主要被用于智能手機、輕薄本等低功耗消費電子設備中。但近年來,隨著全球AI推理需求的爆發式增長,LPDDR卻正快速向數據中心領域滲透,并逐漸成為端側、邊緣到云端全場景AI推理芯片的共同選擇。
無論是國際大廠,還是國內企業,紛紛采用LPDDR作為推理產品的內存方案,背后是成本、功耗、性能的多方面權衡。
LPDDR正成為AI推理的“通解”
當前,LPDDR從消費電子領域全面切入AI芯片市場,不僅成為推理GPU的主流內存選項,更延伸至AI專用CPU、桌面AI超級計算機等多個品類。
- 數據中心
高通AI200/AI250幾乎是目前最激進的LPDDR數據中心方案。作為高通首款數據中心級推理系統,Qualcomm AI200加速卡帶來專為機架級AI推理打造的解決方案,旨在為大語言模型(LLM)與多模態模型(LMM)推理及其他AI工作負載提供低總體擁有成本與優化性能。每張加速卡支持768GB LPDDR內存,實現更高內存容量與更低成本,為AI推理提供卓越的擴展性與靈活性。該解決方案預計將于2026年正式面向市場發售。將于2027年推出的AI250加速器,在繼承AI200核心架構優勢的基礎上實現了關鍵技術升級。
英特爾則推出了首款基于Xe3P架構的數據中心GPU,代號為“Crescent Island”(新月島)。據了解,該產品專為AI推理和Agent工作負載優化,采用了480GB LPDDR5內存,TDP 僅 350W。由于舍棄HBM,它可以在現有風冷數據中心直接部署,無需液冷改造。
國內曦望科技的啟望S3則是國產芯片的代表。作為國內首款LPDDR6顯存的GPGPU,曦望宣稱其推理性價比提升10倍以上,單位token成本降90%。
- 端側AI
端側AI是LPDDR最成熟的領域。
DEEPX是一家專注于邊緣計算與端側AI的韓國半導體企業。就在最近DeepX首席執行官表示,該企業的產品將導入LPDDR-PIM存內計算解決方案。PIM將專用的數據處理器直接集成在DRAM中,可將部分數據計算工作從主機處理器卸載到存儲器當中。這可以減少數據的移動,提高AI加速器系統的能效和數據處理效率。三星電子是LPDDR5X-PIM的唯一供應商,因此DeepX將把其80TOPS算力2nm端側AI芯片DX-M2與三星電子的LPDDR5X-PIM解決方案相匹配。后續的DX-M3也將搭配JEDEC標準化的LPDDR6-PIM。
作為上游供應商,江波龍更是推出兩款專為端側AI推理打造的LPDDR內存方案,即AIDIMM(插槽式)和AILPBGA(焊接式)。AIDIMM采用4顆LPDDR5x同面布局設計,具有最高128GB容量、256bit位寬和307.2GB/s單通道超高帶寬。AILPBGA采用自研技術標準與創新架構,單顆原生256bit位寬設計,帶寬可達307GB/s,容量覆蓋24GB~64GB,全面適配 LPDDR 標準接口;同時采用22×22mm的BGA1764緊湊封裝設計。
- 桌面與AI PC
除了專用的AI推理芯片,LPDDR還正通過"統一內存架構"重新定義AI PC的性能邊界。
AMD Strix Halo(Ryzen AI MAX系列)采用256-bit LPDDR5X接口,支持最高128GB LPDDR5X-8000內存,帶寬達256GB/s。更激進的蘋果M4 Max則采用512-bit LPDDR5X內存總線(32×16-bit控制器),通過Memory-on-Package (MoP)封裝實現546GB/s帶寬,成為本地運行大語言模型的性能標桿。英偉達也不甘落后,其最近發布的RTX Spark 超級芯片,面向輕薄筆記本和小型臺式機,集成Blackwell架構RTX GPU和20核Grace CPU,最高128GB LPDDR5X統一內存,AI算力達1 PFLOP,實現了在低功耗、小體積設備上的高性能AI計算。
此外,英偉達還發布了“全球最強大的桌面AI超級計算機”DGX Station for Windows。DGX Station由GB300 Grace Blackwell Ultra 桌面超級芯片提供支持,通過NVIDIA NVLink-C2C互連將Blackwell Ultra GPU連接到72核Grace CPU。其配備高達748GB的相干內存和高達20 petaflops的FP4性能。而這748GB相干內存包括496 GB LPDDR5X(396 GB/s)的CPU內存和252 GB的HBM3e GPU顯存,通過NVLink-C2C互連技術實現CPU與GPU之間的高帶寬相干數據交換。
為什么是LPDDR?
LPDDR的全稱是Low Power Double Data Rate SDRAM(低功耗雙倍數據率同步動態隨機存取存儲器)。顧名思義,它的一切設計都圍繞著“省電”展開。它通常以芯片的形式,直接焊接在手機或超薄本的主板上,與處理器緊挨著,幾乎不可更換。那么,為什么如今這些廠商不約而同的向LPDDR內存倒戈?
![]()
首先,LPDDR的成本更低,供應更充足。HBM是由多個DRAM芯片垂直堆疊而成的3D結構,每一層都要通過TSV硅通孔和微凸點互連。隨著堆疊層數增多,良率呈指數級下降。因3D堆疊工藝復雜、良率有限,HBM長期處于供應緊張狀態。相比HBM,LPDDR依托成熟的平面DRAM工藝和大規模消費電子產能,單位容量成本遠低于HBM,能夠顯著降低AI推理服務器的硬件投入與總擁有成本,尤其適合大規模部署的推理場景。
其次,LPDDR的容量更大,單張卡可以加載更大的模型,上下文也可以更長。高通 AI200 的 768GB LPDDR 是行業最大容量。作為對比,NVIDIA GB300 單 GPU 僅 288GB HBM3e,AMD MI450X 為 432GB HBM4。由于HBM主要通過硅中介層與處理器進行2.5D封裝,必須緊鄰核心排布,這不僅限制了單系統的總容量上限,其PHY的固定寬度與接口位置還限制了布局。反觀LPDDR5X,控制器IP生態成熟、獲取門檻低,PCB/基板布線及信號訓練(Training)流程高度標準化。系統擴展也極為靈活,需要帶寬可通過多通道并行實現,需要容量也可以堆,不過是多增加一些引腳數量。
此外,LPDDR的功耗更低。以英特爾的Crescent Island為例,由于采用LPDDR而非HBM的選擇,功耗降至350W,意味著它可以在現有風冷數據中心中直接運行,不需要液冷改造。這也省去了數據中心的液冷改造投入,降低投資成本和建設周期。
最后,推理對于存儲的大帶寬的要求要低于訓練。在訓練場景中,處理大量數據的反向傳播需要極高的內存帶寬,使得HBM不可替代。但在推理場景中,模型參數是固定的,重點在于大容量存儲和高效檢索;LPDDR的容量和成本優勢遠遠超過了帶寬方面的缺點。今年的GTC大會上,黃仁勛表示,AI推理市場拐點已經到來,AI從訓練階段全面進入推理與執行階段,推理算力需求呈指數級爆發。相較于傳統訓練芯片,推理芯片更強調功耗控制、成本效率以及部署靈活性,LPDDR顯然更具優勢。
芯片巨頭同時轉向LPDDR并非巧合,而是整個行業的調整。一些組織指出,到2030年,推理工作負載的數量將是訓練工作負載的100倍。數據中心AI芯片采用LPDDR是一個明確的推理導向設計選擇。在HBM供應緊張、價格高昂的背景下,高通、Intel等廠商通過LPDDR實現了"單卡大容量、低TCO、風冷部署"的差異化路線,尤其適用于LLM推理、視頻分析、推薦系統等帶寬需求相對可控、容量需求極高的場景。當然,LPDDR解決方案也并非沒有成本。與HBM相比,它存在較低的內存帶寬、因接口更窄導致的延遲較高,以及在24小時高溫服務器環境中尚未被證明的可靠性。
LPDDR需求暴漲
廠商集體轉向的直接后果,是LPDDR需求的幾何級增長。
以高通的AI200為例,單個機架可能包含數十張加速卡,每張擁有768GB內存,總內存容量達數十TB。這相當于數十萬甚至數百萬智能手機的內存使用量。而這只是一家公司出品的一款產品。當高通、英特爾、英偉達以及其他潛在競爭者(如AMD和博通)在2026-2027年大規模生產LPDDR解決方案時,LPDDR的需求將呈指數增長。
還有分析師指出,英偉達Vera Rubin AI服務器所需的LPDDR使用量將從2026年的31.44億GB攀升至2027年的60.41億GB,占2027年全球LPDDR總供應能力的36%。這一數字將首次超越蘋果29.66億GB與三星27.24億GB的用量總和。
Vera Rubin是英偉達在GTC 2026上宣布全面投產的最新AI平臺,由Vera CPU和Rubin GPU構成。其中,Vera CPU搭載88個定制ARMv9.2“Olympus”核心,系統支持高達1.5TB(約1536GB)的LPDDR5X內存,采用新一代SOCAMM2封裝形態。相比之下,一部旗艦智能手機通常只配備12-16GB LPDDR5X內存——這意味著單顆Vera CPU的LPDDR配備量約為一部手機的90倍。
AMD同樣在推升LPDDR需求。其將于2027年推出的第六代EPYC服務器處理器“Verano”將首次支持SOCAMM2形態的LPDDR5X內存。
LPDDR的供應邏輯與HBM完全不同。HBM由SK海力士、三星、美光三巨頭壟斷,產能高度受限;而LPDDR擁有更龐大的消費電子產能基底和更成熟的供應鏈。當AI巨頭集體轉向,LPDDR的產能將成為AI基礎設施擴張的關鍵變量。
LPDDR6:從“夠用”到“好用”
JEDEC固態技術協會于2026年4月正式預覽LPDDR6路線圖。
此次路線圖,其中最令人矚目的是:LPDDR6單顆內存芯片的容量有望達到512GB。這一容量規格直接大幅超越當前主流服務器DDR5。目前主流服務器DDR5單根容量普遍停留在64GB—128GB,單顆Die容量差距更為懸殊。之所以能實現如此夸張的容量突破,主要是因為JEDEC新增了更窄的x6子通道模式,讓單個封裝能容納更多內存die。再配合更先進的制程工藝帶來單顆die的密度提升,最終使單顆芯片就能承載以往整根內存條才能達到的容量。
LPDDR6的性能規格較上一代產品實現顯著躍升。這一代產品的帶寬可達10.6Gbps至14.4Gbps,而上一代LPDDR5X的帶寬范圍為8.5Gbps至最高10.7Gbps,性能提升約1.5倍。SK海力士已成功開發出采用1cnm工藝的16Gb LPDDR6 DRAM,并完成了全球首個相關認證。這款全新的16Gb LPDDR6 DRAM在性能上實現了顯著提升。其運行速度達到10.7Gbps,數據處理速度較上一代LPDDR5X產品提高了33%。
同時,基于LPDDR6的SOCAMM2緊湊型模塊標準已在同步開發中,用以替代傳統又厚又大的DDR5條,為AI服務器提供更高集成度的低功耗內存底座。對普通游戲和創作玩家而言,LPDDR6的進階不在一蹴而就,但未來三年內,高端游戲本、平板或AIPC都有望獲得超大內存。更關鍵的是,在保持輕薄續航的前提下,端側運行數百億參數的大模型甚至大型仿真渲染將成為常態。
采用LPDDR,是一個明確的推理導向設計選擇。它標志著AI算力競爭從"訓練時代的HBM帶寬競賽"轉向"推理時代的容量與TCO競賽"。隨著LPDDR6的512GB單顆容量、14.4Gbps速率、SOCAMM2模塊化封裝和PIM存內計算的成熟,AI服務器將輕松構建TB級內存池。模型權重與KV Cache不再需要在內存與SSD之間"痛苦搬家",端側運行數百億參數大模型、車載實時多模態推理、桌面AI Agent常駐后臺——都將成為常態。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.