網易首頁 > 網易號 > 正文申請入駐

LPDDR逆襲：AI推理芯片為何集體“換芯”？

2026-06-11 08:58:07　來源: 鈦媒體APP

北京舉報

分享至

文 | 半導體產業縱橫

一直以來，LPDDR（低功耗雙倍數據率同步動態隨機存儲器）主要被用于智能手機、輕薄本等低功耗消費電子設備中。但近年來，隨著全球AI推理需求的爆發式增長，LPDDR卻正快速向數據中心領域滲透，并逐漸成為端側、邊緣到云端全場景AI推理芯片的共同選擇。

無論是國際大廠，還是國內企業，紛紛采用LPDDR作為推理產品的內存方案，背后是成本、功耗、性能的多方面權衡。

LPDDR正成為AI推理的“通解”

當前，LPDDR從消費電子領域全面切入AI芯片市場，不僅成為推理GPU的主流內存選項，更延伸至AI專用CPU、桌面AI超級計算機等多個品類。

數據中心

高通AI200/AI250幾乎是目前最激進的LPDDR數據中心方案。作為高通首款數據中心級推理系統，Qualcomm AI200加速卡帶來專為機架級AI推理打造的解決方案，旨在為大語言模型（LLM）與多模態模型（LMM）推理及其他AI工作負載提供低總體擁有成本與優化性能。每張加速卡支持768GB LPDDR內存，實現更高內存容量與更低成本，為AI推理提供卓越的擴展性與靈活性。該解決方案預計將于2026年正式面向市場發售。將于2027年推出的AI250加速器，在繼承AI200核心架構優勢的基礎上實現了關鍵技術升級。

英特爾則推出了首款基于Xe3P架構的數據中心GPU，代號為“Crescent Island”（新月島）。據了解，該產品專為AI推理和Agent工作負載優化，采用了480GB LPDDR5內存，TDP 僅 350W。由于舍棄HBM，它可以在現有風冷數據中心直接部署，無需液冷改造。

國內曦望科技的啟望S3則是國產芯片的代表。作為國內首款LPDDR6顯存的GPGPU，曦望宣稱其推理性價比提升10倍以上，單位token成本降90%。

端側AI

端側AI是LPDDR最成熟的領域。

DEEPX是一家專注于邊緣計算與端側AI的韓國半導體企業。就在最近DeepX首席執行官表示，該企業的產品將導入LPDDR-PIM存內計算解決方案。PIM將專用的數據處理器直接集成在DRAM中，可將部分數據計算工作從主機處理器卸載到存儲器當中。這可以減少數據的移動，提高AI加速器系統的能效和數據處理效率。三星電子是LPDDR5X-PIM的唯一供應商，因此DeepX將把其80TOPS算力2nm端側AI芯片DX-M2與三星電子的LPDDR5X-PIM解決方案相匹配。后續的DX-M3也將搭配JEDEC標準化的LPDDR6-PIM。

作為上游供應商，江波龍更是推出兩款專為端側AI推理打造的LPDDR內存方案，即AIDIMM（插槽式）和AILPBGA（焊接式）。AIDIMM采用4顆LPDDR5x同面布局設計，具有最高128GB容量、256bit位寬和307.2GB/s單通道超高帶寬。AILPBGA采用自研技術標準與創新架構，單顆原生256bit位寬設計，帶寬可達307GB/s，容量覆蓋24GB~64GB，全面適配 LPDDR 標準接口；同時采用22×22mm的BGA1764緊湊封裝設計。

桌面與AI PC

除了專用的AI推理芯片，LPDDR還正通過"統一內存架構"重新定義AI PC的性能邊界。

AMD Strix Halo（Ryzen AI MAX系列）采用256-bit LPDDR5X接口，支持最高128GB LPDDR5X-8000內存，帶寬達256GB/s。更激進的蘋果M4 Max則采用512-bit LPDDR5X內存總線（32×16-bit控制器），通過Memory-on-Package (MoP)封裝實現546GB/s帶寬，成為本地運行大語言模型的性能標桿。英偉達也不甘落后，其最近發布的RTX Spark 超級芯片，面向輕薄筆記本和小型臺式機，集成Blackwell架構RTX GPU和20核Grace CPU，最高128GB LPDDR5X統一內存，AI算力達1 PFLOP，實現了在低功耗、小體積設備上的高性能AI計算。

此外，英偉達還發布了“全球最強大的桌面AI超級計算機”DGX Station for Windows。DGX Station由GB300 Grace Blackwell Ultra 桌面超級芯片提供支持，通過NVIDIA NVLink-C2C互連將Blackwell Ultra GPU連接到72核Grace CPU。其配備高達748GB的相干內存和高達20 petaflops的FP4性能。而這748GB相干內存包括496 GB LPDDR5X（396 GB/s）的CPU內存和252 GB的HBM3e GPU顯存，通過NVLink-C2C互連技術實現CPU與GPU之間的高帶寬相干數據交換。

為什么是LPDDR？

LPDDR的全稱是Low Power Double Data Rate SDRAM（低功耗雙倍數據率同步動態隨機存取存儲器）。顧名思義，它的一切設計都圍繞著“省電”展開。它通常以芯片的形式，直接焊接在手機或超薄本的主板上，與處理器緊挨著，幾乎不可更換。那么，為什么如今這些廠商不約而同的向LPDDR內存倒戈？

首先，LPDDR的成本更低，供應更充足。HBM是由多個DRAM芯片垂直堆疊而成的3D結構，每一層都要通過TSV硅通孔和微凸點互連。隨著堆疊層數增多，良率呈指數級下降。因3D堆疊工藝復雜、良率有限，HBM長期處于供應緊張狀態。相比HBM，LPDDR依托成熟的平面DRAM工藝和大規模消費電子產能，單位容量成本遠低于HBM，能夠顯著降低AI推理服務器的硬件投入與總擁有成本，尤其適合大規模部署的推理場景。

其次，LPDDR的容量更大，單張卡可以加載更大的模型，上下文也可以更長。高通 AI200 的 768GB LPDDR 是行業最大容量。作為對比，NVIDIA GB300 單 GPU 僅 288GB HBM3e，AMD MI450X 為 432GB HBM4。由于HBM主要通過硅中介層與處理器進行2.5D封裝，必須緊鄰核心排布，這不僅限制了單系統的總容量上限，其PHY的固定寬度與接口位置還限制了布局。反觀LPDDR5X，控制器IP生態成熟、獲取門檻低，PCB/基板布線及信號訓練（Training）流程高度標準化。系統擴展也極為靈活，需要帶寬可通過多通道并行實現，需要容量也可以堆，不過是多增加一些引腳數量。

此外，LPDDR的功耗更低。以英特爾的Crescent Island為例，由于采用LPDDR而非HBM的選擇，功耗降至350W，意味著它可以在現有風冷數據中心中直接運行，不需要液冷改造。這也省去了數據中心的液冷改造投入，降低投資成本和建設周期。

最后，推理對于存儲的大帶寬的要求要低于訓練。在訓練場景中，處理大量數據的反向傳播需要極高的內存帶寬，使得HBM不可替代。但在推理場景中，模型參數是固定的，重點在于大容量存儲和高效檢索；LPDDR的容量和成本優勢遠遠超過了帶寬方面的缺點。今年的GTC大會上，黃仁勛表示，AI推理市場拐點已經到來，AI從訓練階段全面進入推理與執行階段，推理算力需求呈指數級爆發。相較于傳統訓練芯片，推理芯片更強調功耗控制、成本效率以及部署靈活性，LPDDR顯然更具優勢。

芯片巨頭同時轉向LPDDR并非巧合，而是整個行業的調整。一些組織指出，到2030年，推理工作負載的數量將是訓練工作負載的100倍。數據中心AI芯片采用LPDDR是一個明確的推理導向設計選擇。在HBM供應緊張、價格高昂的背景下，高通、Intel等廠商通過LPDDR實現了"單卡大容量、低TCO、風冷部署"的差異化路線，尤其適用于LLM推理、視頻分析、推薦系統等帶寬需求相對可控、容量需求極高的場景。當然，LPDDR解決方案也并非沒有成本。與HBM相比，它存在較低的內存帶寬、因接口更窄導致的延遲較高，以及在24小時高溫服務器環境中尚未被證明的可靠性。

LPDDR需求暴漲

廠商集體轉向的直接后果，是LPDDR需求的幾何級增長。

以高通的AI200為例，單個機架可能包含數十張加速卡，每張擁有768GB內存，總內存容量達數十TB。這相當于數十萬甚至數百萬智能手機的內存使用量。而這只是一家公司出品的一款產品。當高通、英特爾、英偉達以及其他潛在競爭者（如AMD和博通）在2026-2027年大規模生產LPDDR解決方案時，LPDDR的需求將呈指數增長。

還有分析師指出，英偉達Vera Rubin AI服務器所需的LPDDR使用量將從2026年的31.44億GB攀升至2027年的60.41億GB，占2027年全球LPDDR總供應能力的36%。這一數字將首次超越蘋果29.66億GB與三星27.24億GB的用量總和。

Vera Rubin是英偉達在GTC 2026上宣布全面投產的最新AI平臺，由Vera CPU和Rubin GPU構成。其中，Vera CPU搭載88個定制ARMv9.2“Olympus”核心，系統支持高達1.5TB（約1536GB）的LPDDR5X內存，采用新一代SOCAMM2封裝形態。相比之下，一部旗艦智能手機通常只配備12-16GB LPDDR5X內存——這意味著單顆Vera CPU的LPDDR配備量約為一部手機的90倍。

AMD同樣在推升LPDDR需求。其將于2027年推出的第六代EPYC服務器處理器“Verano”將首次支持SOCAMM2形態的LPDDR5X內存。

LPDDR的供應邏輯與HBM完全不同。HBM由SK海力士、三星、美光三巨頭壟斷，產能高度受限；而LPDDR擁有更龐大的消費電子產能基底和更成熟的供應鏈。當AI巨頭集體轉向，LPDDR的產能將成為AI基礎設施擴張的關鍵變量。

LPDDR6：從“夠用”到“好用”

JEDEC固態技術協會于2026年4月正式預覽LPDDR6路線圖。

此次路線圖，其中最令人矚目的是：LPDDR6單顆內存芯片的容量有望達到512GB。這一容量規格直接大幅超越當前主流服務器DDR5。目前主流服務器DDR5單根容量普遍停留在64GB—128GB，單顆Die容量差距更為懸殊。之所以能實現如此夸張的容量突破，主要是因為JEDEC新增了更窄的x6子通道模式，讓單個封裝能容納更多內存die。再配合更先進的制程工藝帶來單顆die的密度提升，最終使單顆芯片就能承載以往整根內存條才能達到的容量。

LPDDR6的性能規格較上一代產品實現顯著躍升。這一代產品的帶寬可達10.6Gbps至14.4Gbps，而上一代LPDDR5X的帶寬范圍為8.5Gbps至最高10.7Gbps，性能提升約1.5倍。SK海力士已成功開發出采用1cnm工藝的16Gb LPDDR6 DRAM，并完成了全球首個相關認證。這款全新的16Gb LPDDR6 DRAM在性能上實現了顯著提升。其運行速度達到10.7Gbps，數據處理速度較上一代LPDDR5X產品提高了33%。

同時，基于LPDDR6的SOCAMM2緊湊型模塊標準已在同步開發中，用以替代傳統又厚又大的DDR5條，為AI服務器提供更高集成度的低功耗內存底座。對普通游戲和創作玩家而言，LPDDR6的進階不在一蹴而就，但未來三年內，高端游戲本、平板或AIPC都有望獲得超大內存。更關鍵的是，在保持輕薄續航的前提下，端側運行數百億參數的大模型甚至大型仿真渲染將成為常態。

采用LPDDR，是一個明確的推理導向設計選擇。它標志著AI算力競爭從"訓練時代的HBM帶寬競賽"轉向"推理時代的容量與TCO競賽"。隨著LPDDR6的512GB單顆容量、14.4Gbps速率、SOCAMM2模塊化封裝和PIM存內計算的成熟，AI服務器將輕松構建TB級內存池。模型權重與KV Cache不再需要在內存與SSD之間"痛苦搬家"，端側運行數百億參數大模型、車載實時多模態推理、桌面AI Agent常駐后臺——都將成為常態。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.