无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

存儲革命來了:AI的瓶頸,不只是光

0
分享至


↑點擊上面圖片 加雪球核心交流群↑

風(fēng)險提示:本文所提到的觀點僅代表個人的意見,所涉及標(biāo)的不作推薦,據(jù)此買賣,風(fēng)險自負(fù)。

作者:不忘初心2005

來源:雪球

上周黃仁勛在臺北的GTC大會演講,我反復(fù)聽了幾遍。我的結(jié)論是:到了 2026 年,AI 產(chǎn)業(yè)正在進入一個更深層的階段:

AI 的核心瓶頸,正在從有沒有足夠算力,升級為有沒有足夠高效的記憶系統(tǒng)。

換句話說,下一階段的 AI 革命,不只是算力革命,更是存儲革命。

這里的存儲革命,不是簡單說 DRAM、NAND 又進入一輪漲價周期,也不是傳統(tǒng)意義上的存儲周期反轉(zhuǎn)。

真正的變化是:

存儲不再只是 GPU 的配套件,不再只是數(shù)據(jù)中心后臺的硬盤,而是 AI 系統(tǒng)能否擴展上下文、降低 token 成本、支撐智能體、進入物理世界的核心基礎(chǔ)設(shè)施。

一、2023 年以后,英偉達最早意識到:推理才是更大的長期市場

ChatGPT 爆發(fā)后,市場最先看到的是訓(xùn)練大模型。

訓(xùn)練需要 GPU,需要 HBM,需要大規(guī)模集群,所以 2023—2024 年的 AI 投資主線非常清晰:誰能提供算力,誰就是王者。

但黃仁勛真正厲害的地方,是他很早就把 AI 從訓(xùn)練一次模型看成了持續(xù)運行的 AI 工廠。

訓(xùn)練是一次性的,推理才是每天發(fā)生的。

一個模型訓(xùn)練完成之后,要面對的是全球用戶、企業(yè)、代碼、文件、視頻、機器人、汽車、AI PC 的無數(shù)次調(diào)用。

尤其是智能體時代,AI 不再是你問一句,它答一句,而是要連續(xù)規(guī)劃、調(diào)用工具、讀取文件、修改代碼、檢索資料、執(zhí)行任務(wù)、再反饋、再推理。

這時候,AI 系統(tǒng)最貴的不只是算力,而是每一次推理背后的上下文管理。

因為 AI 要記?。?/p>

你剛剛說過什么;

你過去做過什么;

你的文件在哪里;

企業(yè)知識庫里有什么;

機器人剛才看到了什么;

自動駕駛剛剛經(jīng)過了什么路況;

AI agent 前十步執(zhí)行了哪些任務(wù),下一步應(yīng)該怎么做。

這就是 AI 從 chatbot 走向 agentic AI 之后,存儲地位發(fā)生根本變化的原因。

二、2024 年 Blackwell 證明:AI 不是單卡競爭,而是系統(tǒng)競爭

Blackwell 發(fā)布之后,一個非常重要的信號是:

英偉達已經(jīng)不再把 GPU 當(dāng)成單顆芯片賣,而是在賣一整臺 AI 計算機。

GB200 NVL72,本質(zhì)上就是把 72 個 GPU 通過 NVLink 組織成一個巨大的統(tǒng)一計算域。

這說明什么?

說明 AI 的瓶頸已經(jīng)不是單顆 GPU 的峰值 FLOPS,而是:

多個 GPU 之間如何通信;

HBM 如何供給數(shù)據(jù);

CPU 內(nèi)存如何配合;

網(wǎng)絡(luò)如何降低延遲;

SSD 如何支撐數(shù)據(jù)和上下文;

整個系統(tǒng)如何像一臺大計算機一樣工作。

所以,AI 數(shù)據(jù)中心的核心架構(gòu)正在從過去的“服務(wù)器堆疊”,變成黃仁勛反復(fù)講的:

數(shù)據(jù)中心就是一臺計算機。

如果數(shù)據(jù)中心是一臺計算機,那么 GPU 是它的大腦,網(wǎng)絡(luò)是神經(jīng)系統(tǒng),電力和液冷是血液循環(huán),而存儲就是它的記憶系統(tǒng)。

沒有記憶,智能無法持續(xù)。

沒有高效記憶,token 成本無法下降。

沒有長期記憶,智能體無法真正工作。

三、2025 年以后,長上下文和智能體讓 KV cache 成為新的存儲需求中心

很多人低估了 KV cache。

在傳統(tǒng)投資敘事里,大家更熟悉 HBM,因為 HBM 直接綁定 GPU,價格高,供給緊,確定性強。

但到了長上下文和智能體時代,KV cache 變成了一個繞不開的問題。

模型每多看一段上下文,每多進行一輪對話,每多執(zhí)行一步 agent task,都需要保留中間狀態(tài)。

上下文越長,并發(fā)用戶越多,模型越大,KV cache 膨脹得越快。

過去我們以為推理主要消耗 GPU 算力。

現(xiàn)在看,推理同時消耗三樣?xùn)|西:

算力、內(nèi)存、上下文存儲。

這也是為什么 AI 推理系統(tǒng)正在形成新的存儲分層:

最熱的數(shù)據(jù)放在 HBM;

較溫的數(shù)據(jù)放在 DDR5 / LPDDR / CPU 內(nèi)存;

更大規(guī)模的上下文、RAG、向量庫、歷史記憶、冷溫 KV cache,要放到企業(yè)級 SSD。

這不是普通的存儲容量需求增加。

這是 AI 系統(tǒng)架構(gòu)本身的變化。

四、2026 年最關(guān)鍵的信號:企業(yè)級 SSD 開始進入 AI 推理內(nèi)存層級

我認(rèn)為,2026 年存儲產(chǎn)業(yè)最重要的變化,不只是 HBM 繼續(xù)緊缺,而是企業(yè)級SSD 的角色被重定義了。

過去,SSD 在 AI 里的作用主要是:

存訓(xùn)練數(shù)據(jù);

存 checkpoint;

存模型版本;

存數(shù)據(jù)湖;

存向量數(shù)據(jù)庫。

這些當(dāng)然重要,但還停留在“后臺存儲”的邏輯。

真正的變化是 NVIDIA CMX / BlueField-4 / STX 這條路線。

英偉達已經(jīng)開始把 NVMe SSD 放進 AI 推理的上下文記憶層,讓 SSD 服務(wù)于長上下文、多輪對話、agentic AI 和 KV cache offload。

這意味著什么?

意味著企業(yè)級 SSD 不再只是 AI 數(shù)據(jù)中心的倉庫,而開始成為 AI 推理系統(tǒng)的一部分。

過去 SSD 是存東西的。

現(xiàn)在 SSD 要參與 AI 的記憶、召回、上下文擴展和 token 成本優(yōu)化。

這就是企業(yè)級 SSD 估值邏輯最可能發(fā)生變化的地方。

市場以前給 NAND 的估值,是周期品估值。

但如果企業(yè)級 SSD 進入 AI 推理架構(gòu),進入上下文記憶系統(tǒng),它就不再只是普通存儲,而是 AI 基礎(chǔ)設(shè)施的一層。

這也是我認(rèn)為企業(yè)級 SSD 可能存在最大預(yù)期差的原因。

五、Physical AI 會把存儲需求從數(shù)據(jù)中心推向機器人、汽車和 AI PC

黃仁勛這兩年反復(fù)講 physical AI。

什么是 physical AI?

就是 AI 不再只是在屏幕里回答問題,而是進入真實世界,控制機器人、汽車、工廠、倉庫、無人機、家庭終端。

這對存儲的拉動,和云端大模型還不一樣。

云端大模型主要處理文本、代碼、圖像、企業(yè)知識庫和用戶會話。

但 physical AI 面對的是連續(xù)的真實世界數(shù)據(jù):

攝像頭視頻;激光雷達點云;動作軌跡;地圖;邊緣場景;失敗案例;仿真數(shù)據(jù);真實世界反饋。自動駕駛要記住路況。機器人要記住環(huán)境。家用 AI 終端要記住用戶習(xí)慣。AI PC 要記住文件、偏好、工作流和歷史交互。

這會形成三類新的存儲需求:

第一,云端訓(xùn)練和仿真數(shù)據(jù),對企業(yè)級 SSD、對象存儲、數(shù)據(jù)中心 NAND 的需求暴增。

第二,邊緣端實時感知和規(guī)劃,對 LPDDR、GDDR、統(tǒng)一內(nèi)存、低延遲存儲提出更高要求。

第三,個人長期記憶,對本地 SSD、安全存儲、端云同步系統(tǒng)提出新需求。

所以,physical AI 的本質(zhì)不是簡單多賣幾臺機器人。

它意味著 AI 從無記憶的工具,變成有經(jīng)驗的智能體。

而經(jīng)驗,必須被存下來。

六、AI PC 也不是傳統(tǒng) PC 升級,而是個人記憶節(jié)點

很多人看 AI PC,只看 NPU 算力。

但我認(rèn)為,AI PC 真正的變化,不只是本地跑模型,而是 PC 從文件工具變成個人 AI 代理。

未來的 AI PC 要做什么?

它要理解你的文件;

記住你的偏好;

索引你的郵件、圖片、會議、文檔;

保存你的歷史任務(wù);

在本地運行 agent;

在保護隱私的前提下完成長期個性化。

這時候,本地 SSD 和統(tǒng)一內(nèi)存的重要性會明顯上升。

過去 PC 里的 SSD 主要解決開機快、游戲加載快、文件傳輸快。

未來 AI PC 的 SSD,要承載個人知識庫、向量索引、歷史會話、多模態(tài)記錄和本地 agent 記憶。

所以 AI PC 對存儲產(chǎn)業(yè)的影響,不是每臺電腦多加一點容量這么簡單。

它的本質(zhì)是:

個人電腦正在變成個人記憶節(jié)點。

七、未來 AI 系統(tǒng)會形成五級“記憶金字塔”

如果站在黃仁勛的工程視角看,未來 AI factory 和 physical AI 的存儲體系,大概率會形成五層結(jié)構(gòu):

第一層,SRAM / Cache / Register。

這是最靠近計算核心的極熱數(shù)據(jù),用于 Tensor Core 運算和底層計算調(diào)度。

第二層,HBM。

這是 AI 時代最稀缺、最高價值的存儲形態(tài),承載模型權(quán)重、激活、最熱 KV cache 和實時推理。

第三層,DDR5 / LPDDR / SOCAMM / CPU Memory。

這是系統(tǒng)內(nèi)存層,承接 CPU-GPU 協(xié)同、agent 調(diào)度、較溫上下文、數(shù)據(jù)預(yù)處理和統(tǒng)一內(nèi)存需求。

第四層,NVMe 企業(yè)級 SSD / CMX / STX。

這是未來最值得重估的一層,承接 KV cache offload、RAG、向量數(shù)據(jù)庫、長期上下文和企業(yè)知識庫。

第五層,數(shù)據(jù)湖 /冷存儲。

這是多模態(tài)訓(xùn)練數(shù)據(jù)、機器人日志、自動駕駛數(shù)據(jù)、仿真數(shù)據(jù)和歷史數(shù)據(jù)的長期存儲層。

這就是我理解的存儲革命:

AI 的記憶被分層了。存儲從靜態(tài)保存數(shù)據(jù),變成動態(tài)參與智能生成。

八、投資含義:HBM 是確定性,企業(yè)級 SSD 是預(yù)期差,DDR5/LPDDR 是中間層

從投資角度看,我會把 AI 存儲分成三類機會。

1、HBM:確定性最強

HBM 直接綁定 GPU,是 AI 加速器的一部分。

Blackwell、Rubin、Rubin Ultra 繼續(xù)提高單 GPU、單機架、單 NVLink 域的 HBM 容量和帶寬。

HBM 的瓶頸不只是 DRAM 晶圓,還包括先進封裝、良率、平臺認(rèn)證和與 GPU 的協(xié)同設(shè)計。

所以 HBM 不是普通 DRAM,而是 AI 算力系統(tǒng)的近身燃料。

這條線確定性最強,但市場認(rèn)知也最充分。

2、DDR5 / LPDDR / SOCAMM:重要性被低估

市場經(jīng)常只盯著 HBM,但 AI 系統(tǒng)不可能把所有數(shù)據(jù)都放在 HBM。

HBM 太貴、太稀缺,也太靠近 GPU。

大量 agent 調(diào)度、系統(tǒng)上下文、CPU-GPU 協(xié)同、數(shù)據(jù)預(yù)處理、較溫緩存,都需要 DDR5、LPDDR 和新型系統(tǒng)內(nèi)存承接。

AI PC、Grace/Vera CPU、統(tǒng)一內(nèi)存、端側(cè) AI,也都會提高這一層的價值。

這條線不一定最性感,但會越來越重要。

3、企業(yè)級 SSD / NAND:最大預(yù)期差

我最關(guān)注的是企業(yè)級 SSD。

因為它的邏輯正在從容量周期變成上下文記憶。

如果 SSD 只是存數(shù)據(jù),那它還是周期品。

但如果 SSD 進入 NVIDIA CMX / BlueField-4 / STX 這樣的 AI 推理架構(gòu),開始服務(wù) KV cache、RAG、長期上下文和企業(yè)知識庫,那么它的估值邏輯就應(yīng)該發(fā)生變化。

未來真正有價值的企業(yè)級 SSD,不只是容量大、價格低,而是要具備:

低延遲;高 IOPS;高耐久;低功耗;主控和固件能力;DPU/GPU direct 能力;進入云廠商和 NVIDIA 生態(tài)的認(rèn)證能力。

所以,企業(yè)級 SSD 不是簡單的 NAND 漲價邏輯,而是 AI 推理架構(gòu)重構(gòu)帶來的新邏輯。

九、不是所有存儲都同等受益

這里也要強調(diào)一點:

存儲革命不等于所有存儲公司一起漲。

普通消費級 NAND、低端 DRAM、普通模組廠,不一定能吃到最高質(zhì)量的 AI 紅利。

AI 存儲需求不是單純?nèi)萘啃枨螅菍?、延遲、功耗、耐久、軟件棧、主控、固件、認(rèn)證能力的系統(tǒng)性要求。

未來最有價值的存儲公司,應(yīng)該具備幾個特征:

能進入 AI 數(shù)據(jù)中心;能服務(wù)企業(yè)級 SSD;有主控和固件能力;能通過云廠商認(rèn)證;能適配 GPU / DPU / CXL / NVMe 新架構(gòu);最好還能在供應(yīng)鏈中綁定晶圓、主控、模組和客戶資源。

這類公司,才有機會從傳統(tǒng)周期品,變成 AI 基礎(chǔ)設(shè)施供應(yīng)商。

十、最終判斷:AI 正從 compute-centric 進入 memory/context-centric 階段

我對 2026 年存儲產(chǎn)業(yè)的判斷可以總結(jié)成一句話:

AI 的下一階段,不是存儲取代算力,而是算力越來越依賴存儲。

GPU 越強,越需要 HBM;

上下文越長,越需要 DDR5 / LPDDR;

智能體越復(fù)雜,越需要企業(yè)級 SSD;

物理 AI 越普及,越需要端側(cè)和云端同時擴容;

AI PC 越個人化,越需要本地長期記憶。

所以,未來 AI 基礎(chǔ)設(shè)施不是簡單堆 GPU,而是 GPU、HBM、DDR5、LPDDR、企業(yè)級 SSD、DPU、網(wǎng)絡(luò)和軟件棧共同構(gòu)成一臺巨大的記憶型計算機。

誰能控制更高效的記憶層級,誰就能降低 token 成本,擴展上下文長度,支撐 agentic AI,并把 AI 帶入機器人、自動駕駛和個人 PC。

這就是我認(rèn)為 2026 年真正值得重視的產(chǎn)業(yè)變化:AI 革命上半場看算力。AI 革命下半場,看記憶。

雪球三分法是雪球基于“長期投資+資產(chǎn)配置”推出的配置理念,通過資產(chǎn)分散、市場分散、時機分散這三大分散進行長期投資,從而實現(xiàn)投資收益來源多元化和風(fēng)險分散化。點擊下方圖片,立即領(lǐng)取課程

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
菲防長沒想到,繼全家被中方制裁后,還有更慘的:中國恐?jǐn)喙┗?>
    </a>
        <h3>
      <a href=有范又有料
2026-06-13 17:56:58
開封男童已丟3天,關(guān)鍵線索曝光!奶奶前后說法不一,果然有蹊蹺

開封男童已丟3天,關(guān)鍵線索曝光!奶奶前后說法不一,果然有蹊蹺

奇思妙想草葉君
2026-06-13 22:02:01
2026年反腐重點,沒有煙草、消防、醫(yī)藥、工程建設(shè)了,有三個變化

2026年反腐重點,沒有煙草、消防、醫(yī)藥、工程建設(shè)了,有三個變化

細說職場
2026-06-14 14:31:07
訂單太多?特斯拉中國:Model 3 全系...

訂單太多?特斯拉中國:Model 3 全系...

新浪財經(jīng)
2026-06-12 22:30:54
重頭戲 巴西1-1!安切洛蒂又背鍋又封神!大羅、卡卡看得直搖頭!

重頭戲 巴西1-1!安切洛蒂又背鍋又封神!大羅、卡卡看得直搖頭!

越嶺尋蹤
2026-06-14 08:59:03
《主角》主題曲想找王菲,張藝謀說:“我請不來”,孫浩:我能!

《主角》主題曲想找王菲,張藝謀說:“我請不來”,孫浩:我能!

她時尚丫
2026-06-13 21:44:23
伊朗11名世界杯成員被美拒簽

伊朗11名世界杯成員被美拒簽

體壇周報
2026-06-14 02:43:18
全家被拉黑!還有更慘的馬上來,特奧多羅或?qū)⒆屢粌|人丟掉飯碗?

全家被拉黑!還有更慘的馬上來,特奧多羅或?qū)⒆屢粌|人丟掉飯碗?

李云飛Afey
2026-06-14 03:01:04
李想承認(rèn)判斷失誤,中國車企不會只剩5家,爆款打法過時了

李想承認(rèn)判斷失誤,中國車企不會只剩5家,爆款打法過時了

路咖汽車
2026-06-14 16:25:04
遇見小面被曝“維權(quán)成癮”!網(wǎng)友憤怒,評論區(qū)驚現(xiàn)神評論

遇見小面被曝“維權(quán)成癮”!網(wǎng)友憤怒,評論區(qū)驚現(xiàn)神評論

魔都姐姐雜談
2026-06-14 16:43:19
昆明南博會一商品二維碼涉黃:掃碼后會跳轉(zhuǎn)至色情網(wǎng)站,涉事公司:被涂抹的二維碼原本關(guān)聯(lián)企業(yè)公眾號,長期疏于運維,域名遭境外“攻克”

昆明南博會一商品二維碼涉黃:掃碼后會跳轉(zhuǎn)至色情網(wǎng)站,涉事公司:被涂抹的二維碼原本關(guān)聯(lián)企業(yè)公眾號,長期疏于運維,域名遭境外“攻克”

大風(fēng)新聞
2026-06-14 08:55:03
女子每天狂飲3-4杯奶茶,血液變成“牛奶色”,血脂翻118倍,經(jīng)歷3次血漿置換!出院當(dāng)天:再也不把奶茶當(dāng)水喝了

女子每天狂飲3-4杯奶茶,血液變成“牛奶色”,血脂翻118倍,經(jīng)歷3次血漿置換!出院當(dāng)天:再也不把奶茶當(dāng)水喝了

環(huán)球網(wǎng)資訊
2026-06-14 15:29:22
總決賽轟45+有多難?科比0次,杜蘭特0次,唯有他倆各3次

總決賽轟45+有多難?科比0次,杜蘭特0次,唯有他倆各3次

籃球大視野
2026-06-14 16:34:35
詹俊也犯了巨大巨大失誤!將美國歌手誤認(rèn)為是小羅:實在是太像了

詹俊也犯了巨大巨大失誤!將美國歌手誤認(rèn)為是小羅:實在是太像了

風(fēng)過鄉(xiāng)
2026-06-14 07:49:53
國產(chǎn)手機漲價自食其果,iPhone17銷量猛漲,蘋果稱霸國內(nèi)市場

國產(chǎn)手機漲價自食其果,iPhone17銷量猛漲,蘋果稱霸國內(nèi)市場

柏銘銳談
2026-06-12 23:57:01
時速101公里!1.4億歐熊皇拯救巴西隊:底線過人+暴力抽射 安帥歡呼

時速101公里!1.4億歐熊皇拯救巴西隊:底線過人+暴力抽射 安帥歡呼

風(fēng)過鄉(xiāng)
2026-06-14 06:47:55
張嘉益孫浩再組陜籍天團!《喜劇》選角吵翻天,這波真的贏麻了!

張嘉益孫浩再組陜籍天團!《喜劇》選角吵翻天,這波真的贏麻了!

觀察鑒娛
2026-06-14 16:02:56
97歲百萬網(wǎng)紅“劉老太”確認(rèn)去世,離世當(dāng)晚還帶病直播,因病情惡化,孫女突然斷播

97歲百萬網(wǎng)紅“劉老太”確認(rèn)去世,離世當(dāng)晚還帶病直播,因病情惡化,孫女突然斷播

情感大頭說說
2026-06-14 19:08:54
成本13億,首日票房僅400多萬,世界第一導(dǎo)演新片被謝苗打懵了

成本13億,首日票房僅400多萬,世界第一導(dǎo)演新片被謝苗打懵了

影視高原說
2026-06-12 17:28:16
美軍投兩原子彈,日本賭美國沒有第三顆,誰知美國一招讓日本安分

美軍投兩原子彈,日本賭美國沒有第三顆,誰知美國一招讓日本安分

磊子講史
2026-06-12 16:15:35
2026-06-14 22:35:00
雪球 incentive-icons
雪球
雪球,聰明的投資者都在這里。
11138文章數(shù) 178514關(guān)注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風(fēng)報信

頭條要聞

金價跌至900元關(guān)口 北京大媽豪擲11萬給兒媳備五金

頭條要聞

金價跌至900元關(guān)口 北京大媽豪擲11萬給兒媳備五金

體育要聞

8年8隊奪冠,鄧肯那句話,現(xiàn)在還給了馬刺

娛樂要聞

鄧超攜子觀戰(zhàn)NBA,等等帥氣十足

財經(jīng)要聞

金價跌至900元關(guān)口,大媽又來抄底了!

汽車要聞

綜合續(xù)航超1600km/零百加速4秒級 2027款星途ES預(yù)售18.99萬起

態(tài)度原創(chuàng)

健康
藝術(shù)
教育
手機
房產(chǎn)

老人、小孩、孕婦,吃粽子有啥風(fēng)險

藝術(shù)要聞

Lori Putnam | 光感拉滿的印象風(fēng)景寫生

教育要聞

不留遺憾,高考再戰(zhàn)!綿陽多校2027屆復(fù)讀班招生信息出爐

手機要聞

三星擬為寬折疊機型引入與傳聞中 iPhone Fold 類似技術(shù) 以降低折痕、提升耐用性

房產(chǎn)要聞

海南最賺錢行業(yè)曝光!最快4年半,海口全款買三房!

無障礙瀏覽 進入關(guān)懷版