網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI智能體下的CPU，或重回“黃金時(shí)代”

2026-04-15 14:34:09　來源: 藍(lán)鯨新聞

上海舉報(bào)

分享至

文｜證券之星

如果AI只是一問一答的聊天機(jī)器，算力的答案確實(shí)很簡(jiǎn)單——有多少GPU，就有多少想象力。在那段以對(duì)話模型為主角的周期里，CPU更像一位低調(diào)的調(diào)度員，負(fù)責(zé)數(shù)據(jù)的迎來送往，而非決定反應(yīng)快慢的核心角色。然而，當(dāng)AI從對(duì)話框里走出來，開始調(diào)用工具、讀寫代碼、編排任務(wù)，變身真正的"數(shù)字代理人"時(shí)，算力游戲規(guī)則變了。分支指令的暴增讓擅長(zhǎng)矩陣乘法的GPU一時(shí)"水土不服"，而那位退居幕后的CPU，卻恰好站上了控制流與記憶體風(fēng)暴的中央。

在對(duì)話大模型時(shí)代，CPU一度退居幕后

在AI的上一程里，行業(yè)幾乎被一條邏輯完全主導(dǎo)：算力決定上限，GPU就是算力的核心。無論是千億參數(shù)模型的訓(xùn)練，還是大模型的實(shí)時(shí)推理，核心計(jì)算都落在矩陣乘法之上——而這恰恰是GPU架構(gòu)設(shè)計(jì)的絕對(duì)主場(chǎng)。在這種范式下，CPU退居幕后，負(fù)責(zé)數(shù)據(jù)預(yù)處理、任務(wù)調(diào)度和結(jié)果后處理等"總指揮"式的工作，其性能高低似乎并不直接決定用戶體驗(yàn)。

但走到2026年，AI產(chǎn)業(yè)完成了一次關(guān)鍵范式切換。AI不再只是一"回答問題的對(duì)話機(jī)器，它開始真正走進(jìn)現(xiàn)實(shí)世界"執(zhí)行任務(wù)"。這個(gè)轉(zhuǎn)變帶來的不僅是能力的躍遷，更是一場(chǎng)算力需求的底層重構(gòu)。大模型訓(xùn)練曾是AI算力消耗的主體，而到了2025年下半年，AI推理的支出正式超過了訓(xùn)練，行業(yè)迎來所謂推理翻轉(zhuǎn)。當(dāng)重心從訓(xùn)練轉(zhuǎn)向推理和規(guī)模化落地，算力的評(píng)判標(biāo)準(zhǔn)也隨之改變——不再是誰的GPU更強(qiáng)，而是整個(gè)系統(tǒng)能不能跑起來。

在對(duì)話模型時(shí)代，一個(gè)用戶請(qǐng)求的處理鏈路相對(duì)簡(jiǎn)單：CPU將文本轉(zhuǎn)換為token，GPU運(yùn)行模型生成響應(yīng)，CPU再將token轉(zhuǎn)換回文本。在這個(gè)往返中，GPU的計(jì)算時(shí)間主導(dǎo)了總延遲，CPU幾乎不在性能的考量范圍內(nèi)。但當(dāng)工作負(fù)載變成智能體，情況就截然不同了。一個(gè)典型的Agent任務(wù)需要執(zhí)行多步推理、調(diào)用API、讀寫數(shù)據(jù)庫、運(yùn)行代碼、解析文檔，然后將所有中間結(jié)果編排成最終輸出。

4月8日，知名半導(dǎo)體分析機(jī)構(gòu)SemiAnalysis首席分析師Dylan Patel在一次深度訪談中指出，由于AI工作負(fù)載的范式正在從簡(jiǎn)單的文本生成向復(fù)雜的"智能體(Agents)"和"強(qiáng)化學(xué)習(xí)(RL)"演進(jìn)，CPU正面臨極其嚴(yán)重的產(chǎn)能短缺。

Agent的工作機(jī)制，助力CPU價(jià)值重估

為什么智能體對(duì)CPU的依賴如此之大？答案藏在Agent的工作機(jī)制里。

傳統(tǒng)對(duì)話模型的分支極少，一次推理就是一次推理。但智能體的行動(dòng)階段充滿了if/else判斷和系統(tǒng)調(diào)用。以Manus為代表的主流Agent架構(gòu)，會(huì)為每個(gè)任務(wù)分配一個(gè)隔離的云端沙箱虛擬機(jī)，任務(wù)之間可以并行但控制流完全不同——有的在瀏覽網(wǎng)頁，有的在修改代碼，有的在部署環(huán)境。這類分支類任務(wù)如果放在GPU上執(zhí)行，控制流發(fā)散會(huì)直接導(dǎo)致算力利用率急劇下降。而分支預(yù)測(cè)和處理恰恰是CPU微架構(gòu)幾十年來持續(xù)優(yōu)化的核心能力。這正是東吳證券所說的"執(zhí)行控制流CPU化"。

與此同時(shí)，智能體的記憶體系也在發(fā)生遷移。在長(zhǎng)上下文場(chǎng)景下，大模型推理會(huì)產(chǎn)生巨大的KV Cache，其占用隨對(duì)話輪次和上下文長(zhǎng)度線性增長(zhǎng)，很快就會(huì)耗盡GPU寶貴的HBM容量。業(yè)界普遍采用的解決方案是將KV Cache遷移到CPU內(nèi)存——通過KV Cache Offload技術(shù)，搭配大容量DDR5/LPDDR5內(nèi)存和CXL擴(kuò)展，CPU成為兼顧吞吐、擴(kuò)展性和成本效率的KV Cache最優(yōu)容器。東吳證券將這種現(xiàn)象概括為"記憶體系去GPU化"，這意味著CPU的角色已經(jīng)從單純的調(diào)度中樞，擴(kuò)展為同時(shí)承載控制和部分存儲(chǔ)功能的核心資源池。

值得注意的是，智能體工作負(fù)載不僅在質(zhì)上挑戰(zhàn)CPU，在量上也形成了空前的壓力。與標(biāo)準(zhǔn)生成式AI相比，代理式AI部署的token消耗量增加了20到30倍。每一次用戶交互背后都包含著多步推理、工具調(diào)用和跨Agent協(xié)調(diào)，這個(gè)過程的token消耗遠(yuǎn)遠(yuǎn)超過單次問答。Gartner甚至預(yù)測(cè)，到2027年將有40%的代理項(xiàng)目因基礎(chǔ)設(shè)施成本超支而被取消。高昂的成本不僅來自GPU推理，相當(dāng)一部分正來自CPU端的持續(xù)開銷。

海外大廠開始"堆核競(jìng)賽"，行業(yè)有望重回高增長(zhǎng)

就在這種CPU需求量激增但產(chǎn)能受限的臨界點(diǎn)上，行業(yè)巨頭的動(dòng)向往往最先泄露天機(jī)

2026年初，英偉達(dá)做了兩件看似偏離主業(yè)的事：一是掏出20億美元追加認(rèn)購CoreWeave股票，并在其平臺(tái)上部署專為代理式推理設(shè)計(jì)的Vera CPU；二是在下一代Rubin架構(gòu)中大幅提升CPU核心數(shù)，并開放NVL72機(jī)柜對(duì)x86 CPU的支持。

與此同時(shí)，傳統(tǒng)CPU廠商正在Agent的驅(qū)動(dòng)下集體向超多核架構(gòu)沖刺。AMD推出的Turin最高可達(dá)192核；英特爾的Sierra Forest采用純能效核設(shè)計(jì)，核心數(shù)可達(dá)144甚至288核。超多核CPU以更高的并行度和更低的單位功耗，支撐大規(guī)模、長(zhǎng)期運(yùn)行的Agent執(zhí)行環(huán)境。隨著Agent商業(yè)化的推進(jìn)，廠商必須持續(xù)壓低每次任務(wù)的執(zhí)行成本——在這個(gè)目標(biāo)下，核數(shù)越多，單位成本越低，CPU的堆核競(jìng)賽或許才剛剛開始。

從投資視角來看，IDC 預(yù)計(jì) Agent 年執(zhí)行任務(wù)數(shù)將從 2025 年的 440 億次快速增加至 2030 年的 415 萬億次，對(duì)應(yīng)年復(fù)合增長(zhǎng)率達(dá) 524%，Agentic AI 發(fā)展正驅(qū)動(dòng) CPU 迎來新一輪成長(zhǎng)機(jī)遇。

在A股相關(guān)公司方面，東吳證券研報(bào)指出 CPU：瀾起科技、海光信息、廣合科技、龍芯中科、中國長(zhǎng)城等。數(shù)據(jù)庫：星環(huán)科技(基于ARM 優(yōu)化，與NV-GPU-GraceCPU 適配)。

結(jié)語：CPU有望重回"黃金時(shí)代"

從對(duì)話模型的GPU中心主義，到智能體時(shí)代的CPU價(jià)值回歸，算力版圖的位移折射出AI應(yīng)用形態(tài)的深刻進(jìn)化。當(dāng)推理支出超越訓(xùn)練，當(dāng)Agent的token消耗量數(shù)十倍于單次問答，基礎(chǔ)設(shè)施的效率命題就不再只是誰的GPU更強(qiáng)，而是整個(gè)系統(tǒng)能否以可持續(xù)的成本跑起來。CPU憑借其在分支預(yù)測(cè)、內(nèi)存擴(kuò)展和并發(fā)控制上的架構(gòu)優(yōu)勢(shì)，從單純的調(diào)度中樞躍升為承載控制邏輯與記憶體系的核心資源池。

海外大廠的堆核競(jìng)賽只是這場(chǎng)變局的外顯征兆。其共同指向一個(gè)清晰方向：面向大規(guī)模、長(zhǎng)周期運(yùn)行的代理式AI負(fù)載，超多核CPU正成為成本與能效的關(guān)鍵平衡點(diǎn)。可以預(yù)見，隨著Agent商業(yè)化的深入，算力體系的評(píng)判標(biāo)準(zhǔn)將被部分改寫——異構(gòu)計(jì)算的天平不再一味向GPU傾斜，CPU正以更加主動(dòng)的姿態(tài)，參與定義下一代AI基礎(chǔ)設(shè)施的形態(tài)與邊界。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.