文|證券之星
如果AI只是一問一答的聊天機(jī)器,算力的答案確實(shí)很簡(jiǎn)單——有多少GPU,就有多少想象力。在那段以對(duì)話模型為主角的周期里,CPU更像一位低調(diào)的調(diào)度員,負(fù)責(zé)數(shù)據(jù)的迎來送往,而非決定反應(yīng)快慢的核心角色。然而,當(dāng)AI從對(duì)話框里走出來,開始調(diào)用工具、讀寫代碼、編排任務(wù),變身真正的"數(shù)字代理人"時(shí),算力游戲規(guī)則變了。分支指令的暴增讓擅長(zhǎng)矩陣乘法的GPU一時(shí)"水土不服",而那位退居幕后的CPU,卻恰好站上了控制流與記憶體風(fēng)暴的中央。
在對(duì)話大模型時(shí)代,CPU一度退居幕后
在AI的上一程里,行業(yè)幾乎被一條邏輯完全主導(dǎo):算力決定上限,GPU就是算力的核心。無論是千億參數(shù)模型的訓(xùn)練,還是大模型的實(shí)時(shí)推理,核心計(jì)算都落在矩陣乘法之上——而這恰恰是GPU架構(gòu)設(shè)計(jì)的絕對(duì)主場(chǎng)。在這種范式下,CPU退居幕后,負(fù)責(zé)數(shù)據(jù)預(yù)處理、任務(wù)調(diào)度和結(jié)果后處理等"總指揮"式的工作,其性能高低似乎并不直接決定用戶體驗(yàn)。
但走到2026年,AI產(chǎn)業(yè)完成了一次關(guān)鍵范式切換。AI不再只是一"回答問題的對(duì)話機(jī)器,它開始真正走進(jìn)現(xiàn)實(shí)世界"執(zhí)行任務(wù)"。這個(gè)轉(zhuǎn)變帶來的不僅是能力的躍遷,更是一場(chǎng)算力需求的底層重構(gòu)。大模型訓(xùn)練曾是AI算力消耗的主體,而到了2025年下半年,AI推理的支出正式超過了訓(xùn)練,行業(yè)迎來所謂推理翻轉(zhuǎn)。當(dāng)重心從訓(xùn)練轉(zhuǎn)向推理和規(guī)模化落地,算力的評(píng)判標(biāo)準(zhǔn)也隨之改變——不再是誰的GPU更強(qiáng),而是整個(gè)系統(tǒng)能不能跑起來。
在對(duì)話模型時(shí)代,一個(gè)用戶請(qǐng)求的處理鏈路相對(duì)簡(jiǎn)單:CPU將文本轉(zhuǎn)換為token,GPU運(yùn)行模型生成響應(yīng),CPU再將token轉(zhuǎn)換回文本。在這個(gè)往返中,GPU的計(jì)算時(shí)間主導(dǎo)了總延遲,CPU幾乎不在性能的考量范圍內(nèi)。但當(dāng)工作負(fù)載變成智能體,情況就截然不同了。一個(gè)典型的Agent任務(wù)需要執(zhí)行多步推理、調(diào)用API、讀寫數(shù)據(jù)庫、運(yùn)行代碼、解析文檔,然后將所有中間結(jié)果編排成最終輸出。
![]()
4月8日,知名半導(dǎo)體分析機(jī)構(gòu)SemiAnalysis首席分析師Dylan Patel在一次深度訪談中指出,由于AI工作負(fù)載的范式正在從簡(jiǎn)單的文本生成向復(fù)雜的"智能體(Agents)"和"強(qiáng)化學(xué)習(xí)(RL)"演進(jìn),CPU正面臨極其嚴(yán)重的產(chǎn)能短缺。
Agent的工作機(jī)制,助力CPU價(jià)值重估
為什么智能體對(duì)CPU的依賴如此之大?答案藏在Agent的工作機(jī)制里。
傳統(tǒng)對(duì)話模型的分支極少,一次推理就是一次推理。但智能體的行動(dòng)階段充滿了if/else判斷和系統(tǒng)調(diào)用。以Manus為代表的主流Agent架構(gòu),會(huì)為每個(gè)任務(wù)分配一個(gè)隔離的云端沙箱虛擬機(jī),任務(wù)之間可以并行但控制流完全不同——有的在瀏覽網(wǎng)頁,有的在修改代碼,有的在部署環(huán)境。這類分支類任務(wù)如果放在GPU上執(zhí)行,控制流發(fā)散會(huì)直接導(dǎo)致算力利用率急劇下降。而分支預(yù)測(cè)和處理恰恰是CPU微架構(gòu)幾十年來持續(xù)優(yōu)化的核心能力。這正是東吳證券所說的"執(zhí)行控制流CPU化"。
與此同時(shí),智能體的記憶體系也在發(fā)生遷移。在長(zhǎng)上下文場(chǎng)景下,大模型推理會(huì)產(chǎn)生巨大的KV Cache,其占用隨對(duì)話輪次和上下文長(zhǎng)度線性增長(zhǎng),很快就會(huì)耗盡GPU寶貴的HBM容量。業(yè)界普遍采用的解決方案是將KV Cache遷移到CPU內(nèi)存——通過KV Cache Offload技術(shù),搭配大容量DDR5/LPDDR5內(nèi)存和CXL擴(kuò)展,CPU成為兼顧吞吐、擴(kuò)展性和成本效率的KV Cache最優(yōu)容器。東吳證券將這種現(xiàn)象概括為"記憶體系去GPU化",這意味著CPU的角色已經(jīng)從單純的調(diào)度中樞,擴(kuò)展為同時(shí)承載控制和部分存儲(chǔ)功能的核心資源池。
![]()
值得注意的是,智能體工作負(fù)載不僅在質(zhì)上挑戰(zhàn)CPU,在量上也形成了空前的壓力。與標(biāo)準(zhǔn)生成式AI相比,代理式AI部署的token消耗量增加了20到30倍。每一次用戶交互背后都包含著多步推理、工具調(diào)用和跨Agent協(xié)調(diào),這個(gè)過程的token消耗遠(yuǎn)遠(yuǎn)超過單次問答。Gartner甚至預(yù)測(cè),到2027年將有40%的代理項(xiàng)目因基礎(chǔ)設(shè)施成本超支而被取消。高昂的成本不僅來自GPU推理,相當(dāng)一部分正來自CPU端的持續(xù)開銷。
海外大廠開始"堆核競(jìng)賽",行業(yè)有望重回高增長(zhǎng)
就在這種CPU需求量激增但產(chǎn)能受限的臨界點(diǎn)上,行業(yè)巨頭的動(dòng)向往往最先泄露天機(jī)
2026年初,英偉達(dá)做了兩件看似偏離主業(yè)的事:一是掏出20億美元追加認(rèn)購CoreWeave股票,并在其平臺(tái)上部署專為代理式推理設(shè)計(jì)的Vera CPU;二是在下一代Rubin架構(gòu)中大幅提升CPU核心數(shù),并開放NVL72機(jī)柜對(duì)x86 CPU的支持。
與此同時(shí),傳統(tǒng)CPU廠商正在Agent的驅(qū)動(dòng)下集體向超多核架構(gòu)沖刺。AMD推出的Turin最高可達(dá)192核;英特爾的Sierra Forest采用純能效核設(shè)計(jì),核心數(shù)可達(dá)144甚至288核。超多核CPU以更高的并行度和更低的單位功耗,支撐大規(guī)模、長(zhǎng)期運(yùn)行的Agent執(zhí)行環(huán)境。隨著Agent商業(yè)化的推進(jìn),廠商必須持續(xù)壓低每次任務(wù)的執(zhí)行成本——在這個(gè)目標(biāo)下,核數(shù)越多,單位成本越低,CPU的堆核競(jìng)賽或許才剛剛開始。
從投資視角來看,IDC 預(yù)計(jì) Agent 年執(zhí)行任務(wù)數(shù)將從 2025 年的 440 億次快速增加至 2030 年的 415 萬億次,對(duì)應(yīng)年復(fù)合增長(zhǎng)率達(dá) 524%,Agentic AI 發(fā)展正驅(qū)動(dòng) CPU 迎來新一輪成長(zhǎng)機(jī)遇。
在A股相關(guān)公司方面,東吳證券研報(bào)指出 CPU:瀾起科技、海光信息、廣合科技、龍芯中科、中國長(zhǎng)城等。 數(shù)據(jù)庫:星環(huán)科技(基于ARM 優(yōu)化,與NV-GPU-GraceCPU 適配)。
結(jié)語:CPU有望重回"黃金時(shí)代"
從對(duì)話模型的GPU中心主義,到智能體時(shí)代的CPU價(jià)值回歸,算力版圖的位移折射出AI應(yīng)用形態(tài)的深刻進(jìn)化。當(dāng)推理支出超越訓(xùn)練,當(dāng)Agent的token消耗量數(shù)十倍于單次問答,基礎(chǔ)設(shè)施的效率命題就不再只是誰的GPU更強(qiáng),而是整個(gè)系統(tǒng)能否以可持續(xù)的成本跑起來。CPU憑借其在分支預(yù)測(cè)、內(nèi)存擴(kuò)展和并發(fā)控制上的架構(gòu)優(yōu)勢(shì),從單純的調(diào)度中樞躍升為承載控制邏輯與記憶體系的核心資源池。
海外大廠的堆核競(jìng)賽只是這場(chǎng)變局的外顯征兆。其共同指向一個(gè)清晰方向:面向大規(guī)模、長(zhǎng)周期運(yùn)行的代理式AI負(fù)載,超多核CPU正成為成本與能效的關(guān)鍵平衡點(diǎn)。可以預(yù)見,隨著Agent商業(yè)化的深入,算力體系的評(píng)判標(biāo)準(zhǔn)將被部分改寫——異構(gòu)計(jì)算的天平不再一味向GPU傾斜,CPU正以更加主動(dòng)的姿態(tài),參與定義下一代AI基礎(chǔ)設(shè)施的形態(tài)與邊界。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.