亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI智能體下的CPU,或重回“黃金時(shí)代”

0
分享至

文|證券之星

如果AI只是一問一答的聊天機(jī)器,算力的答案確實(shí)很簡(jiǎn)單——有多少GPU,就有多少想象力。在那段以對(duì)話模型為主角的周期里,CPU更像一位低調(diào)的調(diào)度員,負(fù)責(zé)數(shù)據(jù)的迎來送往,而非決定反應(yīng)快慢的核心角色。然而,當(dāng)AI從對(duì)話框里走出來,開始調(diào)用工具、讀寫代碼、編排任務(wù),變身真正的"數(shù)字代理人"時(shí),算力游戲規(guī)則變了。分支指令的暴增讓擅長(zhǎng)矩陣乘法的GPU一時(shí)"水土不服",而那位退居幕后的CPU,卻恰好站上了控制流與記憶體風(fēng)暴的中央。

在對(duì)話大模型時(shí)代,CPU一度退居幕后

在AI的上一程里,行業(yè)幾乎被一條邏輯完全主導(dǎo):算力決定上限,GPU就是算力的核心。無論是千億參數(shù)模型的訓(xùn)練,還是大模型的實(shí)時(shí)推理,核心計(jì)算都落在矩陣乘法之上——而這恰恰是GPU架構(gòu)設(shè)計(jì)的絕對(duì)主場(chǎng)。在這種范式下,CPU退居幕后,負(fù)責(zé)數(shù)據(jù)預(yù)處理、任務(wù)調(diào)度和結(jié)果后處理等"總指揮"式的工作,其性能高低似乎并不直接決定用戶體驗(yàn)。

但走到2026年,AI產(chǎn)業(yè)完成了一次關(guān)鍵范式切換。AI不再只是一"回答問題的對(duì)話機(jī)器,它開始真正走進(jìn)現(xiàn)實(shí)世界"執(zhí)行任務(wù)"。這個(gè)轉(zhuǎn)變帶來的不僅是能力的躍遷,更是一場(chǎng)算力需求的底層重構(gòu)。大模型訓(xùn)練曾是AI算力消耗的主體,而到了2025年下半年,AI推理的支出正式超過了訓(xùn)練,行業(yè)迎來所謂推理翻轉(zhuǎn)。當(dāng)重心從訓(xùn)練轉(zhuǎn)向推理和規(guī)模化落地,算力的評(píng)判標(biāo)準(zhǔn)也隨之改變——不再是誰的GPU更強(qiáng),而是整個(gè)系統(tǒng)能不能跑起來。

在對(duì)話模型時(shí)代,一個(gè)用戶請(qǐng)求的處理鏈路相對(duì)簡(jiǎn)單:CPU將文本轉(zhuǎn)換為token,GPU運(yùn)行模型生成響應(yīng),CPU再將token轉(zhuǎn)換回文本。在這個(gè)往返中,GPU的計(jì)算時(shí)間主導(dǎo)了總延遲,CPU幾乎不在性能的考量范圍內(nèi)。但當(dāng)工作負(fù)載變成智能體,情況就截然不同了。一個(gè)典型的Agent任務(wù)需要執(zhí)行多步推理、調(diào)用API、讀寫數(shù)據(jù)庫、運(yùn)行代碼、解析文檔,然后將所有中間結(jié)果編排成最終輸出。


4月8日,知名半導(dǎo)體分析機(jī)構(gòu)SemiAnalysis首席分析師Dylan Patel在一次深度訪談中指出,由于AI工作負(fù)載的范式正在從簡(jiǎn)單的文本生成向復(fù)雜的"智能體(Agents)"和"強(qiáng)化學(xué)習(xí)(RL)"演進(jìn),CPU正面臨極其嚴(yán)重的產(chǎn)能短缺。

Agent的工作機(jī)制,助力CPU價(jià)值重估

為什么智能體對(duì)CPU的依賴如此之大?答案藏在Agent的工作機(jī)制里。

傳統(tǒng)對(duì)話模型的分支極少,一次推理就是一次推理。但智能體的行動(dòng)階段充滿了if/else判斷和系統(tǒng)調(diào)用。以Manus為代表的主流Agent架構(gòu),會(huì)為每個(gè)任務(wù)分配一個(gè)隔離的云端沙箱虛擬機(jī),任務(wù)之間可以并行但控制流完全不同——有的在瀏覽網(wǎng)頁,有的在修改代碼,有的在部署環(huán)境。這類分支類任務(wù)如果放在GPU上執(zhí)行,控制流發(fā)散會(huì)直接導(dǎo)致算力利用率急劇下降。而分支預(yù)測(cè)和處理恰恰是CPU微架構(gòu)幾十年來持續(xù)優(yōu)化的核心能力。這正是東吳證券所說的"執(zhí)行控制流CPU化"。

與此同時(shí),智能體的記憶體系也在發(fā)生遷移。在長(zhǎng)上下文場(chǎng)景下,大模型推理會(huì)產(chǎn)生巨大的KV Cache,其占用隨對(duì)話輪次和上下文長(zhǎng)度線性增長(zhǎng),很快就會(huì)耗盡GPU寶貴的HBM容量。業(yè)界普遍采用的解決方案是將KV Cache遷移到CPU內(nèi)存——通過KV Cache Offload技術(shù),搭配大容量DDR5/LPDDR5內(nèi)存和CXL擴(kuò)展,CPU成為兼顧吞吐、擴(kuò)展性和成本效率的KV Cache最優(yōu)容器。東吳證券將這種現(xiàn)象概括為"記憶體系去GPU化",這意味著CPU的角色已經(jīng)從單純的調(diào)度中樞,擴(kuò)展為同時(shí)承載控制和部分存儲(chǔ)功能的核心資源池。


值得注意的是,智能體工作負(fù)載不僅在質(zhì)上挑戰(zhàn)CPU,在量上也形成了空前的壓力。與標(biāo)準(zhǔn)生成式AI相比,代理式AI部署的token消耗量增加了20到30倍。每一次用戶交互背后都包含著多步推理、工具調(diào)用和跨Agent協(xié)調(diào),這個(gè)過程的token消耗遠(yuǎn)遠(yuǎn)超過單次問答。Gartner甚至預(yù)測(cè),到2027年將有40%的代理項(xiàng)目因基礎(chǔ)設(shè)施成本超支而被取消。高昂的成本不僅來自GPU推理,相當(dāng)一部分正來自CPU端的持續(xù)開銷。

海外大廠開始"堆核競(jìng)賽",行業(yè)有望重回高增長(zhǎng)

就在這種CPU需求量激增但產(chǎn)能受限的臨界點(diǎn)上,行業(yè)巨頭的動(dòng)向往往最先泄露天機(jī)

2026年初,英偉達(dá)做了兩件看似偏離主業(yè)的事:一是掏出20億美元追加認(rèn)購CoreWeave股票,并在其平臺(tái)上部署專為代理式推理設(shè)計(jì)的Vera CPU;二是在下一代Rubin架構(gòu)中大幅提升CPU核心數(shù),并開放NVL72機(jī)柜對(duì)x86 CPU的支持。

與此同時(shí),傳統(tǒng)CPU廠商正在Agent的驅(qū)動(dòng)下集體向超多核架構(gòu)沖刺。AMD推出的Turin最高可達(dá)192核;英特爾的Sierra Forest采用純能效核設(shè)計(jì),核心數(shù)可達(dá)144甚至288核。超多核CPU以更高的并行度和更低的單位功耗,支撐大規(guī)模、長(zhǎng)期運(yùn)行的Agent執(zhí)行環(huán)境。隨著Agent商業(yè)化的推進(jìn),廠商必須持續(xù)壓低每次任務(wù)的執(zhí)行成本——在這個(gè)目標(biāo)下,核數(shù)越多,單位成本越低,CPU的堆核競(jìng)賽或許才剛剛開始。

從投資視角來看,IDC 預(yù)計(jì) Agent 年執(zhí)行任務(wù)數(shù)將從 2025 年的 440 億次快速增加至 2030 年的 415 萬億次,對(duì)應(yīng)年復(fù)合增長(zhǎng)率達(dá) 524%,Agentic AI 發(fā)展正驅(qū)動(dòng) CPU 迎來新一輪成長(zhǎng)機(jī)遇。

在A股相關(guān)公司方面,東吳證券研報(bào)指出 CPU:瀾起科技、海光信息、廣合科技、龍芯中科、中國長(zhǎng)城等。 數(shù)據(jù)庫:星環(huán)科技(基于ARM 優(yōu)化,與NV-GPU-GraceCPU 適配)。

結(jié)語:CPU有望重回"黃金時(shí)代"

從對(duì)話模型的GPU中心主義,到智能體時(shí)代的CPU價(jià)值回歸,算力版圖的位移折射出AI應(yīng)用形態(tài)的深刻進(jìn)化。當(dāng)推理支出超越訓(xùn)練,當(dāng)Agent的token消耗量數(shù)十倍于單次問答,基礎(chǔ)設(shè)施的效率命題就不再只是誰的GPU更強(qiáng),而是整個(gè)系統(tǒng)能否以可持續(xù)的成本跑起來。CPU憑借其在分支預(yù)測(cè)、內(nèi)存擴(kuò)展和并發(fā)控制上的架構(gòu)優(yōu)勢(shì),從單純的調(diào)度中樞躍升為承載控制邏輯與記憶體系的核心資源池。

海外大廠的堆核競(jìng)賽只是這場(chǎng)變局的外顯征兆。其共同指向一個(gè)清晰方向:面向大規(guī)模、長(zhǎng)周期運(yùn)行的代理式AI負(fù)載,超多核CPU正成為成本與能效的關(guān)鍵平衡點(diǎn)。可以預(yù)見,隨著Agent商業(yè)化的深入,算力體系的評(píng)判標(biāo)準(zhǔn)將被部分改寫——異構(gòu)計(jì)算的天平不再一味向GPU傾斜,CPU正以更加主動(dòng)的姿態(tài),參與定義下一代AI基礎(chǔ)設(shè)施的形態(tài)與邊界。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
面多加水,水多加面?外媒痛批:電車3噸重,填鴨式造車不可取!

面多加水,水多加面?外媒痛批:電車3噸重,填鴨式造車不可取!

少數(shù)派報(bào)告Report
2026-04-17 07:03:05
俞強(qiáng)聲叛逃美國始末:一場(chǎng)美人計(jì),讓諜王37年潛伏功虧一簣

俞強(qiáng)聲叛逃美國始末:一場(chǎng)美人計(jì),讓諜王37年潛伏功虧一簣

干史人
2026-04-14 15:05:03
別再尬演“萬人迷”!滿臉褶子疙瘩、鼻孔朝天,這皮囊能迷倒誰?

別再尬演“萬人迷”!滿臉褶子疙瘩、鼻孔朝天,這皮囊能迷倒誰?

雨月海星
2026-04-18 05:25:40
太難了!青島一公司全員降薪,高至20%,稱無力承擔(dān)新增繳費(fèi)成本

太難了!青島一公司全員降薪,高至20%,稱無力承擔(dān)新增繳費(fèi)成本

火山詩話
2026-04-18 07:01:26
NBA內(nèi)部人士:巴特勒的忠誠度將在勇士隊(duì)繁忙的休賽期受到考驗(yàn)

NBA內(nèi)部人士:巴特勒的忠誠度將在勇士隊(duì)繁忙的休賽期受到考驗(yàn)

好火子
2026-04-19 05:57:29
Claude Design連夜突襲,F(xiàn)igma市值瞬間蒸發(fā)!或搶走全球UI設(shè)計(jì)師飯碗

Claude Design連夜突襲,F(xiàn)igma市值瞬間蒸發(fā)!或搶走全球UI設(shè)計(jì)師飯碗

新智元
2026-04-18 12:55:26
出大事了,特朗普癡呆已晚期?和伊朗開戰(zhàn),竟是內(nèi)塔尼亞胡的圈套

出大事了,特朗普癡呆已晚期?和伊朗開戰(zhàn),竟是內(nèi)塔尼亞胡的圈套

阿紿聊社會(huì)
2026-04-19 04:44:48
訪華門票來之不易,特朗普兒子兒媳齊上陣,為以后發(fā)展提前鋪路?

訪華門票來之不易,特朗普兒子兒媳齊上陣,為以后發(fā)展提前鋪路?

浪子阿邴聊體育
2026-04-18 05:14:39
“窮人過生日的模板”,19歲男孩生日宴火了,家長(zhǎng)費(fèi)盡心思反被嘲

“窮人過生日的模板”,19歲男孩生日宴火了,家長(zhǎng)費(fèi)盡心思反被嘲

妍妍教育日記
2026-04-18 08:15:03
對(duì)高市不再留情,中方全面斷供開始!30國代表赴日,岸田重新出山

對(duì)高市不再留情,中方全面斷供開始!30國代表赴日,岸田重新出山

娛樂圈的筆娛君
2026-04-19 04:35:26
阿拉格齊闖下大禍,伊朗內(nèi)部爆發(fā)沖突,革命衛(wèi)隊(duì)宣布:有條件封海

阿拉格齊闖下大禍,伊朗內(nèi)部爆發(fā)沖突,革命衛(wèi)隊(duì)宣布:有條件封海

丁鸊驚悚影視解說
2026-04-18 20:13:02
中超積分榜:蓉城繼續(xù)領(lǐng)跑,英博四連勝升第三,國安積分清零

中超積分榜:蓉城繼續(xù)領(lǐng)跑,英博四連勝升第三,國安積分清零

懂球帝
2026-04-18 22:15:11
陪玩陪睡已淘汰!繼關(guān)曉彤風(fēng)波、注射不明物后,娛樂圈再曝潛規(guī)則

陪玩陪睡已淘汰!繼關(guān)曉彤風(fēng)波、注射不明物后,娛樂圈再曝潛規(guī)則

阿纂看事
2026-04-16 19:31:39
5-6!小蜘蛛絕平+失點(diǎn),馬競(jìng)難破5年冠軍荒,皇家社會(huì)爆冷奪冠

5-6!小蜘蛛絕平+失點(diǎn),馬競(jìng)難破5年冠軍荒,皇家社會(huì)爆冷奪冠

我的護(hù)球最獨(dú)特
2026-04-19 06:01:32
專家呼吁:馬上停用5種調(diào)味醬,它是腸癌催化劑!再下飯也別沾

專家呼吁:馬上停用5種調(diào)味醬,它是腸癌催化劑!再下飯也別沾

路醫(yī)生健康科普
2026-04-18 16:18:55
不得不說,這個(gè)大姐年輕時(shí)候,肯定是一個(gè)美人胚子!

不得不說,這個(gè)大姐年輕時(shí)候,肯定是一個(gè)美人胚子!

TVB的四小花
2026-04-19 00:51:05
王志文安排好后事僅4月,擔(dān)心事發(fā)生,私生活被扒,王寶強(qiáng)拒和解

王志文安排好后事僅4月,擔(dān)心事發(fā)生,私生活被扒,王寶強(qiáng)拒和解

白面書誏
2026-04-16 18:04:33
NBA戰(zhàn)報(bào):騎士126-113猛龍,米切爾32+3+4

NBA戰(zhàn)報(bào):騎士126-113猛龍,米切爾32+3+4

懂球帝
2026-04-19 03:54:27
為什么感覺快遞員、外賣員、保安員等工作人員越來越不能投訴了?

為什么感覺快遞員、外賣員、保安員等工作人員越來越不能投訴了?

黯泉
2026-04-18 16:24:10
吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

以茶帶書
2026-04-15 17:30:12
2026-04-19 06:35:00
藍(lán)鯨新聞 incentive-icons
藍(lán)鯨新聞
財(cái)經(jīng)信息服務(wù)平臺(tái)
130675文章數(shù) 193830關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

伊朗革命衛(wèi)隊(duì)向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊(duì)向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

體育要聞

時(shí)隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

財(cái)經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬元起

態(tài)度原創(chuàng)

時(shí)尚
教育
數(shù)碼
本地
家居

選對(duì)發(fā)型,真的能少走很多變美彎路

教育要聞

杭州老師解讀古人如何說愛你,陌上花開,可緩緩歸矣

數(shù)碼要聞

華為版的科技春晚來了!Pura 90/Pura X Max下周發(fā):陣容豪華

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

家居要聞

法式線條 時(shí)光靜淌

無障礙瀏覽 進(jìn)入關(guān)懷版