網易首頁 > 網易號 > 正文 申請入駐

配比從1:8變1:1,被低估的CPU正成為AI新瓶頸

0
分享至

AI算力競賽的焦點,正在悄然從GPU轉向一個長期被忽視的角色——CPU。

隨著AI智能體和強化學習(RL)工作負載的爆發式增長,CPU在數據中心的戰略地位正經歷結構性重估。知名半導體分析機構SemiAnalysis首席分析師Dylan Patel在4月8日的一次深度訪談中直言,AI工作負載的范式正從簡單的文本生成向復雜的智能體和強化學習演進,CPU正面臨"極其嚴重的產能短缺"。

市場研究機構TrendForce的最新報告印證了這一判斷:當前AI數據中心的CPU與GPU配比約為1:4至1:8,而在智能體AI時代,這一比例預計將演變至1:1至1:2。


這一結構性轉變已在供需兩端引發連鎖反應。Intel和AMD已于2026年第一季度末對部分CPU產品線提價。與此同時,英偉達和Arm雙雙于2026年3月宣布進軍服務器CPU市場——一家GPU巨頭與一家IP授權商在同一個月做出相同選擇,絕非巧合,而是市場信號的集中釋放。

智能體崛起,CPU從配角變瓶頸

在AI發展的早期階段,CPU的角色相當邊緣。Dylan Patel將其描述為:"負載很輕。你發一個字符串,它回一個字符串,簡單的推理,對CPU需求不大。"彼時,GPU憑借其大規模并行矩陣運算能力主導了AI算力需求,CPU僅承擔向GPU壓縮和路由內存數據的輔助職能。

然而,以OpenAI o1為代表的新一代推理模型,以及隨之興起的AI智能體架構,從根本上改變了這一格局。與靜態大語言模型不同,智能體AI需要動態與環境交互——規劃任務、調用工具、在子智能體之間傳遞數據、評估任務是否完成。這一"編排層"(Orchestration)的全部協調工作,恰恰落在CPU肩上,使其成為典型的CPU密集型負載。

2025年11月發布的學術論文《A CPU-Centric Perspective on Agentic AI》進一步量化了這一壓力:在智能體AI場景中,CPU工具處理(包括Python解釋、網頁爬取、詞法摘要、數據庫檢索等)產生的延遲,可占總延遲的高達90.6%;在大批量處理場景下,CPU動態能耗可達系統總動態能耗的44%。

Arm的測算則從容量角度揭示了需求缺口的量級:傳統AI數據中心每吉瓦(GW)約需3000萬顆CPU核心,而在智能體AI時代,這一需求將激增至1.2億顆——增幅達四倍。


Intel承壓,AMD乘勢擴張

CPU需求的結構性上升,首先在傳統x86市場引發了格局重塑。

Intel的Xeon處理器曾長期占據數據中心CPU市場逾95%的份額。這一統治地位自2021年起開始松動——Intel 7制程的良率問題導致Xeon Sapphire Rapids發布延遲近兩年,為AMD的EPYC Milan打開了市場缺口。

2026年,Intel計劃推出兩款旗艦產品:采用Darkmont架構的Xeon 6+(Clearwater Forest),擁有288核/288線程,TDP約450W;以及采用Panther Cove-X架構的Xeon 7(Diamond Rapids),最高256核/256線程,TDP高達650W。兩款產品均基于Intel最先進的18A制程,并首次引入Foveros Direct混合鍵合技術。然而,TrendForce指出,受18A制程良率問題持續困擾,兩款產品的量產時間均可能推遲至2027年。

相比之下,AMD的節奏更為穩健。其2026年旗艦產品EPYC Venice將采用臺積電N2制程、Zen 6架構,并搭載CoWoS-L與SoIC先進封裝,通過同步多線程(SMT)技術實現256核/512線程——線程數為當前市場最高。TrendForce預計,AMD將在2026年持續從Intel手中蠶食市場份額。

英偉達、Arm強勢入局,競爭格局重寫

傳統x86雙雄之外,一批非傳統玩家正以前所未有的速度涌入服務器CPU賽道,從根本上改寫競爭格局。

2026年3月,英偉達宣布將Vera CPU作為獨立產品對外銷售,以滿足客戶對更靈活CPU:GPU配置的需求。Vera采用英偉達自研Olympus架構,基于臺積電N3制程與CoWoS-R封裝,提供88核/176線程,并配備1.8 TB/s的NVLink-C2C互聯,可與英偉達GPU實現內存共享。首批合作伙伴涵蓋Alibaba、ByteDance、Cloudflare、CoreWeave、Oracle等。英偉達還推出了Vera CPU機架,單機架集成256顆CPU,合計22,528核/45,056線程,總內存達400 TB。


同月,Arm宣布推出首款自研CPU產品Arm AGI CPU,終結了其35年純授權商的歷史定位。該產品基于臺積電N3制程與Neoverse V3架構,提供136核/136線程,TDP為300W,支持DDR5-8800內存與PCIe Gen6。首批合作伙伴包括Meta、OpenAI、Cerebras、Cloudflare、SK Telecom等。Arm同步推出兩款機架配置:風冷版集成60顆AGI CPU(8,160核,約180 TB內存),液冷版則支持336顆CPU(45,696核,1 PB內存)。

主要云服務商(CSP)同樣加速布局自研CPU。AWS于2025年12月發布基于臺積電N3制程的Graviton5(192核/192線程),并與自研Trainium 3 AI ASIC協同部署以降低AI計算成本;微軟于2025年11月推出Cobalt 200(N3制程,132核/132線程);谷歌則計劃于2026年推出Axion C4A.metal裸金屬版本及下一代Axion N4A,主打最高性價比。

IC后端設計服務商迎來增量機遇

非傳統玩家的大規模入場,正在為IC后端設計服務商創造可觀的增量業務。

TrendForce指出,AWS目前仍堅持自主完成CPU后端設計,而谷歌和微軟均已將CPU后端設計服務外包給創意電子(Global Unichip Corp.,GUC)。隨著更多CSP和新興CPU廠商加入市場,這一外包需求有望持續擴大。

TrendForce預計,2026年至2028年間,Broadcom、Marvell、GUC、Alchip、聯發科等ASIC設計服務商將陸續承接來自上述客戶的新增項目。對于尋找AI基礎設施投資新切口的市場參與者而言,這一環節或許正是GPU熱潮之外,尚未被充分定價的結構性機遇。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
24勝0負,火箭被逼入絕境!申京恐步杰倫格林后塵3大交易目標出爐

24勝0負,火箭被逼入絕境!申京恐步杰倫格林后塵3大交易目標出爐

鍋子籃球
2026-04-25 08:37:46
伯恩利“幫”了阿森納一把,爭冠懸念又回來了?

伯恩利“幫”了阿森納一把,爭冠懸念又回來了?

樂道足球
2026-04-24 12:01:43
72歲王健林,被逼到崩潰邊緣......

72歲王健林,被逼到崩潰邊緣......

酷溫coolwin
2026-04-24 16:46:47
G3也是他的生死之戰!火箭可能考慮交易申京:三大潛在目標曝光

G3也是他的生死之戰!火箭可能考慮交易申京:三大潛在目標曝光

羅說NBA
2026-04-24 21:03:59
58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

墨印齋
2026-04-24 16:43:38
才播了三期,就說他倆一定會離?

才播了三期,就說他倆一定會離?

橘子娛樂
2026-04-24 21:14:22
觀察|團結還是分裂?新舊秩序交疊下的伊朗政權謎題

觀察|團結還是分裂?新舊秩序交疊下的伊朗政權謎題

澎湃新聞
2026-04-25 07:16:34
親手送吳亦凡入獄5年后,都美竹迎噩耗,法院出手或使其飯碗不保

親手送吳亦凡入獄5年后,都美竹迎噩耗,法院出手或使其飯碗不保

老吳教育課堂
2026-04-25 01:00:44
演員脫掉和服才向觀眾鞠躬致謝,本人回應:撕掉這層皮,做回真真正正中國人

演員脫掉和服才向觀眾鞠躬致謝,本人回應:撕掉這層皮,做回真真正正中國人

臺州交通廣播
2026-04-23 22:50:01
大鬧亞航的假空姐社會性死亡!“底褲”被扒,正臉流出,十級美顏

大鬧亞航的假空姐社會性死亡!“底褲”被扒,正臉流出,十級美顏

翰飛觀事
2026-04-24 19:39:03
什么是美?這群北體青年給出了最“不設限”的答案

什么是美?這群北體青年給出了最“不設限”的答案

網易新聞出品
2026-04-24 15:59:19
刷屏!DeepSeek V4成本暴降73%,梁文鋒聯手華為寒武紀,源神歸位全體起立

刷屏!DeepSeek V4成本暴降73%,梁文鋒聯手華為寒武紀,源神歸位全體起立

智東西
2026-04-24 13:08:45
日本網友瘋換中文手機界面,直呼清爽十倍,中國文化悄悄出圈!

日本網友瘋換中文手機界面,直呼清爽十倍,中國文化悄悄出圈!

行者聊官
2026-04-24 20:48:30
歷史第1次:美元占半壁江山!全球支付:歐元僅21%,人民幣呢?

歷史第1次:美元占半壁江山!全球支付:歐元僅21%,人民幣呢?

財說得明白
2026-04-24 09:36:40
世錦賽25凌晨戰報,4-4,9-7,趙心童丁俊暉難分勝負,艾倫領先

世錦賽25凌晨戰報,4-4,9-7,趙心童丁俊暉難分勝負,艾倫領先

林子說事
2026-04-25 03:56:49
陳首富終究吞不下云南白藥 | 棱鏡

陳首富終究吞不下云南白藥 | 棱鏡

新浪財經
2026-04-24 17:04:15
近7場1勝 皇馬球迷貼面怒罵球員:不知羞恥 姆巴佩用帽遮臉+逃離

近7場1勝 皇馬球迷貼面怒罵球員:不知羞恥 姆巴佩用帽遮臉+逃離

我愛英超
2026-04-25 07:46:50
泡泡瑪特:4月30日發售兩款Labubu冰箱,售價5999元,每款全球限量發售999臺

泡泡瑪特:4月30日發售兩款Labubu冰箱,售價5999元,每款全球限量發售999臺

魯中晨報
2026-04-24 20:08:07
伊朗:外長訪巴不涉核談事宜,僅為討論雙邊關系;核問題仍是伊朗堅守的紅線之一

伊朗:外長訪巴不涉核談事宜,僅為討論雙邊關系;核問題仍是伊朗堅守的紅線之一

魯中晨報
2026-04-25 07:40:02
嫁給諶龍后,國羽女神生下一娃,如今實現財富自由,已是北體博士

嫁給諶龍后,國羽女神生下一娃,如今實現財富自由,已是北體博士

秋姐居
2026-04-24 19:44:29
2026-04-25 09:07:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領先的金融商業信息提供商
145142文章數 2653361關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

兩屆奧運冠軍、中國羽協主席張軍"失聯" 知情人士發聲

頭條要聞

兩屆奧運冠軍、中國羽協主席張軍"失聯" 知情人士發聲

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強一季

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經要聞

LG財閥內斗:百億美元商業帝國爭奪戰

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態度原創

家居
教育
數碼
健康
公開課

家居要聞

自然肌理 溫潤美學

教育要聞

“只顧自己紋眉,不管女兒死活?”14歲女孩生日照,臉上全是槽點

數碼要聞

古爾曼:蘋果正研發MacBook Ultra,外觀重大升級、首搭OLED屏幕

干細胞如何讓燒燙傷皮膚"再生"?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版