亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

別卷GPU了!當(dāng)下真正卡脖子的,是CPU

0
分享至



圖片由AI生成

文|李海倫

編輯|徐青陽

在AI狂飆的這些年里,行業(yè)幾乎被一條邏輯主導(dǎo):算力決定上限,而GPU就是算力的核心。

不過,進入2026年,這套邏輯開始變動:模型推理不再是唯一瓶頸,系統(tǒng)性能越來越取決于執(zhí)行與調(diào)度能力。GPU依然重要,但決定AI“能不能跑起來”的關(guān)鍵,正逐漸轉(zhuǎn)向長期被忽視的CPU

美國當(dāng)?shù)貢r間4月9日,谷歌與英特爾達成多年協(xié)議,在全球AI數(shù)據(jù)中心規(guī)模部署英特爾的“Xeon至強處理器”,正是為了破解這個瓶頸。英特爾CEO陳立武直言,AI運行在整個系統(tǒng)上,CPU和IPU才是性能、效率和靈活性的關(guān)鍵。換句話說,過去兩年被當(dāng)作“配角”的CPU,正在卡住AI擴展的“脖子”。


英特爾CEO陳立武在社交媒體表示:英特爾正與谷歌深化合作,從傳統(tǒng)CPU擴展到AI基礎(chǔ)設(shè)施(如IPU),共同推進AI與云計算能力建設(shè)。

CPU不再只是一個被動的配套組件,而正在成為AI基礎(chǔ)設(shè)施中的關(guān)鍵變量之一。

01
一場“悄無聲息”的供應(yīng)危機

當(dāng)大家都在盯著GPU的交貨周期時,CPU市場的緊張氣氛已經(jīng)悄然拉滿。

根據(jù)多家IT分銷商的最新報告,2025年第四季度,服務(wù)器CPU的平均售價上漲了約30%。這種漲幅在相對成熟的CPU市場是非常罕見的。

AMD數(shù)據(jù)中心負責(zé)人福雷斯特·諾羅德(Forrest Norrod)透露,過去三個季度,CPU需求的增長速度超乎想象。目前,AMD的交付周期已經(jīng)從原來的八周延長到了十周以上,部分型號甚至面臨長達六個月的延遲。

這種短缺主要由于“次級效應(yīng)”引發(fā)的資源擠兌。有業(yè)內(nèi)人士表示,由于臺積電的3nm生產(chǎn)線極其緊張,原本分配給CPU的晶圓產(chǎn)能,正不斷被利潤更高的GPU訂單擠占。這導(dǎo)致了一個極具諷刺意味的局面:AI實驗室擁有了足夠的GPU,卻發(fā)現(xiàn)市場上買不到足夠的頂級CPU來“帶”動這些顯卡。

在這一輪CPU搶購潮中,還有埃隆·馬斯克(Elon Musk)。

英特爾首席執(zhí)行官陳立武在社交平臺上證實,馬斯克已委托英特爾為其在得克薩斯州的“Terafab”項目設(shè)計并制造定制芯片。這個龐大的項目旨在為xAI、SpaceX和特斯拉提供統(tǒng)一的計算底座。

馬斯克對英特爾的信任,在很大程度上是因為英特爾正試圖將自己嵌入到從地面數(shù)據(jù)中心到太空軌道計算的每一個層面。


對于英特爾來說,這無疑是一劑強心針。有行業(yè)分析師預(yù)測AMD在服務(wù)器CPU市場的收入份額將在2026年超過英特爾,但英特爾在x86生態(tài)系統(tǒng)中的深厚慣性和制造能力,依然是馬斯克這類大客戶無法忽視的籌碼。

這種跨行業(yè)的深度捆綁,正讓CPU市場的競爭從單純的參數(shù)比拼,升級為生態(tài)系統(tǒng)和供應(yīng)鏈穩(wěn)定性的博弈。

02
為什么CPU會成為“短板”?

CPU突然成為瓶頸,核心是它需要承擔(dān)的工作,在智能體時代發(fā)生了根本性變化。

傳統(tǒng)聊天機器人模式中,CPU主要負責(zé)調(diào)度和數(shù)據(jù)處理,GPU承擔(dān)核心推理計算。由于計算密集型環(huán)節(jié)集中在GPU側(cè),整體延遲通常由GPU主導(dǎo),CPU很少成為性能瓶頸。

但智能體工作負載完全不同。一個智能體需要執(zhí)行多步推理、調(diào)用API、讀寫數(shù)據(jù)庫、編排復(fù)雜業(yè)務(wù)流,并將中間結(jié)果整合為最終輸出。搜索、API調(diào)用、代碼執(zhí)行、文件I/O和結(jié)果編排等任務(wù),大部分落在CPU和主機系統(tǒng)側(cè)。GPU負責(zé)token生成(即“思考”),而CPU負責(zé)將“思考”結(jié)果轉(zhuǎn)化為實際行動。

佐治亞理工學(xué)院學(xué)者在2025年11月發(fā)表的論文《以CPU為中心的智能體型AI視角》(A CPU-Centric Perspective on Agentic AI)中,對智能體工作負載中的延遲分布進行了量化分析。研究發(fā)現(xiàn),CPU端工具處理所占用的時間,占總延遲的50%至90.6%。在某些場景下,GPU已準備好處理下一批任務(wù),而CPU仍在等待工具調(diào)用返回。

另一個關(guān)鍵因素是上下文窗口的快速擴展。2024年,主流模型大多支持128K至200K token。進入2025年,Gemini 2.5 Pro、GPT-4.1、Llama 4 Maverick等模型均開始支持100萬token以上。KV緩存(Key-Value Cache,用于加速Transformers模型推理過程)隨token數(shù)量線性增長,在100萬token時約為200GB,遠超單塊H100的80GB顯存容量。

對于這類問題的解決方案之一是將KV緩存部分卸載至CPU內(nèi)存。這意味著CPU不僅要管理編排和工具調(diào)用,還要協(xié)助承載顯存放不下的數(shù)據(jù)。CPU內(nèi)存容量、內(nèi)存帶寬以及CPU與GPU之間的互連速度,由此成為系統(tǒng)性能的關(guān)鍵。

因此,適合智能體時代的CPU,更需要低延遲、一致的內(nèi)存訪問能力,以及更強的系統(tǒng)級協(xié)同能力,而不是單一的核心規(guī)模擴張。

03
廠商們都在做什么?有人搶地盤,有人改設(shè)計

面對這場突然爆發(fā)的CPU需求,幾家大廠的打法完全不同。

英特爾是傳統(tǒng)服務(wù)器CPU的老大。Mercury Research的數(shù)據(jù)顯示,2025年第四季度,英特爾在服務(wù)器CPU市場仍占60%的份額,AMD占24.3%,英偉達占6.2%。但英特爾這些年一直在追趕新技術(shù),這次CPU需求的爆發(fā)對他們來說,既是機會也是考驗。

英特爾現(xiàn)在的策略是兩條腿走路。一邊是繼續(xù)賣至強處理器,跟谷歌這樣的超大規(guī)模客戶深度綁定;另一邊跟SambaNova合作,推出基于至強處理器與其自研RDU加速器的組合方案,主打“不用GPU也能跑智能體推理”的賣點。至強6 Granite Rapids和18A工藝的路線圖,將是檢驗英特爾能否翻盤的關(guān)鍵。

AMD則是這次CPU需求爆發(fā)中最大的受益者之一。2025年第四季度,AMD數(shù)據(jù)中心收入54億美元,同比增長39%。第五代EPYC Turin占了服務(wù)器CPU收入的一半以上,運行EPYC的云實例部署同比增長超過50%。AMD的服務(wù)器CPU收入份額首次突破40%。

AMD CEO蘇姿豐(Lisa Su)把增長原因直接歸到了“智能體”的發(fā)展——智能體工作負載把任務(wù)“推回”到了傳統(tǒng)CPU任務(wù)上。

2026年2月,AMD還宣布了一項與Meta的潛在交易,價值超過1000億美元,供應(yīng)MI450 GPU和Venice EPYC CPU。

不過,AMD在系統(tǒng)級協(xié)同方面仍有提升空間,缺乏類似NVLink C2C這樣成熟的高速CPU-GPU互連能力。隨著智能體(Agent)系統(tǒng)對數(shù)據(jù)交互與協(xié)同效率要求不斷提高,這一環(huán)節(jié)的重要性也在逐步上升。

英偉達設(shè)計CPU的思路,跟英特爾和AMD完全不一樣。

英偉達Grace CPU只有72個核心,而AMD EPYC和英特爾至強通常是128個。英偉達AI基礎(chǔ)設(shè)施負責(zé)人迪昂·哈里斯(Dion Harris)解釋稱:“如果你是超大規(guī)模企業(yè),你希望最大化每個CPU的核心數(shù)量,這基本上會降低成本,即每核心的美元成本。所以這是一種商業(yè)模式。”

換句話說,在AI算力體系里,CPU的角色不再是通用計算主力,而是為GPU服務(wù)的“調(diào)度中樞”。如果CPU跟不上,昂貴的GPU就會被迫等待,整體效率反而下降。

因此,英偉達在設(shè)計上優(yōu)先保證CPU與GPU之間的高效協(xié)同。例如通過NVLink C2C互連,將CPU與GPU之間的帶寬提升到約1.8TB/s,遠高于傳統(tǒng)PCIe,CPU可以直接訪問GPU內(nèi)存,KV緩存管理一下子簡單了很多。

目前,英偉達已將Vera CPU作為獨立產(chǎn)品銷售。CoreWeave是第一個客戶。與Meta的交易更夸張,這是其第一次大規(guī)模“純Grace部署”,也就是CPU在沒有GPU配對的情況下大規(guī)模獨立部署。

研究機構(gòu)Creative Strategies首席分析師本·巴賈林(Ben Bajarin)指出,在高強度的系統(tǒng)協(xié)作中,CPU的處理能力必須能夠匹配加速器的迭代速度。如果數(shù)據(jù)通道出現(xiàn)哪怕百分之一的延遲,整個AI集群的經(jīng)濟效益就會大打折扣。這種對極致系統(tǒng)效率的追求,正迫使所有大廠重新審視CPU的性能指標。

Constellation Research副總裁兼首席分析師霍爾格·穆勒(Holger Mueller)表示,隨著AI工作負載向智能體驅(qū)動架構(gòu)轉(zhuǎn)變,CPU的地位正變得愈發(fā)核心。他指出:“在智能體世界中,智能體需要調(diào)用API和各類業(yè)務(wù)應(yīng)用程序,這些任務(wù)最適合由CPU來完成。”

他還補充道:“目前,關(guān)于GPU和CPU誰更適合處理推理任務(wù),尚無定論。GPU在模型訓(xùn)練方面占據(jù)優(yōu)勢,而像TPU這樣的定制ASIC也有其專長。但有一點是明確的:谷歌需要采用混合處理器架構(gòu)。因此,谷歌選擇與英特爾展開合作是合理的”。

04
結(jié)語:智能體時代,算力天平回擺

在最新的產(chǎn)業(yè)觀察中,一個數(shù)據(jù)需要我們注意。在亞馬遜AWS與OpenAI高達380億美元的合作協(xié)議中,其官方也明確提到了“數(shù)千萬個CPU”的擴展規(guī)模。

在過去幾年,通常情況下,行業(yè)的關(guān)注焦點總是那“數(shù)十萬個GPU”。然而,OpenAI等前沿實驗室主動將CPU規(guī)模作為一個重要的規(guī)劃變量,向外界傳遞了一個清晰的信號:智能體工作負載的擴展,必須建立在龐大的CPU基礎(chǔ)設(shè)施之上。

美國銀行預(yù)測,到2030年,全球CPU市場規(guī)模有望從目前的270億美元翻倍至600億美元。這多出來的份額,幾乎全部將由AI驅(qū)動。

我們正在見證一種全新的基礎(chǔ)設(shè)施開始擴張:大廠不再只堆GPU,而是同步擴張一整層“CPU調(diào)度基礎(chǔ)設(shè)施”,專門為AI智能體提供運行支撐。

英特爾與谷歌的聯(lián)手,以及馬斯克對定制芯片的重金投入,都在證明一個事實:AI競賽的制勝點正在前移。當(dāng)算力不再稀缺,誰能最先解決系統(tǒng)級的“瓶頸”,誰才能在這場萬億級的游戲中笑到最后。

*特約編譯金鹿對本文亦有貢獻。

—— 芯榜 ——

芯榜成立于 2015 年,是半導(dǎo)體垂直領(lǐng)域的產(chǎn)業(yè)媒體與數(shù)字化服務(wù)平臺。全網(wǎng)覆蓋超 100 萬垂直行業(yè)用戶,核心提供專業(yè)榜單發(fā)布、原創(chuàng)訪談、產(chǎn)業(yè)報告、峰會活動及研究咨詢等服務(wù)。已合作近千家半導(dǎo)體生態(tài)企業(yè),聯(lián)動多家基金公司與產(chǎn)業(yè)媒體,助力硬科技產(chǎn)業(yè)發(fā)展。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
3-1,申花鋒線雙煞火力全開 拉唐6場進7球 李金羽玩對攻策略有誤

3-1,申花鋒線雙煞火力全開 拉唐6場進7球 李金羽玩對攻策略有誤

替補席看球
2026-04-18 21:59:29
戰(zhàn)爭有多燒錢,網(wǎng)友說我講一下我家里的局部戰(zhàn)爭你就明白

戰(zhàn)爭有多燒錢,網(wǎng)友說我講一下我家里的局部戰(zhàn)爭你就明白

侃神評故事
2026-04-06 11:45:08
萬科跟投員工千人聯(lián)合簽名

萬科跟投員工千人聯(lián)合簽名

地產(chǎn)微資訊
2026-04-17 16:03:16
逆轉(zhuǎn)失敗!勇士無情淘汰!庫里16中4,太陽壓哨晉級,格林36+6

逆轉(zhuǎn)失敗!勇士無情淘汰!庫里16中4,太陽壓哨晉級,格林36+6

籃球掃地僧
2026-04-18 23:19:25
看上去像“公務(wù)員”,其實連編制都沒有的6個職業(yè)

看上去像“公務(wù)員”,其實連編制都沒有的6個職業(yè)

細說職場
2026-04-12 17:02:40
司法追殺升級!鄭麗文返臺即遭調(diào)查,蕭旭岑等藍營被系統(tǒng)性清算!

司法追殺升級!鄭麗文返臺即遭調(diào)查,蕭旭岑等藍營被系統(tǒng)性清算!

水豐侃侃
2026-04-17 16:33:56
看了小米和蔚來的定價,才明白小鵬GX錯失了多大的一盤棋

看了小米和蔚來的定價,才明白小鵬GX錯失了多大的一盤棋

科技Nice
2026-04-16 14:28:04
終于知道采購吃回扣是怎么被發(fā)現(xiàn)的了,網(wǎng)友分享真實,太開眼了

終于知道采購吃回扣是怎么被發(fā)現(xiàn)的了,網(wǎng)友分享真實,太開眼了

夜深愛雜談
2026-03-13 22:02:43
霍爾木茲海峽“重開”后,20多艘船只按美軍指示掉頭返回

霍爾木茲海峽“重開”后,20多艘船只按美軍指示掉頭返回

參考消息
2026-04-18 14:26:08
太猖狂!天津有人深夜“涉黃”被抓!抓捕細節(jié)曝光…

太猖狂!天津有人深夜“涉黃”被抓!抓捕細節(jié)曝光…

天津族
2026-04-18 07:32:54
深圳一小區(qū)入口插滿“金屬倒刺”!業(yè)主直呼簡單粗暴!物業(yè)道歉:已拆除

深圳一小區(qū)入口插滿“金屬倒刺”!業(yè)主直呼簡單粗暴!物業(yè)道歉:已拆除

南方都市報
2026-04-17 21:20:09
陶喆再一次證明,娶妻要娶年輕的,即使你老了,她還美得心曠神怡

陶喆再一次證明,娶妻要娶年輕的,即使你老了,她還美得心曠神怡

許三歲
2026-03-16 10:18:04
哈蘭德談今夜“天王山”:曼城必須拿下三分,自己會努力進球

哈蘭德談今夜“天王山”:曼城必須拿下三分,自己會努力進球

里芃芃體育
2026-04-18 12:00:25
再年輕也沒用!31歲美女空姐李旭怡去世,死因曝光,3年前才懷2胎

再年輕也沒用!31歲美女空姐李旭怡去世,死因曝光,3年前才懷2胎

哄動一時啊
2026-04-18 14:35:19
嫁富二代明星后,40歲再懷三胎,豪宅豪車生活

嫁富二代明星后,40歲再懷三胎,豪宅豪車生活

陶尋愛說
2026-04-12 21:58:52
季后賽開拓者對陣馬刺,楊瀚森能獲得出場機會嗎?答案或許很傷人

季后賽開拓者對陣馬刺,楊瀚森能獲得出場機會嗎?答案或許很傷人

愛體育
2026-04-18 23:15:01
性需求是人的活力來源,其實很多人都不知道

性需求是人的活力來源,其實很多人都不知道

加油丁小文
2026-04-07 23:21:28
突傳利空!巨頭被曝大裁員!

突傳利空!巨頭被曝大裁員!

中國基金報
2026-04-18 17:15:32
我醉后對女上司說:再扣工資我就娶了你,第二天她把我叫到辦公室

我醉后對女上司說:再扣工資我就娶了你,第二天她把我叫到辦公室

千秋文化
2026-04-16 20:15:29
陜西17歲女孩為100元,上了鄰居45歲大叔的床,懷胎6個月后被殺

陜西17歲女孩為100元,上了鄰居45歲大叔的床,懷胎6個月后被殺

莫地方
2026-04-17 15:10:22
2026-04-18 23:36:49
芯榜 incentive-icons
芯榜
中國芯片排行榜
4486文章數(shù) 3247關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

小車在高速上跑100碼 車主突然接到電話"你車輪沒了"

頭條要聞

小車在高速上跑100碼 車主突然接到電話"你車輪沒了"

體育要聞

時隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細節(jié)

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

教育
藝術(shù)
游戲
家居
親子

教育要聞

教育縱深 | 聚焦春招進行時

藝術(shù)要聞

耗資600億,貴陽人的“上海外灘”,現(xiàn)在去看,荒得嚇人

《刺客信條黑旗》重制版將至 你心中最帥刺客導(dǎo)師是誰

家居要聞

法式線條 時光靜淌

親子要聞

十個月轉(zhuǎn)眼就過去了,原來真的會懷念和寶寶合體的日子

無障礙瀏覽 進入關(guān)懷版