![]()
記者 鄭晨燁
6月1日,英偉達在臺北電腦展期間舉辦的GTC Taipei 2026大會上發布了Vera CPU,其同期發布的新一代AI超算平臺Vera Rubin,首批客戶包括OpenAI和Anthropic。
這是英偉達第一次推出獨立的CPU產品線,英偉達過去20年的增長幾乎完全建立在GPU之上。英偉達CEO黃仁勛在發布會上表示,在AI智能體時代,CPU已經成為數據中心性能的關鍵瓶頸,不能讓CPU拖慢AI工廠的token(詞元)生產速度。
此前的5月份,AMD CEO蘇姿豐在財報電話會上宣布,將服務器CPU的市場規模預測從600億美元翻倍上調至1200億美元以上,對應2025至2030年的復合年增長率從18%提高到35%。
根據IDC統計,2025年全球服務器市場規模達到4441億美元,同比增長80.4%,其中AI服務器貢獻了大部分增量。瑞銀在近期的半導體行業研報中預測,服務器CPU的潛在市場規模將從2025年的約300億美元增長到2030年的約1700億美元,5年增長近5倍。
市場調研機構 Mercury Research的數據顯示,2026年一季度AMD的服務器CPU收入份額達到46.2%,英特爾為53.8%。但AMD的出貨量份額只有33.2%,英特爾仍占到66.8%。也就是說,AMD用更少的芯片創造了更高的收入,高核數產品的溢價能力在這一個季度得到集中體現。
芯片說ICTIME首席分析師林美炳告訴經濟觀察報,CPU是當前這一輪AI周期里最超預期的變量。AI從對話走向Agent(智能體),推理對CPU的需求量已經超過訓練。
GPU在“等”CPU
英特爾與佐治亞理工學院在2025年11月聯合發表了題為《以CPU為中心的智能體AI視角(A CPU-Centric Perspective on Agentic AI)》的論文。在這篇論文中,研究團隊對五類典型的Agent工作負載進行了實測,結果顯示CPU端工具處理所占用的時間,達到總延遲的43.8%到90.6%。
一位長期跟蹤半導體板塊的券商分析師稱,在大模型訓練階段,CPU的工作量占比大約只有一到三成,某些工作負載可能達到近四成,絕大部分計算由GPU承擔。這是因為AI大模型訓練的計算過程高度規整,數以億計的參數在海量數據上反復做矩陣乘法,GPU的并行架構就是為這類任務設計的,CPU在其中負責數據加載、通信調度和結果拷貝,不涉及核心的矩陣運算。
但到了推理階段,這個比例開始翻轉。CPU承擔的工作量占比上升到七成以上,Agent場景下會更高。因為Agent任務需要多步推理、調用外部工具、執行代碼、讀寫數據庫、搜索網頁,然后將中間結果編排成最終輸出。
編程助手、數據分析工具、自動化研究Agent都屬于這一類,也是目前大模型應用中增長最快的場景。這些工作的共同特征是控制流密集、分支復雜、輸入輸出頻繁,GPU面對這類串行、碎片化的任務利用率會明顯下降。
多位業內人士表示,在Agent任務中,GPU的整體利用率普遍不到50%,遠低于傳統推理服務的70%到85%。Agent方式下AI部署的token消耗量通常是普通對話的20到30倍,因為一次用戶交互背后往往包含數十次工具調用和中間推理。
據IDC預計,全球Agent年執行任務數將從2025年的約440億次增長到2030年的超過400萬億次。
英特爾管理層在2026年一季度財報電話會上表示,AI智能體時代每吉瓦功耗所需的CPU核心數可能從當前的約3000萬增長到1.2億。市場研究機構Gartner也預測,到2027年將有40%的Agent項目因基礎設施成本超支而被收縮或取消,其中相當一部分超支來自CPU端持續產生的工具調用和上下文管理開銷。
Agent在處理長對話和復雜任務時會產生大量中間數據。AI系統在推理過程中需要記住之前所有的對話內容和工具調用結果,行業術語叫KV Cache(鍵值緩存),它會隨著對話輪次不斷膨脹,但GPU自帶的存儲容量非常有限,英偉達H100只有80GB,下一代B200也只有192GB,一個復雜的Agent任務產生的中間數據很容易就超過這個上限。
目前,業界普遍采用的辦法是把這些中間數據從GPU轉移到CPU一側。CPU可以外掛DDR5內存,單顆容量達到數TB,比GPU存儲大出一到兩個數量級。
由英特爾、AMD、ARM等芯片廠商組成的CXL行業聯盟在2025年11月發布了CXL 4.0協議(Compute Express Link,一種用于芯片之間高速互聯的開放標準),允許多顆CPU共享同一個大容量內存池,減少數據在芯片之間搬運的開銷。
由此,CPU不再只負責任務調度,還要負責AI推理過程中的數據存儲和內存管理。
北京清微智能科技股份有限公司研發副總裁李彬稱,當AI算力集群擴展到數千顆芯片直連的超節點規模時,芯片之間的互聯和調度復雜度呈指數級增長,清微智能的方案已經可以實現4096顆芯片直連,互聯成本較傳統方案大幅降低。
李彬說,超節點技術本身并不新,是大模型的參數規模增長讓這類架構有了用武之地,在這種規模的集群中,CPU承擔的協調和管理工作量遠超小規模部署。
另外,CPU本身在過去幾年也經歷了密集的技術升級。服務器CPU的核心數從2017年的28核,攀升到2026年的288核(英特爾Clearwater Forest) 和 256 核(AMD Venice),密度提升接近10倍。
英特爾在2023年引入了AMX(高級矩陣擴展)指令集,讓CPU第一次具備專用矩陣計算單元。根據英特爾方面的測試數據,在深度學習推理場景下,搭載AMX的第四代至強處理器AI性能較前一代最高提升近10倍。內存子系統也從DDR4升級到DDR5,單平臺帶寬和容量均實現翻倍。
核心數和指令集的升級,也對應著CPU與GPU配比的變化。英特爾CEO陳立武在2026年一季度財報電話會上說,訓練場景下通常是7到8顆GPU配1顆CPU,推理場景下收斂到3到4顆GPU配1顆CPU,Agent場景下有望進一步收斂至1:1。
英特爾CFO大衛·辛斯納(David Zinsner)在同一場電話會上補充表示,行業整體的CPU與GPU配比已從過去的1:8收斂至約1:4。
十多年來首次大漲價
上述配比變化已經傳導到產品定價上。
深圳一家CPU經銷商的市場負責人賈彬告訴記者,從2026年2月起,英特爾和AMD陸續上調了全系列服務器CPU價格,整體漲幅在10%到15%之間,部分高端AI服務器CPU的現貨溢價更高,下半年可能會有新一輪價格上調。
賈彬說,過去十多年,服務器CPU基本是“加量不加價”,性能隨制程提升,但單價維持不變,今年的漲價幅度在行業里很少見。英特爾主力產線的產能利用率已經從此前不足80%上升到100%,多個型號處于缺貨狀態,交貨周期在3到4個月。
AMD同樣面臨產能緊張。賈彬說,2026年是他入行以來第一次看到英特爾和AMD的服務器CPU產能基本被全部訂滿,“過去CPU的供給一直是充足的,今年反過來了”。
賈彬還注意到,客戶在采購AI服務器時對CPU的需求正在分化成兩類。一類是機柜內部配合GPU運算的CPU,追求極限核數,128核以上,均價在4000美元以上,傳統服務器CPU均價只有2000多美元。另一類是機柜外部獨立部署的CPU,用于Agent的工具執行、沙箱運行和任務編排,不需要極限性能,64核左右就夠,但數量要大得多。
賈彬說,每個Agent任務在理想狀態下獨占一顆CPU,獨立部署比虛擬化分區效率更高,柜外CPU均價約3000美元,“核數越高單價漲幅越大,不是按比例增長的。所以,柜外用中檔產品鋪量,柜內用旗艦產品保性能,是目前客戶的普遍做法”。
美銀證券在6月11日發布的一份題為《智能體崛起(Rise of the Agents)》的半導體行業研報中,將2030年服務器CPU的總潛在市場規模(TAM)預測上調至1700億美元以上,并首次將這個市場拆成三個部分:傳統云計算CPU約300億美元,AI集群頭節點CPU約700億美元,AI智能體獨立節點CPU約700億美元。其中,第三個部分在2025年的規模接近于零,是2026年才開始出現的全新市場。
摩根士丹利在6月4日的一份研報中也預測,智能體AI將在2030年前為服務器CPU市場帶來325億至600億美元的新增需求。中泰證券在6月7日發布的CPU深度研報中將2026年定義為“CPU受益AI放量的元年”。
上述美銀證券研報還列出了一組出貨量的歷史對比:2022年AI CPU的出貨量相當于AI加速器(GPU等)出貨量的19%,到2025年這個比例升至51%,預計2030年將達到127%。按照這個預測,AI服務器中CPU的數量將在5年內超過GPU。
國產CPU的新需求
英偉達在臺北電腦展期間公布的信息顯示,其最新發布的Vera CPU基于ARM架構(一種以低功耗和高能效著稱的CPU指令集,與x86并列為兩大主流架構),單機柜可部署256顆,采用液冷散熱。
在Agent沙箱場景中,Vera的性能是x86處理器的1.8倍。在英偉達最新發布的Vera Rubin超級計算集群(英偉達下一代AI數據中心平臺)中,一個40機架的POD(由多個機架組成的最小完整計算單元)包含1152顆Rubin GPU和最多1088顆Vera CPU,兩者配比接近1:1。
英偉達方面還提到,此前發布的Grace CPU已累計出貨近250萬顆,2026年CPU相關收入有望接近200億美元。
賈彬認為,上述200億美元的統計口徑較寬,涵蓋了CPU在多種產品形態中的收入歸屬,與傳統意義上單獨銷售CPU芯片的收入不完全相同。但即便考慮口徑差異,對一個2024年還沒有獨立CPU業務的公司來說,這個體量已經不小。
林美炳認為,英偉達做CPU的信號意義大于產品本身,過去AI服務器以GPU為核心,CPU只是配套,當全球最大的GPU公司親自做CPU并把首批客戶鎖定為OpenAI和Anthropic,CPU的市場地位已經和兩年前完全不同。
根據AMD2026年一季度財報,該公司數據中心業務收入達到57.75億美元,首次超過英特爾同期的51億美元。并且,蘇姿豐在財報電話會上提出了一個五年目標:數據中心年營收邁向1000億美元。
英特爾CEO陳立武也在多個公開場合表示,他對CPU在AI時代的核心作用抱有堅定信心。
這對中國的CPU產業鏈企業也是一個機會。賈彬稱,國內頭部云廠商今年在加大服務器CPU的采購力度,一方面是為新建AI數據中心配套GPU采購CPU,另一方面是因為CPU與GPU的配比從過去的1:8收斂到1:4甚至更高,同一個數據中心需要的CPU數量比去年多出一倍以上。
事實上,在國內,圍繞服務器CPU已經形成了相對完整的產業鏈。
海光信息(688041.SH)是目前國內x86架構服務器CPU出貨量最大的廠商之一。根據相關財報,海光信息2025年的營收為143.77億元,同比增長 56.92%;2026年一季度營收為40.34億元,同比增速進一步提高到68.06%。
海光信息副總裁應志偉告訴記者,AI算力競爭已經從單一芯片的性能比拼轉向系統級協同。海光是國內少數同時具備高端通用CPU和DCU(AI加速器)兩條產品線的芯片設計公司,兩條產品線的協同可以覆蓋AI訓練和推理的全場景需求。海光C86系列CPU(兼容x86指令集)目前也已構建起超過6000家合作伙伴的國產開放生態。
應志偉表示,商業領域超過九成的存量應用基于x86架構開發,這種生態兼容性是海光在信創替換中的核心優勢。另外,除了數據中心,邊緣推理和具身智能也正在成為x86 CPU的新增量場景。比如,優必選、宇樹等機器人廠商的主流方案目前仍以x86 CPU搭配GPU為主,x86的軟件生態在具身智能領域的先發優勢明顯。
根據公開信息,華為鯤鵬走ARM全棧自研路線,鯤鵬920/950與昇騰AI芯片深度協同,主要服務華為自有生態和信創市場。
在配套芯片方面,瀾起科技(688008.SH)的主營產品是內存接口芯片(服務器CPU與內存條之間的信號中轉芯片)。根據公開信息,其內存接口芯片在2024年以36.8%的市場份額位居全球第一;另一條產品線PCIe Retimer芯片(用于高速數據傳輸中的信號放大和修復),2024年全球市場份額為10.9%,排名第二。
在封測制造環節,根據公開信息,通富微電(002156.SZ)是AMD在全球范圍內最重要的封測合作伙伴之一。
李彬告訴記者,國產芯片的軟件生態正在接近一個臨界點。他舉了一個例子:DeepSeek V4發布當天,多家國產芯片廠商在同一天內完成了適配,而此前DeepSeek R1的適配周期需要1到2個月。適配速度的大幅加快說明國產芯片的軟件工具鏈和驅動層正在快速成熟,這對整個國產CPU和加速器產業鏈都是利好。
在林美炳看來,國產CPU的受益邏輯分為兩層:一層是全球服務器CPU需求增長帶來的行業增長,另一層是信創政策驅動的國產替代。
根據國資委2022年下發的相關文件要求,央國企要在2027年底前完成信息化系統的國產化改造。記者在采訪過程中也了解到,國內高端服務器CPU的國產化率目前仍較低,替代空間廣闊。距離政策節點還有不到2年時間,信創CPU的交付窗口正在收窄,這對海光信息、龍芯中科(688047.SH)等國產CPU廠商的產品成熟度和出貨能力都是一次集中檢驗。
林美炳認為,當前這一輪CPU漲價周期和過去不同,增量來自AI Agent對CPU的全新需求,而非制程升級帶動的換代需求。
應志偉的判斷類似。他說,過去幾年市場的注意力幾乎全部集中在GPU上,但當AI應用真正進入大規模落地階段,CPU承擔的調度和管理職能只會越來越重。在他看來,這不是CPU要取代GPU,GPU依然重要,但接下來真正拉開差距的是CPU和GPU之間的協同能力,而非單顆芯片的性能參數。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.