![]()
英特爾數(shù)據(jù)中心全線產(chǎn)品“秀肌肉”。
數(shù)據(jù)中心眼下是整個(gè)科技行業(yè)最熱鬧的賽道。
英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)連續(xù)多個(gè)季度創(chuàng)紀(jì)錄,AMD EPYC系列增長強(qiáng)勁,AI推理需求正在引爆一場算力軍備競賽。而在這個(gè)時(shí)間節(jié)點(diǎn),英特爾Intel 18A工藝正走向成熟,代工業(yè)務(wù)轉(zhuǎn)型進(jìn)入深水區(qū)。
今日,英特爾首次集中展示數(shù)據(jù)中心領(lǐng)域的全線產(chǎn)品——CPU、GPU、網(wǎng)卡,一樣不缺。這不只是產(chǎn)品的展示,更是戰(zhàn)略方向的發(fā)布。三件事交織在一起,讓這次發(fā)布會(huì)變成了一個(gè)觀察英特爾戰(zhàn)略走向的絕佳窗口。
![]()
至強(qiáng)6+:288核怪獸登場,18A工藝首秀
![]()
本次最重磅的產(chǎn)品,當(dāng)屬至強(qiáng)6+。
這是英特爾首次將Intel 18A制程工藝應(yīng)用于數(shù)據(jù)中心處理器。更重要的是,它采用了Foveros Direct 3D封裝技術(shù),將基于18A的計(jì)算晶片堆疊在Intel 3的基底晶片之上,再用EMIB技術(shù)完成互聯(lián)。整個(gè)封裝由29個(gè)組件構(gòu)成:12個(gè)計(jì)算晶片、3個(gè)Active基底晶片、2個(gè)I/O晶片、12個(gè)EMIB互聯(lián)Tile。
![]()
單處理器最多288個(gè)能效核。這是業(yè)界目前最高的核心密度。配合高達(dá)576MB的末級緩存(LLC,較上一代提升超過5倍)和8000 MT/s的DDR5內(nèi)存,內(nèi)存子系統(tǒng)實(shí)現(xiàn)了大幅升級。在主流工作負(fù)載下,整體性能最高提升至2.26倍,每瓦性能最高提升至1.55倍。與競品橫向比較,至強(qiáng)6+的每線程性能高出1.3倍,每線程每瓦性能同樣高出1.3倍。
18A工藝帶來了兩項(xiàng)關(guān)鍵技術(shù)升級:PowerVia實(shí)現(xiàn)更短、更直接的供電路徑,有效降低功耗;RibbonFET則在降低待機(jī)功耗的同時(shí)增強(qiáng)性能一致性。
![]()
一個(gè)比較直觀的數(shù)據(jù):與第二代至強(qiáng)相比,至強(qiáng)6+可實(shí)現(xiàn)9:1的服務(wù)器整合比,減少近80%的機(jī)架空間占用,同時(shí)降低73%的能耗。對于正在頭疼數(shù)據(jù)中心能耗和散熱問題的運(yùn)營商來說影響巨大。愛立信在真實(shí)運(yùn)營商部署中測試了至強(qiáng)6+的分組核心網(wǎng):與上一代E-core相比,相同內(nèi)核數(shù)量下性能提升30%,機(jī)架功耗降低38%,每瓦性能提升超過60%。
英特爾還帶來了一個(gè)全新的硬功能:Intel AET(應(yīng)用能效遙測技術(shù))。它可以在工作負(fù)載層級實(shí)時(shí)監(jiān)測CPU功耗,讓數(shù)據(jù)中心運(yùn)營商實(shí)現(xiàn)更精細(xì)的能效優(yōu)化和成本分?jǐn)偂υ品?wù)提供商和大型企業(yè)數(shù)據(jù)中心來說,這意味著更可控的TCO和更精準(zhǔn)的資源調(diào)度。
首款數(shù)據(jù)中心GPU,480GB顯存降維打擊
![]()
如果說至強(qiáng)6+是英特爾守住了基本盤,那Crescent Island就是他們第一次正式進(jìn)入數(shù)據(jù)中心GPU戰(zhàn)場。這是首款基于Xe3P架構(gòu)的數(shù)據(jù)中心GPU,專為AI推理和Agent工作負(fù)載優(yōu)化。它的核心參數(shù)非常炸裂:480GB LPDDR5內(nèi)存,350W TDP。
480GB這個(gè)數(shù)字有特殊含義。以DeepSeek-V4(1.6T參數(shù))為例,在FP8量化精度下僅需4張Crescent Island即可支持部署。更長的上下文窗口、更多的模型切換,這些在Agent工作流中頻繁發(fā)生的場景,因?yàn)槌笕萘績?nèi)存而變得更具操作性。LPDDR而非HBM的選擇,讓功耗降至350W,意味著它可以在現(xiàn)有風(fēng)冷數(shù)據(jù)中心中直接運(yùn)行,不需要液冷改造。
同時(shí),Crescent Island支持原生FP64。這讓它不僅僅是一款A(yù)I推理卡,也為未來進(jìn)入HPC市場埋下了伏筆。英特爾內(nèi)部正在推進(jìn)CPU與Crescent Island聯(lián)合的軟件棧,以支持更好的HPC應(yīng)用。英特爾顯然在刻意控制產(chǎn)品邊界。他們?nèi)サ袅藢Σ糠滞ㄓ脠鼍安槐匾哪芰Γ丫w管面積釋放出來給AI性能。
軟件層面,英特爾圍繞四個(gè)原則構(gòu)建統(tǒng)一的Xe軟件棧:開放、規(guī)模化性能、優(yōu)秀的用戶體驗(yàn)、支持異構(gòu)基礎(chǔ)設(shè)施。英特爾選擇了上游優(yōu)先的策略:PyTorch、vLLM、SGLang等主流框架,都會(huì)在Day 0就獲得支持。他們還與SambaNova達(dá)成合作,后者側(cè)重大型系統(tǒng)級的高吞吐、低延遲集中式推理,而Crescent Island則主攻端側(cè)和企業(yè)級的小規(guī)模部署(如8卡或16卡一體機(jī))。
目前已有超過20家OEM和ODM廠商在針對Crescent Island進(jìn)行開發(fā)。這個(gè)數(shù)字背后,是英特爾生態(tài)正在加速擴(kuò)張的信號。
![]()
除去CPU和GPU,本次一同發(fā)布的還有全新的E835以太網(wǎng)網(wǎng)卡。高達(dá)200GbE吞吐量,支持RDMA和動(dòng)態(tài)設(shè)備個(gè)性化(DDP),在滿載200G雙向線速運(yùn)行時(shí),功耗比同類產(chǎn)品低28%至47%,能效比達(dá)到競品的1.4至1.9倍。內(nèi)置硅芯片信任根和固件證明等硬件級安全能力,超過10年的產(chǎn)品生命周期,讓數(shù)據(jù)中心在長期運(yùn)營中擁有更穩(wěn)定的技術(shù)投資保障。
Agentic AI時(shí)代,CPU重回C位
過去兩三年,AI推理幾乎等同于GPU的工作。但隨著Agentic AI的崛起,游戲規(guī)則正在被改寫。英特爾公司執(zhí)行副總裁兼數(shù)據(jù)中心事業(yè)部(DCG)總經(jīng)理Kevork Kechichian表示:“CPU現(xiàn)在處于所有這些流程的中心,試圖去編排和調(diào)度整個(gè)大局。”
Agent工作流是多步驟、多推理、多計(jì)算的,需要維持極長的上下文窗口,多個(gè)專家Agent會(huì)繁衍出多個(gè)子Agent協(xié)同完成復(fù)雜任務(wù),這導(dǎo)致Token消耗量呈指數(shù)級增長。在這種場景下,GPU負(fù)責(zé)思考(推理、代碼生成),而CPU負(fù)責(zé)執(zhí)行(編排、調(diào)度、模擬、上下文管理)。兩者的關(guān)系從傳統(tǒng)的1:8配比,正在向1:4、1:2甚至1:1演進(jìn),在強(qiáng)化學(xué)習(xí)場景中甚至出現(xiàn)反轉(zhuǎn)。
這解釋了為什么至強(qiáng)6+的高內(nèi)核密度變得如此重要。英特爾實(shí)測,基于288核心的Clearwater Forest,可以輕松部署400到500個(gè)以上的Agent并發(fā)運(yùn)行。更重要的是,CPU內(nèi)置的加速器(矩陣引擎、向量引擎)和機(jī)密計(jì)算能力(TDX、SGX),正好契合Agent場景對數(shù)據(jù)隱私和安全隔離的嚴(yán)格要求。當(dāng)多個(gè)Agent并行運(yùn)行、多租戶并行調(diào)度時(shí),TDX和SGX可以在可信平臺上確保隱私信息在安全可控范圍內(nèi)運(yùn)行。
x86仍將統(tǒng)治2030年
x86架構(gòu)在數(shù)據(jù)中心的影響力,并沒有因?yàn)锳I浪潮而削弱,反而在某些關(guān)鍵場景下被重新強(qiáng)化。
英特爾將工作負(fù)載分為三大類:需要高密度計(jì)算的橫向擴(kuò)展(Scale-out)場景、平衡性能和數(shù)據(jù)吞吐量的通用場景,以及計(jì)算密集型的AI訓(xùn)練場景。但在這些傳統(tǒng)分類之外,一個(gè)新的中間地帶正在形成。推理側(cè)的混合場景:GPU級加速,但主體仍以CPU為核心。
這個(gè)第三類場景的崛起,意義遠(yuǎn)超表面。AI推理與訓(xùn)練存在顯著差異,訓(xùn)練需要大規(guī)模并行計(jì)算,GPU是絕對主力;但推理階段,尤其是企業(yè)級的Agent工作流,涉及多步驟推理、上下文管理、調(diào)度和模擬,這些恰恰是CPU的強(qiáng)項(xiàng)。當(dāng)Token消耗量呈指數(shù)級增長,當(dāng)多個(gè)Agent并行運(yùn)行、當(dāng)極長上下文窗口需要被持續(xù)維持,CPU不再是旁觀者,而是整個(gè)系統(tǒng)的編排中樞。
![]()
![]()
英特爾在發(fā)布會(huì)上給出了一個(gè)數(shù)字:預(yù)計(jì)到2030年,全球超過8000萬臺在網(wǎng)服務(wù)器中,80%仍將基于x86架構(gòu)。當(dāng)前,推理和Agent AI,幾乎完全運(yùn)行在x86上。
廣泛x86軟件生態(tài)與開發(fā)者社區(qū)的積累、多年打磨的硬件加速能力(IAA內(nèi)存壓縮、CXL內(nèi)存擴(kuò)展等)、以及成熟的可管理性和安全特性,這些積累在過去或許只是“基本功”,但在Agent AI時(shí)代,它們突然變成了寶藏。內(nèi)存成本高企、容量需求激增,讓IAA技術(shù)重新進(jìn)入客戶視野;CXL內(nèi)存池的能力,使得跨CPU共享緩存層級成為可能。
英特爾也在通過架構(gòu)層面的精細(xì)化應(yīng)對這種分化。針對不同工作負(fù)載,他們同時(shí)推進(jìn)P-core(性能核)和E-core(能效核)兩條路線:P-core在通用計(jì)算中性能優(yōu)勢突出,客戶反饋積極;而E-core在高密度、低功耗的Agent場景中正變得越來越不可或缺。兩種核心并行推進(jìn),而非非此即彼,為x86在AI時(shí)代的市場定位提供了更彈性的支撐。ARM在服務(wù)器領(lǐng)域布局多年,但x86的生態(tài)壁壘和成熟度,在可預(yù)見的未來依然難以撼動(dòng)。
從芯片到機(jī)架級,英特爾的野望
![]()
英特爾數(shù)據(jù)中心的布局不止于此,從路線圖來看,英特爾下一步會(huì)推出Diamond Rapids,預(yù)計(jì)2027年推出,采用18A P工藝,比至強(qiáng)6+的18A更進(jìn)一步的制程節(jié)點(diǎn)。它采用Scalable SOC架構(gòu),引入統(tǒng)一內(nèi)存延遲(Uniform Memory Latency)設(shè)計(jì)。在關(guān)鍵的內(nèi)存和I/O上,Diamond Rapids的通道數(shù)量相比前代增加2倍,內(nèi)存速度全面提升,PCIe支持到Gen6,為帶寬受限和I/O密集型應(yīng)用提供更強(qiáng)的支撐。
![]()
從應(yīng)用場景來看,Diamond Rapids瞄準(zhǔn)的是高需求IaaS環(huán)境、高性能計(jì)算、帶寬密集型應(yīng)用和I/O密集型工作負(fù)載,這些正是AI推理和Agent工作流正在倒逼的基礎(chǔ)設(shè)施升級方向。
從至強(qiáng)6+到Diamond Rapids,制程節(jié)點(diǎn)、產(chǎn)品密度、內(nèi)存帶寬、I/O性能,每一代都在系統(tǒng)性提升。值得一提的是,支撐英特爾數(shù)據(jù)中心產(chǎn)品的,是Intel 18A工藝的快速成熟。從至強(qiáng)6+開始,所有核心產(chǎn)品均基于18A工藝,這不僅意味著更高的性能和能效比,更意味著英特爾的產(chǎn)品規(guī)劃和制程節(jié)點(diǎn),終于回到了同頻共振的狀態(tài)。
2026年的數(shù)據(jù)中心市場,正在經(jīng)歷一場深刻的變革。AI工作負(fù)載的爆發(fā),改變了CPU與GPU的關(guān)系,重塑了數(shù)據(jù)中心的設(shè)計(jì)邏輯。
英特爾又站回了舞臺中央。
*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個(gè)人觀點(diǎn),我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認(rèn)同,如有異議,請聯(lián)系后臺。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.