網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Chiplet 賽道雙雄：Intel 18A攻堅(jiān)通用市場(chǎng)，AMD MI450深耕AI領(lǐng)域

2025-10-17 16:00:48　來(lái)源: 奇普樂(lè)芯片技術(shù)

廣東舉報(bào)

分享至

一、2nm 時(shí)代的算力關(guān)鍵：Chiplet 與兩款技術(shù)樣本

當(dāng)半導(dǎo)體制程邁入 2nm 級(jí)別，單芯片的物理極限愈發(fā)明顯，Chiplet（芯粒）技術(shù)逐漸成為解鎖先進(jìn)制程性能的核心 —— 通過(guò)模塊化拆分與集成，既能突破良率瓶頸，又能靈活適配不同算力場(chǎng)景。這一趨勢(shì)下，Intel 18A 與 AMD Instinct MI450 分別在通用計(jì)算、AI 專用算力領(lǐng)域給出了實(shí)踐方案。

作為 1.8nm 級(jí)制程的代表，Intel 18A 的核心突破不僅在于 RibbonFET 晶體管與 PowerVia 背面供電，更通過(guò) Chiplet 封裝打破傳統(tǒng)局限。其服務(wù)器芯片Clearwater Forest用 29 顆 Chiplet 集成：12 顆 18A 計(jì)算芯粒負(fù)責(zé)運(yùn)算，搭配有源基板、I/O 與互聯(lián)芯粒，靠 Foveros Direct 3D 技術(shù)實(shí)現(xiàn) “3D 堆疊 + 2.5D 互聯(lián)”，既降功耗 40%，又覆蓋 AI PC、邊緣計(jì)算等場(chǎng)景，為通用領(lǐng)域的 “制程 + Chiplet” 協(xié)同提供了參考。

而在AI 專用算力領(lǐng)域，AMD Instinct MI450 則走出了另一條路 —— 以 “2nm 工藝 + Chiplet 異構(gòu)集成” 為核心，針對(duì)性解決大規(guī)模 AI 訓(xùn)練的性能、成本與擴(kuò)展痛點(diǎn)，成為 Chiplet 垂直場(chǎng)景應(yīng)用的典型案例。

二、AMD MI450：AI 場(chǎng)景下的 Chiplet 技術(shù)落地

2026 年 AI 加速卡領(lǐng)域的技術(shù)突破中，AMD Instinct MI450 將憑借 “2nm 工藝 + Chiplet 異構(gòu)集成” 的設(shè)計(jì)，成為 AI 專用算力領(lǐng)域的重要突破。其核心邏輯是通過(guò) Chiplet 模塊化，最大化先進(jìn)制程與高帶寬內(nèi)存的協(xié)同效應(yīng)，從硬件層面簡(jiǎn)化大規(guī)模 AI 訓(xùn)練的實(shí)現(xiàn)路徑。

從技術(shù)定位來(lái)看，MI450 專為超大規(guī)模 AI 訓(xùn)練設(shè)計(jì)：核心計(jì)算單元（XCD 芯粒）采用臺(tái)積電 N2P 2nm 工藝，中介層（AID）與媒體接口模塊（MID）則選用 3nm 工藝，形成 “核心用尖端制程保性能、輔助模塊用成熟制程控成本” 的混合方案。

參數(shù)層面，其 FP4 精度算力達(dá) 5 PFLOPS，搭配最高 432GB HBM4 內(nèi)存，帶寬提升至 19.6TB/s，單卡即可支撐千億參數(shù)大模型訓(xùn)練，無(wú)需依賴復(fù)雜的模型拆分技術(shù)，大幅降低了大規(guī)模 AI 計(jì)算的硬件門檻。

系統(tǒng)級(jí)應(yīng)用上，MI450 配套的 Helios 機(jī)架方案進(jìn)一步釋放 Chiplet 的擴(kuò)展優(yōu)勢(shì)：?jiǎn)螜C(jī)架可集成 128 塊 MI450，總帶寬突破 1400TB/s，能適配超算中心、AI 實(shí)驗(yàn)室等場(chǎng)景的大規(guī)模算力需求；且模塊化設(shè)計(jì)讓后期算力擴(kuò)容更靈活，無(wú)需重構(gòu)整體硬件架構(gòu)，兼顧了當(dāng)前性能與未來(lái)升級(jí)需求。

三、拆解 MI450：Chiplet 如何支撐 2nm 級(jí) AI 算力？

若說(shuō) 2nm 工藝是 MI450 的性能基礎(chǔ)，那么 Chiplet 技術(shù)便是其實(shí)現(xiàn) “高性能 + 高性價(jià)比” 的核心支撐 —— 通過(guò)功能拆分、互聯(lián)優(yōu)化與內(nèi)存協(xié)同，解決了先進(jìn)制程下 “良率低、成本高、擴(kuò)展難” 的三大痛點(diǎn)。

1. Chiplet 的功能分工邏輯

MI450 的 Chiplet 架構(gòu)是異構(gòu)集成的經(jīng)典范式：按功能精準(zhǔn)拆分，避免單芯片 “全功能集成” 的性能瓶頸：

XCD計(jì)算芯粒：每顆集成 CDNA 4.0 架構(gòu)的矩陣運(yùn)算單元，2nm 工藝保障算力密度，8 顆協(xié)同實(shí)現(xiàn)算力線性疊加，且小尺寸芯粒相比大芯片良率提升超 50%；

AID有源中介層芯粒：3nm 工藝負(fù)責(zé)數(shù)據(jù)調(diào)度，作為 “算力樞紐” 連接 XCD 芯粒與 HBM4 內(nèi)存，縮短數(shù)據(jù)傳輸路徑，減少信號(hào)損耗；

MID媒體接口芯粒：承擔(dān)外部數(shù)據(jù)交互功能，兼容 PCIe 6.0 與 AMD UALink 互聯(lián)協(xié)議，為多設(shè)備協(xié)同提供接口支持。

這種分工讓每顆 Chiplet 聚焦單一功能，既能用匹配工藝實(shí)現(xiàn)性能最優(yōu)，又能通過(guò) “壞芯粒替換” 降低整體成本，完美平衡了先進(jìn)制程的性能與實(shí)用性。

2. Infinity Fabric：Chiplet 互聯(lián)的技術(shù)關(guān)鍵

Chiplet 的高效協(xié)同離不開(kāi)互聯(lián)技術(shù)，MI450 搭載的第六代 Infinity Fabric 技術(shù)，實(shí)現(xiàn)芯粒間 1.4TB/s 的帶寬與低于 50ns 的延遲（相當(dāng)于每秒傳輸 70 部 4K 電影）；更關(guān)鍵的是支持多卡擴(kuò)展 ——128 塊 MI450 通過(guò) UALink 組成集群時(shí)，延遲僅增加 10%，滿足大規(guī)模 AI 訓(xùn)練對(duì) “低延遲互聯(lián)” 的核心需求。

不同于 3D 堆疊的復(fù)雜封裝，這種 “2.5D + 高速總線” 的互聯(lián)方案，在保證帶寬與延遲性能的同時(shí)，降低了封裝工藝難度，更適合大規(guī)模量產(chǎn)，體現(xiàn)了 Chiplet 技術(shù) “性能與可制造性平衡” 的設(shè)計(jì)思路。

3. HBM4 與 Chiplet 的協(xié)同突破

MI450 的 432GB HBM4 內(nèi)存能實(shí)現(xiàn) 19.6TB/s 的高帶寬，核心在于 Chiplet 與內(nèi)存的緊密集成：AID 中介層直接連接 XCD 芯粒與 HBM4 顆粒，省去傳統(tǒng) PCB 板的信號(hào)損耗，形成 “計(jì)算 - 內(nèi)存” 就近布局的架構(gòu)，從根本上解決了 AI 訓(xùn)練中的 “內(nèi)存墻” 問(wèn)題（數(shù)據(jù)傳輸速度跟不上計(jì)算速度）。

對(duì)比前代單芯片設(shè)計(jì)的 MI300X（HBM3 內(nèi)存帶寬 8TB/s），MI450 通過(guò) Chiplet 拆分，讓內(nèi)存接口與計(jì)算單元的距離縮短 60%，帶寬直接翻倍，印證了 “先進(jìn)內(nèi)存技術(shù)需與 Chiplet 結(jié)合才能釋放最大性能” 的技術(shù)規(guī)律。

四、Intel 18A 與 AMD MI450：Chiplet 的兩條技術(shù)路徑

Intel 18A 與 AMD MI450 雖應(yīng)用場(chǎng)景不同，但共享同一技術(shù)邏輯 ——先進(jìn)制程的性能釋放離不開(kāi) Chiplet，Chiplet 也需依托先進(jìn)制程實(shí)現(xiàn)更高算力密度，且二者的落地路徑形成了鮮明互補(bǔ)：

Intel 18A 走 “通用計(jì)算全覆蓋” 路線：通過(guò) CPU+GPU+NPU 的多類型芯粒混合集成，用 Foveros 3D 堆疊技術(shù)打破 “單一芯片難以適配多場(chǎng)景” 的限制，既能支撐 AI PC 的本地推理，也能滿足邊緣計(jì)算的輕量算力需求，核心是 “用 Chiplet 提升場(chǎng)景適配性”；

AMD MI450 則走 “AI 專用深耕” 路線：所有 Chiplet 圍繞 “算力輸出、數(shù)據(jù)調(diào)度、內(nèi)存互聯(lián)” 三大核心功能設(shè)計(jì)，XCD 芯粒專攻計(jì)算、AID 芯粒聚焦調(diào)度、MID 芯粒負(fù)責(zé)接口，甚至通過(guò)混合制程進(jìn)一步優(yōu)化成本，核心是 “用 Chiplet 解決垂直場(chǎng)景的痛點(diǎn)”。

兩條路徑無(wú)優(yōu)劣之分，卻共同證明：后摩爾時(shí)代，Chiplet 已從 “可選技術(shù)” 變?yōu)?“必選架構(gòu)”，成為先進(jìn)算力落地的基礎(chǔ)支撐。

五、Chiplet 的技術(shù)價(jià)值：重構(gòu)先進(jìn)算力的實(shí)現(xiàn)邏輯

Intel 18A 與 AMD MI450 的實(shí)踐，并非單純的技術(shù)創(chuàng)新，更在于它們凸顯了 Chiplet 對(duì)半導(dǎo)體行業(yè)的深層價(jià)值 —— 打破傳統(tǒng)算力實(shí)現(xiàn)的固有邏輯，讓先進(jìn)技術(shù)更易落地、更具實(shí)用性。

首先是破解“先進(jìn)制程性價(jià)比陷阱”：2nm 級(jí)工藝的研發(fā)成本已超 50 億美元，單芯片良率卻不足 30%，而 Chiplet 通過(guò) “小芯粒拆分”，讓 2nm 工藝僅用于核心計(jì)算模塊（如 MI450 的 XCD 芯粒、18A 的計(jì)算芯粒），輔助模塊用更成熟的 3nm/Intel 3 工藝，整體成本降低 40% 以上，良率提升至 80%，徹底改變了 “越先進(jìn)越難用” 的困境。

其次是推動(dòng)“算力按需定制”：傳統(tǒng)芯片需為單一場(chǎng)景設(shè)計(jì)完整功能，迭代周期長(zhǎng)達(dá) 24 個(gè)月，而 Chiplet 可像 “搭積木” 一樣組合芯粒 —— 需要通用算力就集成 CPU+GPU 芯粒，需要 AI 算力就強(qiáng)化計(jì)算 + 內(nèi)存芯粒，迭代周期縮短至 12 個(gè)月，完美匹配 AI、邊緣計(jì)算等領(lǐng)域的快速演進(jìn)節(jié)奏。

最后是加速“行業(yè)協(xié)同創(chuàng)新”：過(guò)去單芯片設(shè)計(jì)需要企業(yè)覆蓋“制程、封裝、軟件” 全鏈條，門檻極高；而 Chiplet 讓企業(yè)可聚焦優(yōu)勢(shì)領(lǐng)域 —— 有的專注計(jì)算芯粒研發(fā)，有的深耕互聯(lián)技術(shù)，有的優(yōu)化內(nèi)存集成，再通過(guò)標(biāo)準(zhǔn)化互聯(lián)組合成完整產(chǎn)品，形成 “分工協(xié)作” 的生態(tài)模式，大幅降低了先進(jìn)算力的創(chuàng)新門檻。

結(jié)語(yǔ)：Chiplet 引領(lǐng)算力革命的下一站

當(dāng) Intel 18A 用 29 顆 Chiplet 撐起通用算力的多樣化需求，當(dāng) AMD MI450 用 Chiplet 突破 AI 訓(xùn)練的性能瓶頸，我們看到的不只是兩款產(chǎn)品的創(chuàng)新，更是一場(chǎng)由 Chiplet 主導(dǎo)的算力革命 —— 它讓先進(jìn)制程從 “實(shí)驗(yàn)室技術(shù)” 走向 “產(chǎn)業(yè)實(shí)用”，讓算力供應(yīng)從 “標(biāo)準(zhǔn)化產(chǎn)品” 轉(zhuǎn)向 “定制化服務(wù)”，讓行業(yè)創(chuàng)新從 “單打獨(dú)斗” 變?yōu)?“協(xié)同共贏”。

< 奇普樂(lè) · 往期文章 >

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.