![]()
近日,AI全棧式互聯(lián)公司奇異摩爾宣布,已成功構(gòu)建800G AI 超級(jí)網(wǎng)卡(SNIC)平臺(tái)架構(gòu),除了800Gb/s 的高帶寬,亞微秒的超低延時(shí),其關(guān)鍵技術(shù)還涵蓋面向AI 網(wǎng)絡(luò)的增強(qiáng)型RoCE v2機(jī)制,包括包噴灑,多路徑傳輸,高性能重傳,與先進(jìn)的可編程擁塞控制等。基于該自研平臺(tái)架構(gòu)設(shè)計(jì)的AI SNIC ASIC,已于近期完成回片,并順利通過核心RDMA架構(gòu)的硅驗(yàn)證,單通道吞吐量穩(wěn)定在400Gbps,關(guān)鍵時(shí)延約1微秒。在當(dāng)前國(guó)產(chǎn)高性能網(wǎng)卡公開產(chǎn)品與產(chǎn)業(yè)敘事仍多集中于100/200G RDMA ASIC引擎階段的背景下,奇異摩爾正以單通道400G RDMA ASIC引擎這一實(shí)質(zhì)性突破,為國(guó)產(chǎn)AI超級(jí)網(wǎng)卡快速邁向800G ASIC揭開序幕。
![]()
【圖:800G AI SNIC平臺(tái)架構(gòu)設(shè)計(jì)的ASIC已順利通過RDMA架構(gòu)的硅驗(yàn)證,單通道吞吐量穩(wěn)定在400Gbps】
為什么是基于以太網(wǎng)的RDMA AI原生網(wǎng)卡
在 AI 網(wǎng)絡(luò)興起之前,行業(yè)對(duì)智能網(wǎng)卡(SmartNIC)的主流劃分,并非圍繞 AI 訓(xùn)練與推理場(chǎng)景,而是依據(jù)芯片架構(gòu)與卸載能力深度進(jìn)行區(qū)分。核心關(guān)注點(diǎn)在于其能夠?yàn)?CPU 分擔(dān)多少基礎(chǔ)設(shè)施工作,包括虛擬機(jī)間網(wǎng)絡(luò)交換、存儲(chǔ)、加解密,安全與遙測(cè),壓縮與解壓縮等硬件卸載功能,典型產(chǎn)品如數(shù)據(jù)處理單元(DPU)網(wǎng)卡,并非針對(duì)大模型集群通信做專項(xiàng)定制優(yōu)化。
進(jìn)入大模型時(shí)代,隨著AI訓(xùn)練從千卡向萬卡規(guī)模擴(kuò)展、推理從單機(jī)部署走向大規(guī)模分布式服務(wù),Scale-out網(wǎng)絡(luò)正在成為決定GPU利用率、集合通信效率和單位Token成本的關(guān)鍵基礎(chǔ)設(shè)施。無論是All-Reduce、Reduce-Scatter,還是All-to-All等典型集合通信,都要求網(wǎng)絡(luò)具備更高帶寬密度、更低時(shí)延、更低尾時(shí)延,以及更快的擁塞反應(yīng)能力。在此背景下,基于以太網(wǎng)的高性能RDMA路線愈發(fā)清晰:它既繼承了以太網(wǎng)生態(tài)開放、部署成熟、成本可控的優(yōu)勢(shì),又通過面向AI網(wǎng)絡(luò)的RoCE/RDMA專項(xiàng)優(yōu)化,逐步具備支撐大規(guī)模AI集群的能力。
這一技術(shù)趨勢(shì)在國(guó)內(nèi)頭部云服務(wù)提供商(CSP)的技術(shù)需求規(guī)范,以及國(guó)外超以太網(wǎng)聯(lián)盟(UEC)的誕生中體現(xiàn)得尤為明顯。就是交付一套面向AI與HPC場(chǎng)景的開放、高性能以太網(wǎng)架構(gòu),重點(diǎn)解決傳統(tǒng)以太網(wǎng)在大規(guī)模訓(xùn)練環(huán)境下面臨的多路徑傳輸、快速擁塞響應(yīng)、尾時(shí)延控制、易配置與可擴(kuò)展性等問題。換句話說,以太網(wǎng)不再只是“通用網(wǎng)絡(luò)”的代表,而是在AI時(shí)代被重新定義為承載大規(guī)模集群互聯(lián)的主航道之一。
“奇異摩爾AI超級(jí)網(wǎng)卡技術(shù)路線,與頭部云服務(wù)提供商(Tier1CSP)的需求完全一致,與UEC的規(guī)范也高度趨同。我們已構(gòu)建的800G平臺(tái)架構(gòu)能力,能有效支持最高800Gb/s RDMA吞吐,數(shù)百萬級(jí)消息處理能力與數(shù)百萬級(jí)隊(duì)列(QP),大大增強(qiáng)了RoCE v2協(xié)議棧,增加了包噴灑、亂序重組、高效重傳,高級(jí)可編程擁塞控制等AI網(wǎng)絡(luò)急需的增強(qiáng)特性。以太網(wǎng)的技術(shù)路線確保了產(chǎn)品的開放互操作性與生態(tài)兼容性,為進(jìn)入頭部云服務(wù)供應(yīng)商以及未來平滑融入超以太網(wǎng)生態(tài)、實(shí)現(xiàn)跨廠商協(xié)同奠定了基礎(chǔ)。” 奇異摩爾網(wǎng)絡(luò)技術(shù)VP葉棟表示 。
![]()
【圖:800G AI SNIC及功能描述】
葉棟擁有超過20年的網(wǎng)絡(luò)互聯(lián)系統(tǒng)架構(gòu)設(shè)計(jì)經(jīng)驗(yàn),在AI網(wǎng)絡(luò)協(xié)議、RDMA、虛擬化、軟件協(xié)議棧等方面擁有豐富的專業(yè)知識(shí)。其在英特爾(中國(guó))工作多年,曾任英特爾網(wǎng)絡(luò)互聯(lián)產(chǎn)品事業(yè)部技術(shù)總監(jiān),負(fù)責(zé)英特爾以太網(wǎng)、智能網(wǎng)卡,P4可編程交換芯片、英特爾/Google IPU相關(guān)系統(tǒng)架構(gòu)產(chǎn)品的本地化研發(fā)和部署。啟動(dòng)和主導(dǎo)了多家大型云服務(wù)提供商大規(guī)模部署的技術(shù)方案的底座。
針對(duì)網(wǎng)絡(luò)密集型大規(guī)模并行計(jì)算對(duì)高帶寬、低延遲數(shù)據(jù)傳輸?shù)膰?yán)苛需求,NVIDIA不僅推出基于IB網(wǎng)絡(luò)的超級(jí)網(wǎng)卡(SNIC),也推出了面向以太網(wǎng)的SNIC,旨在為AI工廠與云數(shù)據(jù)中心提供強(qiáng)大的網(wǎng)絡(luò)支撐。NVIDIA對(duì)AI超級(jí)網(wǎng)卡的定義十分清晰:這是一類“專為網(wǎng)絡(luò)密集型、海量分布式AI計(jì)算工作負(fù)載打造的新型網(wǎng)絡(luò)加速器”。其價(jià)值遠(yuǎn)不止于完成數(shù)據(jù)包的傳輸,更在于讓多GPU、多節(jié)點(diǎn)環(huán)境下的通信真正成為釋放算力的加速引擎。
對(duì)標(biāo)NVIDIA ConnectX-8/9 的領(lǐng)先性
800G AI網(wǎng)卡從“接口”走向“中樞”
NVIDIA公開表示,ConnectX-8是業(yè)界首個(gè)把PCIe Gen6級(jí)交換能力與超高速網(wǎng)絡(luò)處理能力集成到單一器件中的超級(jí)網(wǎng)卡(SNIC)。它不僅服務(wù)于AI、HPC和超大規(guī)模云數(shù)據(jù)中心場(chǎng)景,還通過集成48 lanes的PCIe Gen6 Switch,把原本需要獨(dú)立PCIe Switch和獨(dú)立NIC共同完成的任務(wù),整合到一個(gè)高集成度器件中,這是一項(xiàng)絕無僅有的創(chuàng)新技術(shù)路徑。
傳統(tǒng) 1機(jī)8 卡 PCIe GPU 服務(wù)器普遍采用以 CPU 為根節(jié)點(diǎn)、PCIe Switch 向下連接 GPU 的樹形拓?fù)洹_@種架構(gòu)在通用計(jì)算時(shí)代較為成熟,但在大模型訓(xùn)練場(chǎng)景下,其結(jié)構(gòu)性性能瓶頸日益突出:GPU 間通信往往需要經(jīng)過 PCIe Switch,跨 Socket 路徑還可能受到主機(jī)鏈路約束,導(dǎo)致時(shí)延升高、帶寬利用率下降,難以滿足 All-Reduce、Reduce-Scatter、All-to-All 等高頻集合通信對(duì)低時(shí)延和高吞吐的要求。所以ConnectX-8 將 PCIe Gen6 交換能力與高速網(wǎng)絡(luò)能力整合到單一器件中,可替代傳統(tǒng)離散 PCIe Switch,既優(yōu)化 GPU 到 GPU、GPU 到 NIC 的數(shù)據(jù)路徑,也降低系統(tǒng)復(fù)雜度、功耗和總體擁有成本。
![]()
在端口形態(tài)上,ConnectX-8也已經(jīng)明確邁入800G時(shí)代。NVIDIA官方顯示,ConnectX-8以太網(wǎng)版本具備2×400GbE的產(chǎn)品形態(tài),其不僅擁有800G級(jí)總帶寬能力,也具備更靈活的雙端口組網(wǎng)方式,更適合未來大規(guī)模AI集群對(duì)冗余、分流、彈性擴(kuò)展和復(fù)雜拓?fù)洳渴鸬男枨蟆某鲐浶螒B(tài)來說,ConnectX-8已將高速網(wǎng)絡(luò)能力與PCIe Gen6 Switch能力整合至單一器件之中,并以一體化集成設(shè)計(jì)形態(tài)面向平臺(tái)出貨。
奇異摩爾創(chuàng)造里程碑:國(guó)產(chǎn)AI SNIC從“可用”邁向“高性能”
正是在這樣的全球技術(shù)演進(jìn)背景下,奇異摩爾基于自研800G AI SNIC ASIC架構(gòu)構(gòu)建的單通道400G引擎完成了核心RDMA ASIC 流片驗(yàn)證,才顯得意義格外突出。與FPGA方案更適合早期驗(yàn)證、快速迭代不同,ASIC路線決定了一款產(chǎn)品是否真正具備面向大規(guī)模AI訓(xùn)推集群的性能上限、功耗效率、板卡集成度和量產(chǎn)一致性。奇異摩爾率先在國(guó)產(chǎn)陣營(yíng)中實(shí)現(xiàn)單通道400G RDMA ASIC引擎,吞吐量穩(wěn)定在400Gbps,不僅填補(bǔ)了國(guó)內(nèi)高帶寬超級(jí)網(wǎng)卡芯片的空白,更充分證明了其已掌握2×400G乃至更高速率產(chǎn)品的核心設(shè)計(jì)能力,為下一代800G網(wǎng)卡奠定了堅(jiān)實(shí)技術(shù)基礎(chǔ)。
奇異摩爾最新800G SNIC全面對(duì)標(biāo)英偉達(dá)ConnectX-8/9的架構(gòu)方向,采用與國(guó)際先進(jìn)方案相一致的“高速網(wǎng)絡(luò)處理+PCIe Switch能力”一體化設(shè)計(jì)思路,在產(chǎn)品形態(tài)上支持 2×400G端口以太網(wǎng)總帶寬,在架構(gòu)層面同時(shí)承擔(dān)AI服務(wù)器內(nèi)部互連優(yōu)化與節(jié)點(diǎn)間高速通信能力。這意味著,該企業(yè)在800G產(chǎn)品布局不只是帶寬規(guī)格升級(jí),更是對(duì)未來AI高性能集群互連形態(tài)的提前卡位:通過集成PCIe Switch能力,重構(gòu)GPU到GPU、GPU到NIC的數(shù)據(jù)路徑,提升集合通信效率、降低系統(tǒng)復(fù)雜度,并增強(qiáng)對(duì)整機(jī)平臺(tái)和集群方案的定義能力。
![]()
奇異摩爾網(wǎng)絡(luò)技術(shù)VP葉棟補(bǔ)充道,奇異摩爾最新800G超級(jí)網(wǎng)卡按計(jì)劃于年內(nèi)量產(chǎn),有望成為國(guó)產(chǎn)化在800G AI超級(jí)網(wǎng)絡(luò)芯片、系統(tǒng)集成方案以及平臺(tái)級(jí)架構(gòu)能力上的重大突破,進(jìn)一步增強(qiáng)中國(guó)廠商在未來AI高性能集群基礎(chǔ)設(shè)施中的產(chǎn)品定義權(quán)、方案協(xié)同權(quán)和產(chǎn)業(yè)話語權(quán)。
國(guó)產(chǎn)化窗口已開,市場(chǎng)潛力加速釋放
從產(chǎn)業(yè)空間與政策環(huán)境來看,奇異摩爾所切入的并非小眾賽道,而是一個(gè)正在快速擴(kuò)容的核心基礎(chǔ)設(shè)施市場(chǎng)。公開研究顯示,僅ConnectX-7級(jí)別的高性能AI網(wǎng)卡市場(chǎng)規(guī)模已超過百億元,并仍在持續(xù)增長(zhǎng)。這意味著,以ConnectX-7/ ConnectX-8為代表的高性能AI網(wǎng)卡賽道,背后對(duì)應(yīng)的是一個(gè)數(shù)百億元級(jí)、且仍在不斷放大的市場(chǎng)機(jī)遇。
與此同時(shí),國(guó)家對(duì)自主可控智算底座、高速互連及國(guó)產(chǎn)化集群的戰(zhàn)略訴求正持續(xù)加強(qiáng)。國(guó)家發(fā)展改革委等部門已明確提出,要加快部署智能無損網(wǎng)絡(luò)、400G/800G等先進(jìn)技術(shù),建設(shè)高速泛在、安全可靠的全國(guó)一體化算力網(wǎng),并強(qiáng)化自主創(chuàng)新技術(shù)供給能力。
奇異摩爾是一家深度聚焦AI互聯(lián)多年的全棧式解決方案提供商,以網(wǎng)絡(luò)+芯粒技術(shù)為底層特色,除面向Scale Out場(chǎng)景的AI網(wǎng)卡芯片,公司還提供面向Scale Up超節(jié)點(diǎn)的G2G IO互聯(lián)芯粒,并已在業(yè)內(nèi)實(shí)現(xiàn)落地應(yīng)用。這一不同于其他芯片廠商的技術(shù)基因構(gòu)筑了差異化的競(jìng)爭(zhēng)壁壘,也賦予了其在下一代高性能集群互聯(lián)中更強(qiáng)的靈活性、更廣闊的發(fā)展空間以及更深的技術(shù)縱深。
—— 芯榜 ——
芯榜成立于 2015 年,是半導(dǎo)體垂直領(lǐng)域的產(chǎn)業(yè)媒體與數(shù)字化服務(wù)平臺(tái)。全網(wǎng)覆蓋超 100 萬垂直行業(yè)用戶,核心提供專業(yè)榜單發(fā)布、原創(chuàng)訪談、產(chǎn)業(yè)報(bào)告、峰會(huì)活動(dòng)及研究咨詢等服務(wù)。已合作近千家半導(dǎo)體生態(tài)企業(yè),聯(lián)動(dòng)多家基金公司與產(chǎn)業(yè)媒體,助力硬科技產(chǎn)業(yè)發(fā)展。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.