近日,中科曙光推出全球首個無線纜箱式超節(jié)點scaleX40。不同于以往的參數(shù)規(guī)模競賽,該產(chǎn)品集成40張加速卡,采用標準19英寸箱式設(shè)計,打破了常規(guī)柜式超節(jié)點基礎(chǔ)設(shè)施要求高、采購門檻高的痛點,意在為企業(yè)級AI計算提供高效、易得、好用的算力新選擇。
![]()
從產(chǎn)品規(guī)格來看,scaleX40在國產(chǎn)超節(jié)點賽道尚屬首例,正處于8卡服務(wù)器和百卡級超節(jié)點中間地帶,很難找到同品參照。本文將基于傳統(tǒng)小型服務(wù)器與昇騰384超節(jié)點為上下基準,進一步厘清scaleX40在這一區(qū)間的差異化定位。
█規(guī)格定位:
● 8卡OAM機器單機內(nèi)集成8張加速卡,卡間高速接口直連,算力規(guī)模較小,適用于小型模型訓練與原型開發(fā)、輕量級推理任務(wù),適合個人開發(fā)者、小型團隊在研發(fā)初期使用。
● scaleX40集成40張加速卡一級互連,總算力28PFLOPS(FP8精度),HBM總顯存超5TB,訪存帶寬超80TB/s,定位于企業(yè)入門級普惠超節(jié)點,可覆蓋千億參數(shù)模型訓練、推理等主流場景需求。
● 昇騰384集成384顆910C NPU和192顆鯤鵬CPU,總算力達300 PFLOPS(BF16精度),HBM總顯存49.2TB,訪存帶寬1229TB/s,適用于千億參數(shù)級稠密模型訓練和多模態(tài)模型推理。
![]()
█擴展方式:
● 8卡OAM機器采用板內(nèi)scale up縱向擴展。
● scaleX40支持縱向Scale-up和橫向Scale-out靈活擴展,以scaleX40為單元可擴展至數(shù)百卡超節(jié)點以及萬卡計算集群。
● 昇騰384采用混合擴展方式,結(jié)合了縱向擴展(Scale Up)和橫向擴展(Scale Out),同樣可擴展至萬卡級計算集群。
█采購成本:
● 若采用高端OAM卡,單臺8卡機器均價在200萬左右,5臺8卡機器總價近千萬元。
● scaleX40與5臺8卡OAM機器成本持平,可將超節(jié)點購置成本降至千萬元級,并且訓練性能最大可提高120%,推理性能最大提升330%,性價比收益較高。
● 昇騰384滿配超節(jié)點單套價格區(qū)間為1.3億至1.5億元人民幣,8機柜配置(約192顆NPU)價格在6500萬至7500萬元左右,12機柜配置(約288顆NPU)價格在9800萬至1.1億元區(qū)間。
![]()
█部署運維:
● 8卡OAM機器通常采用標準機柜或服務(wù)器形態(tài),部署相對簡單,只需將設(shè)備上架、連接電源和網(wǎng)絡(luò)即可,對機房環(huán)境要求較低,一般無需特殊改造。
● scaleX40采用標準19英寸箱式設(shè)計,計算節(jié)點與交換節(jié)點通過無線纜正交對接,同樣無需機房改造,幾小時內(nèi)即可完成部署,相比光纖連接,功耗下降40%-70%,相比銅纜模式,可用性提高10倍。
● 昇騰384由12個計算柜和4個交換柜組成,需精確布線、連接316公里光纖和6912個光模塊,手工配置易出錯,排查故障耗時較長。高密度光模塊和復(fù)雜互聯(lián)架構(gòu)導(dǎo)致故障率較高,對技術(shù)團隊的專業(yè)能力和資源投入要求嚴格。
█省流總結(jié):
相較傳統(tǒng)8卡機器,scaleX40的價值在于相同成本下實現(xiàn)了更廣泛的計算場景覆蓋,滿足了企業(yè)級用戶更高的AI訓推需求。對標百卡級主流超節(jié)點,40卡規(guī)格入手門檻更低,創(chuàng)新之處在于通過架構(gòu)設(shè)計大大減少了部署難度,更匹配成長性企業(yè)的AI應(yīng)用場景。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.