5月20日,在2026阿里云峰會(huì)上,阿里發(fā)布基于平頭哥新一代AI芯片真武M890的128卡超節(jié)點(diǎn)服務(wù)器,搭載互聯(lián)芯片ICN Switch 1.0,通信時(shí)延低至百納秒級(jí),可讓128張AI芯片組成一臺(tái)計(jì)算機(jī),滿足海量Agent并發(fā)推理和大模型訓(xùn)練需求。這是面向Agentic時(shí)代全面升級(jí)的重要部分,當(dāng)天阿里云推出了全新“芯-云-模型-推理”技術(shù)體系。
![]()
Agentic時(shí)代,算力集群需要承載成千上萬(wàn)個(gè)Agent同時(shí)運(yùn)行,每個(gè)Agent在一次任務(wù)中可能連續(xù)發(fā)起數(shù)十次模型調(diào)用,這對(duì)通信時(shí)延和帶寬有極高要求。磐久AL128超節(jié)點(diǎn)服務(wù)器基于自研AI芯片和互聯(lián)芯片打造,通過(guò)單機(jī)柜128卡緊密耦合互聯(lián),P2P時(shí)延低于150ns,單柜帶寬達(dá)到Pb/s級(jí),可支海量Agent的并發(fā)請(qǐng)求。該超節(jié)點(diǎn)服務(wù)器已上線阿里云百煉,支持Qwen、DeepSeek、Kimi等主流模型。
![]()
據(jù)介紹,首次亮相的真武M890采用自研并行計(jì)算架構(gòu),內(nèi)置144GB顯存,性能是真武810E的3倍,片間互聯(lián)帶寬達(dá)到800GB/s,芯片原生支持FP32到FP4等多種數(shù)據(jù)精度,可應(yīng)用于高精度訓(xùn)練、低精度和超低精度推理的全場(chǎng)景,低精度推理場(chǎng)景下,不僅可以保證模型輸出質(zhì)量,還能顯著降低單次推理的算力開(kāi)銷。
平頭哥互聯(lián)芯片ICN Switch 1.0支持自研ICN互聯(lián)總線協(xié)議和PCCL通信庫(kù),吞吐量達(dá)25.6Tbps,可支持真武M890的高效互聯(lián),提升AI集群的算力效率。真武M890搭配ICN Switch1.0芯片,可實(shí)現(xiàn)64卡全帶寬互聯(lián),顯著提升大規(guī)模智算集群計(jì)算的效率與穩(wěn)定性。基于平頭哥自研T-Head SAIL軟件棧的軟硬協(xié)同,可最大程度釋放芯片的算力。
大會(huì)現(xiàn)場(chǎng),平頭哥首次公布真武系列芯片的規(guī)劃,未來(lái)兩年將陸續(xù)推出算力更強(qiáng)的真武V900、真武J900兩代芯片,以滿足Agentic時(shí)代千行百業(yè)的AI算力需求。目前,真武系列芯片已累計(jì)出貨56萬(wàn)片,服務(wù)了中國(guó)電信、中國(guó)一汽、浦發(fā)銀行等20多個(gè)行業(yè)的400多家客戶。
![]()
隨著Agent應(yīng)用的爆發(fā),AI的核心任務(wù)逐漸從純對(duì)話轉(zhuǎn)向任務(wù)執(zhí)行,這不僅需要高AI算力支撐,其任務(wù)規(guī)劃、狀態(tài)管理、工具調(diào)用等環(huán)節(jié)極其依賴CPU,CPU成為影響Agent執(zhí)行效率的關(guān)鍵部件。平頭哥擁有自研的服務(wù)器CPU倚天系列,可與真武AI芯片高效協(xié)同,大幅提升AI推理效率,有效應(yīng)對(duì)Agent高并發(fā)任務(wù)的負(fù)載壓力。
目前,平頭哥已推出真武系列AI芯片、倚天系列Arm服務(wù)器CPU、磐脈系列智能網(wǎng)卡、鎮(zhèn)岳系列存儲(chǔ)主控芯片、ICN Switch互聯(lián)芯片等數(shù)據(jù)中心核心芯片,實(shí)現(xiàn)算力、網(wǎng)力和存力的全棧自研。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.