![]()
·聚焦:人工智能、芯片等行業(yè)
歡迎各位客官關(guān)注、轉(zhuǎn)發(fā)
前言:
近日,成立僅7個(gè)月的北京探微芯聯(lián)科技有限公司宣布完成天使+輪及Pre-A多輪數(shù)億元融資。
這家公司成為國內(nèi)首家全棧式對(duì)標(biāo)英偉達(dá)“NVLink+NVSwitch”架構(gòu)的Scale-up超節(jié)點(diǎn)解決方案提供商,補(bǔ)上了國產(chǎn)AI算力產(chǎn)業(yè)鏈最關(guān)鍵的一塊拼圖。
作者| 方文三
圖片來源 | 網(wǎng)絡(luò)
![]()
被低估的算力瓶頸,互聯(lián)才是隱形護(hù)城河
當(dāng)大模型從千億參數(shù)躍升至十萬億參數(shù)級(jí)別,訓(xùn)練任務(wù)需要數(shù)萬甚至數(shù)十萬張GPU協(xié)同作戰(zhàn)時(shí),單卡算力早已不是決定系統(tǒng)效率的核心。
如果把GPU比作跑車,互聯(lián)技術(shù)就是承載它們的公路:再快的跑車,在泥濘小路上也只能龜速行駛。
英偉達(dá)能在AI領(lǐng)域筑起難以撼動(dòng)的護(hù)城河,除了GPU性能和CUDA生態(tài),NVLink與NVSwitch構(gòu)成的高速互聯(lián)體系同樣功不可沒。
NVLink是GPU間的點(diǎn)對(duì)點(diǎn)高速通信鏈路,NVSwitch則是連接多條鏈路的專用交換芯片,二者結(jié)合讓整個(gè)集群化身一塊“超級(jí)GPU”。
高性能卡間互聯(lián)芯片,已是AI數(shù)據(jù)中心僅次于計(jì)算芯片的第二大核心資本開支。
傳統(tǒng)以太網(wǎng)和InfiniBand在性能上與NVLink存在數(shù)量級(jí)差距:英偉達(dá)最新的NVLink 6能提供3.6TB/s的雙向帶寬,而目前最快的400G以太網(wǎng)實(shí)際有效帶寬僅約50GB/s。
這意味著跨服務(wù)器傳輸數(shù)據(jù)時(shí),GPU大部分時(shí)間都在空等,算力利用率會(huì)斷崖式下跌。
國產(chǎn)GPU廠商近年進(jìn)步顯著,部分產(chǎn)品單卡性能已接近英偉達(dá)中高端水平,但互聯(lián)技術(shù)的短板始終存在。
沒有自主高速互聯(lián)技術(shù),國產(chǎn)GPU就無法組成大規(guī)模集群,也就無法訓(xùn)練真正的世界級(jí)大模型。
這正是探微芯聯(lián)的出現(xiàn),被行業(yè)視為里程碑事件的原因。
![]()
清華系的破局,全棧自研的“中國高速路”
大模型時(shí)代的算力需求,有一個(gè)很容易被忽略的變化:模型越大,算力越需要被組織起來。
問題也隨之而來,多卡協(xié)作并不等于簡單疊加。卡與卡之間要頻繁交換梯度、激活值、權(quán)重分片、專家路由結(jié)果和KV緩存信息。通信一旦跟不上,昂貴的計(jì)算單元就會(huì)等待數(shù)據(jù),峰值算力也會(huì)變成紙面數(shù)字。
換句話說,國產(chǎn)AI算力要繼續(xù)向前,不能只補(bǔ)“計(jì)算芯片”這一塊短板,還要補(bǔ)“系統(tǒng)級(jí)互聯(lián)”這一塊硬骨頭。
國產(chǎn)AI芯片要追趕英偉達(dá),不能只在單卡指標(biāo)上做文章。真正難的是,能否讓多張國產(chǎn)XPU在真實(shí)大模型任務(wù)中高效協(xié)同。誰能解決這個(gè)問題,誰就站在國產(chǎn)AI基礎(chǔ)設(shè)施的關(guān)鍵路口。
從產(chǎn)品結(jié)構(gòu)看,探微芯聯(lián)試圖構(gòu)建“協(xié)議+模塊+交換芯片+集合通信庫+動(dòng)態(tài)路由算法”的完整體系。
探微芯聯(lián)的技術(shù)底氣,源自清華大學(xué)類腦計(jì)算研究中心十余年的深厚積淀。該中心2014年成立,是國內(nèi)最早開展全鏈條類腦計(jì)算研究的團(tuán)隊(duì),成果曾兩次登上《Nature》封面。
創(chuàng)始人劉學(xué)作為中心工程研究員、總工,主導(dǎo)研制了國內(nèi)三代億級(jí)神經(jīng)元類腦集群,攻克了大規(guī)模并行計(jì)算系統(tǒng)的通信核心難題。
類腦計(jì)算與傳統(tǒng)AI計(jì)算雖技術(shù)路線不同,但在大規(guī)模集群互聯(lián)上面臨著完全相同的挑戰(zhàn)。
團(tuán)隊(duì)在類腦集群領(lǐng)域積累的數(shù)百人年工程經(jīng)驗(yàn),讓探微芯聯(lián)能在成立短短7個(gè)月內(nèi),拿出成熟的全棧式解決方案。
其核心的ACCLink+ACCSwitch技術(shù),從底層通信協(xié)議、XPU通信模塊、超高速交換芯片,到上層集合通信庫、動(dòng)態(tài)路由算法實(shí)現(xiàn)了100%自主可控。
ACCLink協(xié)議支持納秒級(jí)低時(shí)延無損通信,具備完整的自研CTX通信語義,支持字節(jié)級(jí)對(duì)齊和任意地址數(shù)據(jù)搬移,還兼容多種Scale-up網(wǎng)絡(luò)協(xié)議。
ACCSwitch交換芯片最高可支持4096個(gè)XPU互聯(lián)、512個(gè)XPU組播優(yōu)化,能將數(shù)千張國產(chǎn)GPU整合成統(tǒng)一的計(jì)算資源池。
在國產(chǎn)GPU架構(gòu)百花齊放的當(dāng)下,這種“分層設(shè)計(jì)”無需觸及廠商的計(jì)算和存儲(chǔ)核心技術(shù),就能幫助國產(chǎn)XPU快速補(bǔ)齊互聯(lián)短板,完美適配了國內(nèi)算力生態(tài)的結(jié)構(gòu)性需求。
目前,ACCLink IP已完成硅驗(yàn)證,探微芯聯(lián)也與國內(nèi)大部分XPU領(lǐng)先廠商達(dá)成合作,通過了部分客戶的產(chǎn)品驗(yàn)證。
這些技術(shù)指標(biāo)背后,真正重要的不是概念多復(fù)雜,而是它切中了國產(chǎn)XPU生態(tài)的現(xiàn)實(shí)痛點(diǎn)。
![]()
資本集體押注,超節(jié)點(diǎn)產(chǎn)業(yè)的黃金窗口
本輪融資的投資方陣容堪稱豪華,涵蓋國資、產(chǎn)業(yè)資本與市場(chǎng)化機(jī)構(gòu)三大陣營,背后是全行業(yè)對(duì)Scale-up超節(jié)點(diǎn)賽道的一致看好。
國資陣營中,金浦投資、首都科技發(fā)展集團(tuán)、中關(guān)村科學(xué)城等機(jī)構(gòu)的入局,體現(xiàn)了國家對(duì)AI基礎(chǔ)設(shè)施自主可控的戰(zhàn)略重視;產(chǎn)業(yè)資本方面,浪潮信息、軟通動(dòng)力的戰(zhàn)略投資尤為關(guān)鍵。
作為全球領(lǐng)先的AI服務(wù)器廠商和IT服務(wù)提供商,它們的加入不僅是技術(shù)認(rèn)可,更意味著探微芯聯(lián)的方案將快速融入國產(chǎn)算力產(chǎn)業(yè)鏈,實(shí)現(xiàn)深度適配與聯(lián)合優(yōu)化;華蓋資本、創(chuàng)新工場(chǎng)等市場(chǎng)化機(jī)構(gòu)的參與,則印證了其商業(yè)前景的確定性。
華泰證券測(cè)算,2028年國產(chǎn)超節(jié)點(diǎn)市場(chǎng)空間將達(dá)到3414億元,2026至2028年復(fù)合年增長率高達(dá)194%;其中Scale-up交換芯片作為核心環(huán)節(jié),同期市場(chǎng)規(guī)模將達(dá)129億元,復(fù)合增長率212%。
超節(jié)點(diǎn)的核心價(jià)值,在于重新定義了算力的競(jìng)爭(zhēng)邏輯。當(dāng)芯片制程逼近物理極限,算力競(jìng)爭(zhēng)已從單一的“單卡性能”轉(zhuǎn)向“系統(tǒng)效率”的綜合比拼。
客戶一旦采用某家的超節(jié)點(diǎn)方案,從上層應(yīng)用到底層調(diào)度都會(huì)深度綁定,形成極強(qiáng)的客戶粘性。
![]()
商業(yè)想象力在“中立互聯(lián)層”
硬科技公司最怕技術(shù)很強(qiáng)、位置很窄。探微芯聯(lián)的看點(diǎn)在于,它不是只服務(wù)某一顆芯片,也不是只做某個(gè)單點(diǎn)模塊,而是希望成為國產(chǎn)XPU生態(tài)里的中立互聯(lián)層。
探微芯聯(lián)的多模態(tài)Switch交換芯片,除支持自研ACCLink協(xié)議外,也支持多種Scale-up網(wǎng)絡(luò)協(xié)議,以解決不同協(xié)議規(guī)范及廠商私有化修改帶來的互連互通問題。
這句話背后是一個(gè)很現(xiàn)實(shí)的商業(yè)邏輯:國產(chǎn)AI芯片廠商短期內(nèi)很難收斂到同一種架構(gòu)、同一種協(xié)議、同一種軟件生態(tài)。
多路線并存會(huì)持續(xù)很長時(shí)間。此時(shí),誰能降低各家XPU進(jìn)入超節(jié)點(diǎn)架構(gòu)的門檻,誰就可能成為產(chǎn)業(yè)鏈里的“連接器”。
從客戶角度看,探微芯聯(lián)的價(jià)值可能體現(xiàn)在三層。
①幫助XPU廠商縮短Scale-up能力研發(fā)周期:自研高速互聯(lián)協(xié)議和交換芯片門檻很高,涉及信號(hào)、協(xié)議、緩存一致性、流控、路由、集合通信、系統(tǒng)調(diào)度等復(fù)雜環(huán)節(jié)。單一芯片公司獨(dú)自補(bǔ)齊,成本高、周期長、風(fēng)險(xiǎn)大。
②幫助整機(jī)廠商構(gòu)建國產(chǎn)超節(jié)點(diǎn)方案:浪潮信息、軟通動(dòng)力等產(chǎn)業(yè)投資方出現(xiàn)在本輪融資名單中,本身就說明Scale-up互聯(lián)已不只是芯片廠商的問題,也關(guān)系到服務(wù)器、智算中心、云服務(wù)和行業(yè)解決方案的落地。
③幫助終端客戶獲得更可控的國產(chǎn)AI基礎(chǔ)設(shè)施:對(duì)運(yùn)營商、云廠商、政企智算中心而言,國產(chǎn)算力替代最終要落到可交付、可擴(kuò)容、可運(yùn)維。互聯(lián)層越成熟,國產(chǎn)集群的總體擁有成本和使用體驗(yàn)越接近商業(yè)化要求。
這就是探微芯聯(lián)的產(chǎn)業(yè)價(jià)值:它不在聚光燈最亮的“芯片算力”位置,卻可能決定國產(chǎn)芯片能否被組織成真正可用的大規(guī)模系統(tǒng)。
![]()
結(jié)尾:
在大模型的世界里,孤立的強(qiáng)大越來越難形成優(yōu)勢(shì)。真正稀缺的,是讓許多強(qiáng)大單元高效協(xié)作的能力。
芯片決定算力的起點(diǎn),互聯(lián)決定算力的上限。
國產(chǎn)AI基礎(chǔ)設(shè)施要走到更深處,下一場(chǎng)硬仗,就在卡與卡之間。
部分資料參考:36氪:《探微芯聯(lián)連續(xù)完成數(shù)億元融資,國內(nèi)首家全棧式對(duì)標(biāo)英偉達(dá)「NVLink+NVSwitch」架構(gòu)》,TengNews財(cái)經(jīng)網(wǎng):《探微芯聯(lián)完成數(shù)億元天使+及Pre-A輪融資,資本合力推動(dòng)國產(chǎn)Scale-up超節(jié)點(diǎn)完整解決方案》,Leads:《北京探微芯聯(lián)科技有限公司分析報(bào)告》
本公眾號(hào)所刊發(fā)稿件及圖片來源于網(wǎng)絡(luò),僅用于交流使用,如有侵權(quán)請(qǐng)聯(lián)系回復(fù),我們收到信息后會(huì)在24小時(shí)內(nèi)處理。
請(qǐng)務(wù)必注明:
「姓名 + 公司 + 合作需求」
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.