過去幾年,Scaling Law深刻塑造了AI行業(yè)的發(fā)展軌跡:不斷堆算力、堆數(shù)據(jù)、堆參數(shù)規(guī)模,以換取智能的涌現(xiàn)。
隨著Agent時(shí)代的降臨,對(duì)算力的需求漸漸從預(yù)訓(xùn)練轉(zhuǎn)向推理,海量的Token消耗從根本上重塑了整個(gè)產(chǎn)業(yè)的評(píng)價(jià)體系。在“Token經(jīng)濟(jì)學(xué)”的敘事下,重心開始向更低的延遲、更高的能源效率傾斜。
當(dāng)單純擴(kuò)大規(guī)模帶來的邊際效益開始遞減,行業(yè)亟需回答:怎么在限的能源、空間與信息邊界內(nèi),產(chǎn)出更高密度的智能?
在5月8日舉行的NAVIGATE 2026領(lǐng)航者峰會(huì)上,我們與新華三集團(tuán)技術(shù)委員會(huì)副主席劉新民進(jìn)行了一場(chǎng)對(duì)話,得到的答案是:AI基礎(chǔ)設(shè)施正從單一的硬件競(jìng)爭(zhēng),進(jìn)入系統(tǒng)重構(gòu)與架構(gòu)創(chuàng)新的“系統(tǒng)工程競(jìng)爭(zhēng)”。
01 拒絕“參數(shù)崇拜”:從“設(shè)備思維”到“系統(tǒng)思維”
全行業(yè)都在瘋狂卷參數(shù)、卷規(guī)模的背景下,劉新民提出了一個(gè)直擊靈魂的悖論:“設(shè)備參數(shù)這么強(qiáng),為什么還需要調(diào)優(yōu)呢?”
一語點(diǎn)破了AI時(shí)代最大的產(chǎn)業(yè)變革。
在傳統(tǒng)ICT的語境里,評(píng)價(jià)設(shè)備能力的邏輯很簡(jiǎn)單,比拼的是CPU性能、網(wǎng)絡(luò)帶寬、存儲(chǔ)IOPS、單機(jī)吞吐等靜態(tài)指標(biāo),似乎只要把最頂級(jí)的算力卡、最高速的無損網(wǎng)絡(luò)和最大容量的存儲(chǔ)連接在一起,就能發(fā)揮出最大效能。
但在大模型推理環(huán)節(jié),Token的產(chǎn)出是一個(gè)依賴動(dòng)態(tài)協(xié)同的過程,即使單體硬件性能指標(biāo)再高,如果底層架構(gòu)的數(shù)據(jù)流轉(zhuǎn)沒有打通,實(shí)際運(yùn)行大模型時(shí)依然無法跑得“通透”。硬件的堆砌只提供了理論上的性能上限,深度的系統(tǒng)級(jí)工程能力,才真正決定了算力轉(zhuǎn)化為生產(chǎn)力的效率。
為什么傳統(tǒng)的“設(shè)備思維”注定走向終結(jié)?劉新民在NAVIGATE 2026領(lǐng)航者峰會(huì)技術(shù)創(chuàng)新峰會(huì)的演講中提出了三個(gè)結(jié)構(gòu)性“剪刀差”。
![]()
首先是數(shù)據(jù)的“剪刀差”。
目前互聯(lián)網(wǎng)上的高質(zhì)量文本數(shù)據(jù)已近枯竭,而大模型對(duì)高價(jià)值語料的渴求仍在爆炸式增長(zhǎng)。在數(shù)據(jù)孤島、合成數(shù)據(jù)質(zhì)量差等約束下,核心矛盾不是數(shù)據(jù)不夠用,而是缺乏可信好用的數(shù)據(jù)。
其次是算力的“剪刀差”。
當(dāng)芯片制程無限接近物理學(xué)極限,摩爾定律的放緩已是不爭(zhēng)的事實(shí)。更致命的是傳統(tǒng)馮·諾依曼架構(gòu)的瓶頸——在大模型的訓(xùn)練與推理中,95%以上的算時(shí)被消耗在數(shù)據(jù)搬運(yùn),而非真正的計(jì)算上。
最后是能源的“剪刀差”。
AI算力需求的翻倍僅需一年,傳統(tǒng)電網(wǎng)基建的規(guī)劃與擴(kuò)容周期則要5到10年。能源的線性供給速度,可能永遠(yuǎn)都追不上功耗需求的指數(shù)曲線,單純硬件擴(kuò)容將不可避免的遇到一道道的“能源墻”。
三個(gè)無法逾越的“剪刀差”,揭示了:算力底座的進(jìn)化,絕非某個(gè)單一要素的優(yōu)化,必須是一次全局性的系統(tǒng)進(jìn)化。
劉新民在對(duì)話中談到了這樣一段經(jīng)歷:“我們自己內(nèi)部的一個(gè)解決方案,最初看上去,產(chǎn)品配置、參數(shù)指標(biāo)、理論方案都很漂亮,但真正落到實(shí)戰(zhàn)時(shí),總感覺競(jìng)爭(zhēng)力不夠。后來團(tuán)隊(duì)花了半年時(shí)間,重新去摳每一個(gè)細(xì)節(jié):設(shè)備如何組合、網(wǎng)絡(luò)怎樣優(yōu)化、鏈路如何調(diào)度、資源如何分配,甚至細(xì)化到系統(tǒng)每一個(gè)層級(jí)的協(xié)同效率。最終發(fā)現(xiàn),真正拉開差距的,并不是多堆幾張卡,而是隱藏在系統(tǒng)背后的工程化能力。”
作為ICT行業(yè)的務(wù)實(shí)派,新華三身體力行地印證了:AI基礎(chǔ)設(shè)施的競(jìng)爭(zhēng),已經(jīng)從“設(shè)備思維”走向“系統(tǒng)思維”,誰能把復(fù)雜系統(tǒng)真正調(diào)到極致,誰才能把理論算力轉(zhuǎn)化成實(shí)實(shí)在在的生產(chǎn)力。
02 打破物理極限:“算—存—云”三位一體的算力底座
回到當(dāng)下最熱門的課題:面對(duì)海量的Token消耗,怎么解決算力體系普遍存在的性能和效率瓶頸呢?
劉新民的回答是:“算力底座不是硬件的簡(jiǎn)單堆疊,而是系統(tǒng)重構(gòu)和架構(gòu)創(chuàng)新,從而構(gòu)筑起支撐智能體高效運(yùn)行的堅(jiān)實(shí)基座。”相對(duì)應(yīng)的,新華三正在打造“算—存—云”三位一體的算力底座。
深挖一層的話,可以歸納為四大核心能力。
![]()
第一個(gè)是硬件工程能力。
在不“堆硬件”的理念下,新華三在硬件設(shè)計(jì)上下了很大功夫:通過創(chuàng)新主板、小型化設(shè)計(jì)、冷板共用等創(chuàng)新,在標(biāo)準(zhǔn)1U空間內(nèi)集成6顆高性能CPU,實(shí)現(xiàn)了“一柜頂五柜”的效果。為了確保超高密架構(gòu)穩(wěn)定運(yùn)行,新華三還推出了業(yè)界首個(gè)量產(chǎn)的全液冷整機(jī)系統(tǒng),實(shí)現(xiàn)了100%全液冷散熱。
第二個(gè)是極致存儲(chǔ)能力。
在推理階段,Token的生產(chǎn)成本主要取決于數(shù)據(jù)流動(dòng)效率。新華三的解法是面向AI場(chǎng)景進(jìn)行全棧優(yōu)化:比如通過AI算法實(shí)現(xiàn)智能緩存預(yù)取,提升了緩存命中率和讀取性能;通過KV Cache加速技術(shù),打破推理中的顯存限制和數(shù)據(jù)瓶頸,使Token首次時(shí)延降低90%、重復(fù)IO請(qǐng)求節(jié)省80%。
第三個(gè)是云智融合能力。
通過“通智融合”與“一云多芯”架構(gòu),新華三實(shí)現(xiàn)了異構(gòu)算力統(tǒng)一調(diào)度、資源池化與高效復(fù)用,可保障業(yè)務(wù)在10萬節(jié)點(diǎn)規(guī)模下持續(xù)穩(wěn)定運(yùn)行。同時(shí)研發(fā)了智算加速引擎,將跨節(jié)點(diǎn)通信時(shí)延降低了50%,并利用算子融合與內(nèi)存池化技術(shù),打破了單卡顯存瓶頸,將模型的推理效率提升了20%。
第四個(gè)是多元生態(tài)能力。
面對(duì)各類GPU各異、標(biāo)準(zhǔn)不一的行業(yè)現(xiàn)狀,新華三以開放架構(gòu)為核心,通過異構(gòu)算力生態(tài)、算力互聯(lián)生態(tài)與融合軟件生態(tài),構(gòu)建了多元開放的算力體系,目的是實(shí)現(xiàn)多廠商GPU平滑接入與統(tǒng)一協(xié)同,進(jìn)而推動(dòng)算網(wǎng)深度融合,為百行百業(yè)的客戶實(shí)現(xiàn)更靈活、高效的最優(yōu)算力配置。
新華三的思路并不復(fù)雜,用一句話概括的話,即通過超高密架構(gòu)和全液冷設(shè)計(jì)提升硬件性能;利用高性能存儲(chǔ)和KV Cache加速突破數(shù)據(jù)瓶頸;依托“通智融合”調(diào)度與AI超融合優(yōu)化資源分配;最終以多元算力開放生態(tài),實(shí)現(xiàn)全域資源池化與聚合。
需要說明的是,新華三并未止步于“畫藍(lán)圖”,正在用一個(gè)個(gè)量產(chǎn)的產(chǎn)品加速將理念落地:
比如兼容多CPU平臺(tái)、適配100款以上AI加速卡的R5500 G7X模組機(jī)型,單卡功耗釋放比上一代提升了42%;面向智算場(chǎng)景的X10000系列XCache推理加速系統(tǒng),可實(shí)現(xiàn)KV多級(jí)緩存卸載,在同等算力下將用戶并發(fā)數(shù)和Token產(chǎn)出效率提升10倍;UniPoD S80000系列超節(jié)點(diǎn)產(chǎn)品,1024卡超節(jié)點(diǎn)可通過Scale-Up擴(kuò)展至16384卡,同時(shí)支持73728卡超大規(guī)模集群……
劉新民在對(duì)話中多次提到:新華三的愿景是通過系統(tǒng)級(jí)重構(gòu),實(shí)現(xiàn)“每一瓦電力到每一個(gè)Token產(chǎn)出”的最優(yōu)效率。
03 跨周期的長(zhǎng)期主義:構(gòu)建擬態(tài)AI原生基礎(chǔ)設(shè)施
一個(gè)無法回避的現(xiàn)實(shí)在于:大模型正在以周為計(jì)刷新、幾乎每天都有新的事物出現(xiàn),不確定成了AI時(shí)代的底色。
站在普通人的視角上,“不確定性”往往伴隨著一種獨(dú)特的魅力,可以天馬行空地想象十年后的日常。對(duì)于一家創(chuàng)新驅(qū)動(dòng)的技術(shù)企業(yè)而言,需要基于前瞻性的洞察提前布局,找到一條確定性的路徑。
未來十年的AI基礎(chǔ)設(shè)施將朝什么樣的方向進(jìn)化?目前還沒有確切答案,但新華三找到了一個(gè)獨(dú)特的視角。
劉新民在演講中做了一個(gè)形象的類比:人類大腦僅需約20瓦的極低功耗(僅相當(dāng)于幾片面包的能量),就能驅(qū)動(dòng)感知、決策、思考與行動(dòng)一體的高級(jí)智能。這種低碳高能、全感官融合、自組織且具備免疫自愈能力的形態(tài),正是未來AI基礎(chǔ)設(shè)施的終極藍(lán)圖。
怎么理解“類人智能的擬態(tài)AI原生基礎(chǔ)設(shè)施”呢?劉新民進(jìn)一步拆解了六大具備生命特征的形態(tài)跨越。
![]()
一是計(jì)算之“心”:構(gòu)建一種多范式混合的高效架構(gòu)。未來的計(jì)算架構(gòu)將是以馮·諾依曼架構(gòu)為基礎(chǔ),通過光互聯(lián)耦合存內(nèi)計(jì)算、類腦計(jì)算等多種計(jì)算范式,達(dá)到算效和能效的最優(yōu)化。
二是聯(lián)接之“神經(jīng)”:搭建全域高質(zhì)、多維融合的網(wǎng)絡(luò)。未來的聯(lián)接將是“通感智算一體化”,依托空心光纖等技術(shù)打破物理傳輸極限,并通過空天地一體化和自組織聯(lián)接實(shí)現(xiàn)集群協(xié)同。
三是是存儲(chǔ)之“記憶”:塑造主動(dòng)知識(shí)載體。利用類腦存算一體架構(gòu),減少數(shù)據(jù)搬運(yùn)能耗;通過語義編碼與知識(shí)固化,將數(shù)據(jù)轉(zhuǎn)化為隨時(shí)調(diào)用的知識(shí);并將存儲(chǔ)嵌入推理鏈路實(shí)現(xiàn)“以查代算”。
四是交互之“大腦”:構(gòu)建與物理世界交互的中樞。過去的AI像是“缸中之腦”,未來的智能必須擁有“軀體”,理解重力,感知因果,讓AI從云端走進(jìn)現(xiàn)實(shí),高效管理萬億級(jí)智能體運(yùn)行。
五是安全的“免疫”:構(gòu)建自治自愈的防御體系。未來的安全將告別事后審計(jì),構(gòu)建物理隔離的動(dòng)態(tài)校驗(yàn)屏障、提前識(shí)別背離人類價(jià)值的惡性邏輯、邏輯可審計(jì)、因果可追溯等能力。
六是能源之“呼吸”:打造低碳循環(huán)的能源基石。未來的AI數(shù)據(jù)中心,將改變傳統(tǒng)的供電散熱邏輯,成為以Token為核心的能源底座,實(shí)現(xiàn)算、電、熱的精準(zhǔn)匹配,讓PUE無限接近于1。
聽起來有些不可思議,卻是新華三下一個(gè)十年的戰(zhàn)略錨點(diǎn),目前已經(jīng)前瞻布局通感算智融合的新型網(wǎng)絡(luò)、存算一體新型計(jì)算范式、內(nèi)生免疫安全等前沿技術(shù)方向,目標(biāo)是構(gòu)筑一個(gè)永續(xù)共生、內(nèi)生進(jìn)化的AI原生基礎(chǔ)設(shè)施。
可以佐證的是,新華三在幾年前就聯(lián)合科研機(jī)構(gòu)進(jìn)行了長(zhǎng)達(dá)2000公里的測(cè)試,驗(yàn)證了光技術(shù)在長(zhǎng)距離傳輸時(shí)的時(shí)延和確定性,當(dāng)初也曾不被理解,現(xiàn)在被證實(shí)是AI時(shí)代的剛需。
04 寫在最后
當(dāng)大模型的喧囂與資本的狂熱逐漸歸于平靜,產(chǎn)業(yè)終將回歸商業(yè)效率與技術(shù)演進(jìn)的客觀本質(zhì)。
就像Token經(jīng)濟(jì)學(xué)所昭示的:AI算力基礎(chǔ)設(shè)施的使命,不再是無休止地堆砌物理參數(shù),而是要在系統(tǒng)工程的極限逼近中,實(shí)現(xiàn)從每一瓦電力到每一個(gè)智能Token產(chǎn)出的最優(yōu)解。
至少在AGI時(shí)代的破曉之際,新華三在內(nèi)的企業(yè)已經(jīng)在“無人區(qū)”里完成了對(duì)算、網(wǎng)、存全棧能力的底層重構(gòu),不斷向生命系統(tǒng)的進(jìn)化汲取智慧,默默為數(shù)智經(jīng)濟(jì)夯實(shí)了最堅(jiān)固的底座。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.