![]()
![]()
在風口上,但不搶風口;少造概念,精耕務實,做AI發展的筑基者
文| 吳俊宇
編輯|謝麗容
2026年,整個算力產業鏈上下游都處于供不應求的狀態。芯片、存儲、內存、高速交換機、云資源幾乎都是如此。市場對算力的饑渴,到了近四年間的高點。
原因是市場當下的重點已轉向“用好AI”,基礎模型加速迭代,智能體快速普及,Token消耗指數級增長,這直接驅動算力基礎設施建設大干快上,對AI算力產業鏈相關硬件的需求隨之激增。
據我們的不完全統計,2025年12月1日-2026年4月24日,全球11家主流模型公司,144天內至少發布或迭代了53款模型,每2.7天就會有一款模型發布或迭代。
國際市場調研機構IDC 2026年預測,全球活躍Agent(智能體)數量將從2025年的2860萬,增長至2030年的22.16億。五年后,活躍Agent數量將是目前的近80倍。
國家數據局3月24日顯示,截至今年3月,中國日均Token(詞元)調用量已超過140萬億,相比2024年初的1000億增長了1400倍。
新華三是中國少數具備全棧AI基礎設施能力的廠商之一,也是這一輪AI基礎設施建設的重要參與者。它直接受益于這一輪算力風口。
新華三2025年營收759.81億元,同比增長37.96%;凈利潤達到31.51億元,同比增長12.30%。進入2026年,高增長勢頭延續:一季度營收221.89億元,同比增長45.08%;凈利潤9.49億元,同比增長28.16%。
高增長背后,亢奮和焦慮也暗涌如潮。5月8日,NAVIGATE 2026領航者峰會演講中,新華三集團總裁兼首席執行官于英濤提到,他和產業鏈上下游一輪又一輪深聊后,感受到亢奮和焦慮的情緒同時彌漫。
一方面,新概念、新技術層出不窮。全球AI基礎設施已投入超萬億美元。大模型從實驗室走向百行百業。每一家企業都在喊“All in AI”。美國納斯達克和中國的AI概念股,連創歷史上從未觸達的新高。
另一方面,算力投入巨大,但ROI(投資回報率)依然模糊。部分數據中心GPU(圖形處理器)利用率不足六成。芯片斷供的陰影揮之不去,內存價格翻了數倍還難以正常供貨。企業家擔心公司被AI顛覆,職場人擔心崗位被AI替代,政府官員擔心AI帶來治理挑戰。
面對亢奮和焦慮并存的市場情緒,在一場小規模溝通中,于英濤分享了新華三的戰略路徑思考:
新華三是中國少數幾家具備全棧AI基礎設施的廠商之一,也是少數能夠幫客戶真正落地AI的企業之一。新華三在風口上,但不搶風口。新華三的基因是AI基礎設施,我們希望聚焦、聚焦,再聚焦,專注自身基因做擅長的事。計算、存儲、網絡、云、安全、運維這些基本業務,要做好、做深、做透,做到最前沿。
于英濤認為,把產品做到極致,把解決方案做到最優,這是新華三應該做的事情。不造概念,精耕務實,做AI發展的筑基者。
![]()
把Token成本打下來
“Token經濟”是英偉達創始人黃仁勛今年3月在GTC 2026上提出的概念。
Token正在成為計量算力的最小單位,不僅成了很多公司AI轉型的“北極星指標”,也成一些算力公司的核心銷售指標。
過去,企業采購AI基礎設施時,更關注GPU數量與模型參數等指標。但在今天,企業越來越關心,同樣的預算到底能生成多少有效Token。
于英濤談到一個細節,在和很多政企客戶交流時,他們更關注AI到底能否解決業務問題,而對GPU、交換機等硬件本身并不敏感。
但問題在于,今天的Token成本依然高昂。
過去三年,單位Token成本已經降低了90%以上。不過,隨著大模型與智能體快速普及,企業整體Token消耗量正在以百倍速度增長。每一個Token背后,又都對應著芯片、網絡、存儲、調度與電力資源的消耗。因此,企業的算力綜合成本也在持續攀升。
因此,AI基礎設施的競爭,現在比拼的不只是芯片性能、模型參數,更多是系統效率。
在于英濤看來,AI的瓶頸在系統,而不在單點。計算、存儲、網絡、云、安全、運維這六個重點環節,最終都會影響單位Token成本。
這也正是新華三今天在AI產業中的位置:它不做模型、不直接賣Token,但它在不斷深度優化AI基礎設施,直接影響Token生成的成本與效率。
降低單位Token成本,已經是新華三當前AI基礎設施能力建設的重要方向。算力與調度,是其中兩個關鍵環節。
芯片性能是決定Token成本的核心因素。中國市場在先進GPU長期緊缺、單卡性能相對不足的背景下,正在采取超節點這種解決方案。
超節點,指的是把成百上千枚AI芯片集成在一個算力機柜中,常見規格包括32卡、64卡、128卡、256卡、512卡乃至1024卡。它的核心并非簡單堆疊芯片數量,而是用更大集群規模、更快的帶寬網絡、更高的調度系統,把芯片組織成一個高效運行的整體。這可以減少因通信、散熱等造成的損耗,進而提升整體有效算力。
新華三推出的UniPoD S80000系列超節點解決方案,支持萬億參數大模型的訓練與推理,據新華三披露,該平臺可將大模型訓練性能提升70%,推理性能提升3倍;同時采取液冷散熱方案,降低大規模集群運行過程中的能源消耗。
在當下國內算力市場開始把超節點的紙面規模和參數過度營銷的背景下,于英濤強調,新華三希望為客戶提供真正可交付、可運行的超節點,而不是造概念。目前,新華三的超節點解決方案已經成功交付給多家互聯網公司及政企機構。
除了芯片性能本身,云的調度能力也是直接影響單位Token成本的關鍵因素。
新華三也推出了相應的產品方案。新華三披露的信息顯示,它推出的新一代AI智能云支持100多種AI芯片統一納管,提供100多種MaaS(模型服務)能力。在理想環境下的模型浮點運算利用率(Model FLOPs Utilization,MFU)上限可達到82%。
一位服務多家政企機構的算力基礎設施技術人士對我們表示,買不到芯片會滯后。買到卻浪費,會一直落后。過去大家對芯片、模型關注度更多。對云這種系統工程關注少。
他進一步解釋,今天的調度、適配與系統協同能力的重要性正在快速提升。做好這些工作,有可能將同樣的芯片、同樣的模型發揮出數倍甚至數十倍的Token吞吐性能。
![]()
算力消納才是真本事
2023年-2025年,中國AI產業的重點是建算力基礎設施。
當時,各地規劃了數億元甚至數十億元建設算力中心,但部分地方算力閑置率甚至很高。
信通院兩年前曾做過一次統計,截至2024年5月,全國建設規劃中的智算中心共有185座,總算力約272 EFLOPS(每秒百億億次浮點運算次數),已建成并投入運營的算力約104 EFLOPS。云服務形式對外提供算力的比例為23%。這意味著,一部分芯片仍以封閉分散的方式運行,利用率尚未被充分挖掘。
2026年,整個市場正在進入用算力的階段。在算力資源短缺且價格高漲的情況下,重資產投算力已經不是所有企業都能玩的游戲。一些地方過去三年建設了大量亟待消納的算力,一些地方缺少算力資源卻希望使用算力。那么,如何解決市場供需匹配的問題?
![]()
于英濤認為,2026年已經不完全是投入重資產建算力的時代,而是到了也需要拼應用的時代。如何用好算力才是關鍵。他介紹,新華三獨創了“圖靈小鎮”、“芯模社區”這兩種創新模式,并且已經得到了相關部門和很多地區的支持。
“圖靈小鎮”其實是以AI為核心的產業集聚區,里面會有一批AI產業鏈企業。這種算力建設及運營模式,今天更多是在解決算力消納或使用的問題。
在某些算力資源不夠豐富的區域,地方甚至不需要花費數億元建設算力中心,只需要千萬級別的投資,搭建算力調度平臺,就可以從其他算力資源豐富的區域調度算力。于英濤認為,這樣不僅性價比更高,而且可以真正用好算力,做到算力資源跨區域合理配置。
“圖靈小鎮”已經在包括杭州、鄭州、咸陽、貴陽、西寧等全國十多個省市落地實踐,有數百家核心企業入駐。
事實上,跨區域調度算力,正在成為解決算力區域分配不均的重要做法。我們了解到,相關政策研究部門今年1月在一場閉門討論中提到,東部需求大但電力貴,西部資源多但本地需求少,且不同行業、不同時間的算力潮汐現象明顯。因此,跨區域的算力調度,是充分利用現有算力,減少閑置資源,實現合理配置的重要方法。
于英濤透露,新華三正在準備升級圖靈小鎮的定位。在他看來,“圖靈小鎮”并不只是傳統意義上的算力園區。它更像是一個圍繞Token生產、調度、使用的“Token工廠”。
“圖靈小鎮”解決的是算力運營與調度問題,“芯模社區”解決的是國產異構算力和國產模型的適配問題。這是新華三建設的一個AI產業社區。
目前中國市場有超過10家國產AI芯片公司(包括華為昇騰、阿里平頭哥、百度昆侖芯、海光、寒武紀等),他們正在從能用走向好用。超過10家被廣泛使用的主流模型廠商(DeepSeek、阿里千問、豆包、月之暗面、智譜、MiniMax、小米MiMo等)。尤其是國產模型,今年1月之后,國產模型輪番登上全球模型聚合平臺OpenRouter整體調用前三的位置。
為爭取客戶使用,國產AI芯片、國產模型廠商雙向都在追求Day0適配。但這種適配并不容易,工程師把基于英偉達CUDA軟件生態的代碼,重新寫在國產芯片的軟件棧上,再把計算精度對齊,最終讓國產芯片充分發揮效能(詳見)。
如何讓芯片與模型之間深度協同?新華三的“芯模社區”就是提供解決這個問題的場景。因為國產AI芯片和模型并不是單純靠實驗室適配形成的,它需要在真實客戶需求與實際業務場景中不斷錘煉,完成匹配、調優與協同,進而找到更優的場景組合方式。
新華三披露的數據顯示,“芯模社區”已涵蓋10多種主流芯片型號,已配套形成由90多種大模型、60多種鏡像構成的高價值算力資源庫,形成了5000套行業組合方案。
于英濤提到,目前各類國產模型在不同國產AI芯片的不同推理場景各具特點。新華三希望通過“芯模社區”的測試與適配結果,為不同行業客戶提供更合適的算力與模型組合建議,讓國產AI生態從能跑逐步走向好用。
![]()
下好“笨”工夫
在今天的AI熱潮中,每天都有新的概念,AI Fomo(恐慌)情緒正在席卷市場。無論是中國市場還是美國市場,芯片公司、模型公司的股價都在連連攀升。
AI既在改變產業,但也不乏泡沫。資本市場的變化令人炫目。新華三要如何在這種劇烈變革中務實選擇?于英濤認為,缺了冷靜的激情,叫沖動;缺了激情的冷靜,叫平庸。
“算力市場變成大風口之后,新華三的管理層仍然保持著冷靜和理性,我們優先考慮的是供應鏈穩定和客戶交付。”于英濤進一步解釋,新華三是一個技術和產品驅動的公司。要在充分保持供應鏈穩定的前提下,使用更好的芯片、更好的原材料、更好的軟件為客戶交付產品和解決方案。
2023年-2024年,中國市場競爭的重點是,買到足夠的芯片,訓練出更強的模型。但在2025年-2026年,競爭重點變成了——讓Agent應用真正跑起來,把國產異構算力(不同公司且不同技術標準的AI芯片通常被稱為異構算力)調度起來,把Token成本降下去。
隨著AI基礎設施進入供不應求階段,新華三正同時面對產業鏈上下游的雙重壓力。
因為隨著中美科技巨頭乃至全球算力資本開支高速增長,搶購算力已經成了2026年的現狀。國際市場調研機構Gartner數據顯示,2025年全球數據中心系統總支出高達5056億美元,同比增長51.6%,這是近五年來的最高水平。預計2026年全球數據中心系統總支出將高達7880億美元,同比增長55.8%,增速仍將繼續提升。
![]()
在搶購算力的背景下,GPU、CPU、存儲、內存、高速交換機,甚至是光模塊、銅模塊等核心部件都持續緊缺,部分產品甚至出現數倍漲幅。與此同時,大模型、Agent快速普及,政企客戶對算力基礎設施的需求在集中爆發。供給端和需求端正在出現割裂的局面。
這對企業的供應鏈管理能力有著很高的要求。一位存儲和內存供應鏈人士今年2月曾對我們表示,越是這個時候,越要保持冷靜。太激進,會導致庫存和現金流風險。太保守,又會導致無法為客戶穩定交付。
在這種背景下,能否持續穩定獲取核心器件,已經直接決定企業的交付能力與盈利能力。那么,新華三要如何在這種市場劇烈波動的環境中,持續做好AI基礎設施交付?
新華三的做法更偏向長期主義。一方面,新華三長期與全球核心產業鏈伙伴保持深度合作,通過長期協同機制提升關鍵資源的供應穩定性。另一方面,在AI需求快速增長、產業鏈持續緊張的背景下,新華三也和客戶高頻溝通協調,盡最大努力保障客戶側AI基礎設施的穩定落地與持續運行。
這一系列工作考驗的不只是產品能力,是整個AI基礎設施體系的系統運營能力。
做好這些工作,看起來并不是那么抓人眼球。它不像模型公司那樣,每隔一兩個月就能刷新基準測試榜單;也不像芯片公司那樣,能夠快速獲得市場關注與資本追捧。
它真正關注的是這些問題——如何穩定獲取芯片、內存與高速網絡資源?如何把不同芯片、模型與軟件棧真正調度起來?如何在供應鏈劇烈波動中維持交付?如何讓客戶真正把AI系統穩定運行起來?
這個過程中,新華三扮演的角色,不是追逐風口,而是成為AI產業背后的算力筑基者——它不僅在為中國算力市場穩定供應鏈,也在為AI應用落地提供基礎設施。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.