![]()
當(dāng)AI正式邁入萬億Token時代,算力需求迎來爆發(fā)式增長,國產(chǎn)GPU行業(yè)也從“單點(diǎn)突圍”進(jìn)入“全域競爭”的關(guān)鍵周期,AI算力從“稀缺資源”加速邁向“結(jié)構(gòu)性過剩”,當(dāng)國內(nèi)市場“國產(chǎn)替代”的紅利窗口期開始收窄,中國GPU行業(yè)的競爭邏輯正在發(fā)生根本性轉(zhuǎn)變。單純比拼單卡峰值算力、簡單對標(biāo)英偉達(dá)的技術(shù)路線,正走向同質(zhì)化的價格泥潭。
云邊端協(xié)同構(gòu)建算力閉環(huán)
GPU行業(yè)的競爭,早已從單一芯片性能比拼,升級為全場景產(chǎn)品能力與生態(tài)適配能力的綜合較量。摩爾線程的核心競爭力,在于其堅(jiān)持“全功能GPU”的技術(shù)路線,打破了AI芯片、圖形芯片、通用計(jì)算芯片的場景壁壘,構(gòu)建起覆蓋云端智算、端側(cè)應(yīng)用的完整產(chǎn)品矩陣,形成了“算力底座+場景應(yīng)用”的雙向賦能格局。
云端算力作為摩爾線程的核心布局領(lǐng)域,承擔(dān)著大模型訓(xùn)練、大規(guī)模仿真、科學(xué)計(jì)算等高端算力需求,其產(chǎn)品組合以“夸娥(KUAE)智算集群”為核心,搭配MTT S5000旗艦智算卡與智算一體機(jī),形成了從單卡到萬卡級集群的完整解決方案。
在端側(cè)領(lǐng)域,摩爾線程以自研“長江”智能SoC芯片為核心,構(gòu)建起覆蓋個人、家庭、行業(yè)的端側(cè)AI產(chǎn)品矩陣,實(shí)現(xiàn)了“云端訓(xùn)練—端側(cè)部署”的算力閉環(huán)。“長江”SoC芯片作為端側(cè)算力基石,采用異構(gòu)計(jì)算架構(gòu),集成8個主頻高達(dá)2.65GHz的全大核CPU、全功能GPU及高能效NPU,提供50TOPS的異構(gòu)AI算力,支持INT8/FP16/FP32等混合精度計(jì)算,可在端側(cè)流暢運(yùn)行百億參數(shù)大模型,配合136GB/s的超高內(nèi)存帶寬與最高64GB的LPDDR5X高速統(tǒng)一內(nèi)存,兼顧了高性能與低功耗,適配各類端側(cè)設(shè)備的部署需求
基于“長江”SoC芯片,摩爾線程在本次產(chǎn)品發(fā)布會上推出了三大端側(cè)核心產(chǎn)品:MTT AIBOOK AI算力本、MTT AICUBE家庭AI中樞與MTT E300邊緣AI模組。
全功能GPU是核心競爭力
在AI芯片集體對標(biāo)英偉達(dá)的擁擠賽道中,任何僅僅是“對標(biāo)”的路徑最終都將陷入價格戰(zhàn)。真正的護(hù)城河,來自于競爭對手難以同時復(fù)制的多重能力組合。除了云端邊的全場景布局之外,摩爾線程真正的護(hù)城河在于“全功能GPU”這條技術(shù)路徑。所謂全功能GPU,是指在統(tǒng)一架構(gòu)的單顆芯片上,同時具備AI計(jì)算、3D圖形渲染、物理仿真和超高清視頻編解碼四大核心能力。這種“算、渲、仿”一體化的架構(gòu)設(shè)計(jì),在業(yè)內(nèi)極少數(shù)企業(yè)(如英偉達(dá))之外尚無人具備規(guī)模化量產(chǎn)能力。
這個選擇的戰(zhàn)略代價非常清晰:設(shè)計(jì)復(fù)雜度極高、兼容挑戰(zhàn)巨大、研發(fā)戰(zhàn)線極長。一款圖形GPU的設(shè)計(jì)復(fù)雜度本已不亞于AI芯片,而將兩者統(tǒng)一到同一架構(gòu)并兼顧物理仿真與編解碼,意味著在指令集、緩存層級、計(jì)算單元調(diào)度等多維度都要做架構(gòu)層面的融合設(shè)計(jì)。從2025年MUSA軟件棧已實(shí)現(xiàn)700多個API兼容、PyTorch算子層面100%兼容的進(jìn)展來看,摩爾線程正在逼近這個“不可能三角”的平衡點(diǎn)。
為什么值得付出這樣的代價?因?yàn)槲锢鞟I和具身智能的崛起正在改變算力需求的底層邏輯。正如發(fā)布會上摩爾線程CEO張建中所述,具身智能體的訓(xùn)練不僅需要AI算力來“思考”,更需要圖形渲染來“看見”虛擬環(huán)境,還需要物理仿真來“觸碰”物體的運(yùn)動規(guī)律。將三者分立在不同芯片上完成,意味著數(shù)據(jù)的跨芯片搬運(yùn)、異構(gòu)編程和仿真到現(xiàn)實(shí)(Sim-to-Real)的巨大鴻溝——而統(tǒng)一架構(gòu)讓這三者在同一芯片上實(shí)現(xiàn)“零拷貝”,數(shù)據(jù)延遲和轉(zhuǎn)換損耗被壓縮到最低。
這種架構(gòu)優(yōu)勢在夸娥萬卡集群上得到了驗(yàn)證。基于MTT S5000構(gòu)建的集群實(shí)現(xiàn)了Dense大模型訓(xùn)練MFU達(dá)40%、MoE大模型達(dá)60%、訓(xùn)練線性擴(kuò)展效率達(dá)95%、有效訓(xùn)練時間占比超過90%。這些技術(shù)指標(biāo)之所以重要,是因?yàn)樗鼈児餐卮鹆艘粋€問題:國產(chǎn)GPU集群是否真正解決了大規(guī)模分布式訓(xùn)練中最令人頭疼的兩個問題:效率損耗和故障中斷。
MFU(Model FLOPs Utilization)衡量的是硬件算力被模型訓(xùn)練實(shí)際利用的效率,95%的線性擴(kuò)展率意味著在集群規(guī)模擴(kuò)大時性能不會斷崖式下降。這些背后離不開從芯片層面的高速互聯(lián)設(shè)計(jì)到集群管理調(diào)度算法的全棧優(yōu)化。
但必須指出,萬卡集群能力的建立只是起點(diǎn),不是終點(diǎn)。據(jù)行業(yè)數(shù)據(jù),截至2025年底中國已建成42個萬卡級智算集群,智能算力總規(guī)模超過1590EFLOPS。隨著深圳、鄭州等地超大規(guī)模集群的密集上線,未來兩到三年內(nèi),國內(nèi)智算市場將從“稀缺狀態(tài)”快速轉(zhuǎn)向“結(jié)構(gòu)性過剩” ,市場對芯片的需求將從“能跑通模型”升級為“每Token的邊際成本最低”。這迫使AI芯片廠商的競爭焦點(diǎn)從單卡性能轉(zhuǎn)向系統(tǒng)級的TCO(總擁有成本)競爭,包括功耗效率、集群調(diào)度算法、容錯恢復(fù)能力、軟件棧開發(fā)效率等。對摩爾線程而言,最新發(fā)布的“花港”架構(gòu)推進(jìn)十萬卡級集群的規(guī)劃,是應(yīng)對這一趨勢的戰(zhàn)略布局——十萬卡規(guī)模下,哪怕是0.01%的故障率,每小時也意味著數(shù)十張卡的失效,而每張卡的宕機(jī)都意味著數(shù)十萬元的算力浪費(fèi)。
國產(chǎn)芯片繞不開的商業(yè)化
技術(shù)再好,脫離商業(yè)化也只能停留在實(shí)驗(yàn)室階段。在技術(shù)的背后,困擾國產(chǎn)芯片的還有一個更高層級的問題:商業(yè)化之路怎么走?
而判斷一家技術(shù)驅(qū)動型企業(yè)是否真正步入正軌,不能只看營收增速,更要看其研發(fā)投入與商業(yè)化變現(xiàn)之間的節(jié)奏是否能形成正向循環(huán)。
摩爾線程最新披露的財(cái)報(bào)則為理解其當(dāng)前的戰(zhàn)略位置提供了關(guān)鍵的數(shù)據(jù)切口。從營收規(guī)模來看,摩爾線程2025年實(shí)現(xiàn)營業(yè)收入15.05億元,同比增長243.37%;毛利總額達(dá)到9.87億元,整體毛利率水平達(dá)65.57%。2026年一季度實(shí)現(xiàn)營收7.38億元,同比增長155.35%,歸母凈利潤2935.92萬元,是公司上市以來首次實(shí)現(xiàn)單季盈利。數(shù)據(jù)的背后隱含一個值得關(guān)注的結(jié)構(gòu)性變化:2026年3月,摩爾線程簽訂了6.6億元的夸娥智算集群大單。這意味著,公司已從“賣卡”向“交付系統(tǒng)級AI基礎(chǔ)設(shè)施”完成關(guān)鍵躍遷——單一大單金額即占全年?duì)I收近四成,大客戶集中度的提升既是商業(yè)能力的體現(xiàn),也意味著大客戶續(xù)約和復(fù)購將成為未來業(yè)績的重要觀察指標(biāo)。
當(dāng)然,首次單季盈利需要冷靜看待。財(cái)報(bào)顯示一季度有7006萬元政府補(bǔ)助,而同期研發(fā)費(fèi)用約3億-4億元,毛利率水平約65.6%,單季營收需達(dá)8億-10億元以上方能覆蓋當(dāng)期研發(fā)支出。
這些財(cái)務(wù)表象之上,真正塑造公司長期價值的是研發(fā)投入的“縱深”。2025年研發(fā)費(fèi)用13.05億元,占營收比重86.68%。截至2025年底,累計(jì)申請知識產(chǎn)權(quán)2014項(xiàng),其中發(fā)明專利1743項(xiàng)。這也恰恰說明,摩爾線程選擇了將絕大多數(shù)資源投入底層技術(shù)而非短期營銷,這種“逆周期投入”將決定它能否在下一代算力競爭中占據(jù)主動。2025年,公司基于MTT S5000的夸娥萬卡級智算集群實(shí)現(xiàn)了商業(yè)化部署,成為國內(nèi)極少數(shù)真正具備萬卡級大規(guī)模集群交付能力的GPU供應(yīng)商。從五年五代架構(gòu)五顆芯片的產(chǎn)品迭代節(jié)奏來看,這是一種典型的“用研發(fā)換時間、用架構(gòu)換代換彎道”的打法。
從夸娥萬卡集群的萬卡工程能力,到MT Lambda仿真平臺的三大引擎融合,再到“小麥”全域智能體的端側(cè)閉環(huán),以及AIBOOK、AICUBE、E300對“云-邊-端”全場景的覆蓋——這些產(chǎn)品線揭示了摩爾線程的系統(tǒng)級戰(zhàn)略:不把自己定位為“賣卡的”,而是做“AI基礎(chǔ)設(shè)施的系統(tǒng)級供應(yīng)商”。
但客觀來看,挑戰(zhàn)同樣嚴(yán)峻。英偉達(dá)已進(jìn)入Rubin架構(gòu)的新周期,而國內(nèi)市場的“國產(chǎn)替代”紅利窗口期也在收窄。當(dāng)華為昇騰有望在2026年占據(jù)中國市場50%份額,當(dāng)海光、寒武紀(jì)、燧原等企業(yè)紛紛在各自細(xì)分市場發(fā)力時,摩爾線程面臨的競爭格局將比過去幾年更加激烈。 研發(fā)費(fèi)用率86.68%雖然在技術(shù)攻堅(jiān)期可以理解,但一旦營收增長放緩,這一比例將直接沖擊現(xiàn)金流。26.68億元的存貨+預(yù)付款意味著市場對產(chǎn)品需求的判斷一旦發(fā)生偏差,公司將面臨沉重的資產(chǎn)減值風(fēng)險。
但張建中在2025年年度業(yè)績說明會上對存貨問題作出了解釋,他表示,當(dāng)前國內(nèi)算力需求持續(xù)放量,疊加芯片行業(yè)普遍存在的交期波動、原材料價格浮動、核心產(chǎn)能緊缺等不確定性風(fēng)險,穩(wěn)定的供應(yīng)鏈體系成為企業(yè)核心競爭力。通過儲備充足庫存、鎖定上游產(chǎn)能,摩爾線程有效規(guī)避了行業(yè)供應(yīng)鏈風(fēng)險,筑牢交付護(hù)城河,同時能夠快速響應(yīng)下游批量訂單,大幅縮短產(chǎn)品交付周期,穩(wěn)固市場基本盤。
綜合來看,摩爾線程真正的護(hù)城河不在于某款芯片或者某個集群,而在于能否把“統(tǒng)一架構(gòu)”的技術(shù)路線堅(jiān)持到臨界點(diǎn)——讓全功能GPU在物理AI時代成為不可或缺的算力基礎(chǔ)設(shè)施。當(dāng)訓(xùn)練芯片在中國市場不再稀缺、而是過剩時,決定勝負(fù)的可能不再是單卡峰值算力,而是誰能在同一個芯片上承載AI、仿真、渲染等更多維的計(jì)算任務(wù),誰能以最低的Token成本交付最多的智能。這恰恰是“全功能GPU”這條看似更艱難的路,所能提供的長期壁壘。
(文|Leo張ToB雜談,作者|張申宇,編輯丨楊林)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.