AI進(jìn)入萬億Token時代，國產(chǎn)芯片如何構(gòu)建行業(yè)壁壘？

2026-05-20 15:17:11　來源: 鈦媒體APP

北京舉報(bào)

分享至

當(dāng)AI正式邁入萬億Token時代，算力需求迎來爆發(fā)式增長，國產(chǎn)GPU行業(yè)也從“單點(diǎn)突圍”進(jìn)入“全域競爭”的關(guān)鍵周期，AI算力從“稀缺資源”加速邁向“結(jié)構(gòu)性過剩”，當(dāng)國內(nèi)市場“國產(chǎn)替代”的紅利窗口期開始收窄，中國GPU行業(yè)的競爭邏輯正在發(fā)生根本性轉(zhuǎn)變。單純比拼單卡峰值算力、簡單對標(biāo)英偉達(dá)的技術(shù)路線，正走向同質(zhì)化的價格泥潭。

云邊端協(xié)同構(gòu)建算力閉環(huán)

GPU行業(yè)的競爭，早已從單一芯片性能比拼，升級為全場景產(chǎn)品能力與生態(tài)適配能力的綜合較量。摩爾線程的核心競爭力，在于其堅(jiān)持“全功能GPU”的技術(shù)路線，打破了AI芯片、圖形芯片、通用計(jì)算芯片的場景壁壘，構(gòu)建起覆蓋云端智算、端側(cè)應(yīng)用的完整產(chǎn)品矩陣，形成了“算力底座+場景應(yīng)用”的雙向賦能格局。

云端算力作為摩爾線程的核心布局領(lǐng)域，承擔(dān)著大模型訓(xùn)練、大規(guī)模仿真、科學(xué)計(jì)算等高端算力需求，其產(chǎn)品組合以“夸娥（KUAE）智算集群”為核心，搭配MTT S5000旗艦智算卡與智算一體機(jī)，形成了從單卡到萬卡級集群的完整解決方案。

在端側(cè)領(lǐng)域，摩爾線程以自研“長江”智能SoC芯片為核心，構(gòu)建起覆蓋個人、家庭、行業(yè)的端側(cè)AI產(chǎn)品矩陣，實(shí)現(xiàn)了“云端訓(xùn)練—端側(cè)部署”的算力閉環(huán)。“長江”SoC芯片作為端側(cè)算力基石，采用異構(gòu)計(jì)算架構(gòu)，集成8個主頻高達(dá)2.65GHz的全大核CPU、全功能GPU及高能效NPU，提供50TOPS的異構(gòu)AI算力，支持INT8/FP16/FP32等混合精度計(jì)算，可在端側(cè)流暢運(yùn)行百億參數(shù)大模型，配合136GB/s的超高內(nèi)存帶寬與最高64GB的LPDDR5X高速統(tǒng)一內(nèi)存，兼顧了高性能與低功耗，適配各類端側(cè)設(shè)備的部署需求

基于“長江”SoC芯片，摩爾線程在本次產(chǎn)品發(fā)布會上推出了三大端側(cè)核心產(chǎn)品：MTT AIBOOK AI算力本、MTT AICUBE家庭AI中樞與MTT E300邊緣AI模組。

全功能GPU是核心競爭力

在AI芯片集體對標(biāo)英偉達(dá)的擁擠賽道中，任何僅僅是“對標(biāo)”的路徑最終都將陷入價格戰(zhàn)。真正的護(hù)城河，來自于競爭對手難以同時復(fù)制的多重能力組合。除了云端邊的全場景布局之外，摩爾線程真正的護(hù)城河在于“全功能GPU”這條技術(shù)路徑。所謂全功能GPU，是指在統(tǒng)一架構(gòu)的單顆芯片上，同時具備AI計(jì)算、3D圖形渲染、物理仿真和超高清視頻編解碼四大核心能力。這種“算、渲、仿”一體化的架構(gòu)設(shè)計(jì)，在業(yè)內(nèi)極少數(shù)企業(yè)（如英偉達(dá)）之外尚無人具備規(guī)模化量產(chǎn)能力。

這個選擇的戰(zhàn)略代價非常清晰：設(shè)計(jì)復(fù)雜度極高、兼容挑戰(zhàn)巨大、研發(fā)戰(zhàn)線極長。一款圖形GPU的設(shè)計(jì)復(fù)雜度本已不亞于AI芯片，而將兩者統(tǒng)一到同一架構(gòu)并兼顧物理仿真與編解碼，意味著在指令集、緩存層級、計(jì)算單元調(diào)度等多維度都要做架構(gòu)層面的融合設(shè)計(jì)。從2025年MUSA軟件棧已實(shí)現(xiàn)700多個API兼容、PyTorch算子層面100%兼容的進(jìn)展來看，摩爾線程正在逼近這個“不可能三角”的平衡點(diǎn)。

為什么值得付出這樣的代價？因?yàn)槲锢鞟I和具身智能的崛起正在改變算力需求的底層邏輯。正如發(fā)布會上摩爾線程CEO張建中所述，具身智能體的訓(xùn)練不僅需要AI算力來“思考”，更需要圖形渲染來“看見”虛擬環(huán)境，還需要物理仿真來“觸碰”物體的運(yùn)動規(guī)律。將三者分立在不同芯片上完成，意味著數(shù)據(jù)的跨芯片搬運(yùn)、異構(gòu)編程和仿真到現(xiàn)實(shí)（Sim-to-Real）的巨大鴻溝——而統(tǒng)一架構(gòu)讓這三者在同一芯片上實(shí)現(xiàn)“零拷貝”，數(shù)據(jù)延遲和轉(zhuǎn)換損耗被壓縮到最低。

這種架構(gòu)優(yōu)勢在夸娥萬卡集群上得到了驗(yàn)證。基于MTT S5000構(gòu)建的集群實(shí)現(xiàn)了Dense大模型訓(xùn)練MFU達(dá)40%、MoE大模型達(dá)60%、訓(xùn)練線性擴(kuò)展效率達(dá)95%、有效訓(xùn)練時間占比超過90%。這些技術(shù)指標(biāo)之所以重要，是因?yàn)樗鼈児餐卮鹆艘粋€問題：國產(chǎn)GPU集群是否真正解決了大規(guī)模分布式訓(xùn)練中最令人頭疼的兩個問題：效率損耗和故障中斷。

MFU（Model FLOPs Utilization）衡量的是硬件算力被模型訓(xùn)練實(shí)際利用的效率，95%的線性擴(kuò)展率意味著在集群規(guī)模擴(kuò)大時性能不會斷崖式下降。這些背后離不開從芯片層面的高速互聯(lián)設(shè)計(jì)到集群管理調(diào)度算法的全棧優(yōu)化。

但必須指出，萬卡集群能力的建立只是起點(diǎn)，不是終點(diǎn)。據(jù)行業(yè)數(shù)據(jù)，截至2025年底中國已建成42個萬卡級智算集群，智能算力總規(guī)模超過1590EFLOPS。隨著深圳、鄭州等地超大規(guī)模集群的密集上線，未來兩到三年內(nèi)，國內(nèi)智算市場將從“稀缺狀態(tài)”快速轉(zhuǎn)向“結(jié)構(gòu)性過剩” ，市場對芯片的需求將從“能跑通模型”升級為“每Token的邊際成本最低”。這迫使AI芯片廠商的競爭焦點(diǎn)從單卡性能轉(zhuǎn)向系統(tǒng)級的TCO（總擁有成本）競爭，包括功耗效率、集群調(diào)度算法、容錯恢復(fù)能力、軟件棧開發(fā)效率等。對摩爾線程而言，最新發(fā)布的“花港”架構(gòu)推進(jìn)十萬卡級集群的規(guī)劃，是應(yīng)對這一趨勢的戰(zhàn)略布局——十萬卡規(guī)模下，哪怕是0.01%的故障率，每小時也意味著數(shù)十張卡的失效，而每張卡的宕機(jī)都意味著數(shù)十萬元的算力浪費(fèi)。

國產(chǎn)芯片繞不開的商業(yè)化

技術(shù)再好，脫離商業(yè)化也只能停留在實(shí)驗(yàn)室階段。在技術(shù)的背后，困擾國產(chǎn)芯片的還有一個更高層級的問題：商業(yè)化之路怎么走？

而判斷一家技術(shù)驅(qū)動型企業(yè)是否真正步入正軌，不能只看營收增速，更要看其研發(fā)投入與商業(yè)化變現(xiàn)之間的節(jié)奏是否能形成正向循環(huán)。

摩爾線程最新披露的財(cái)報(bào)則為理解其當(dāng)前的戰(zhàn)略位置提供了關(guān)鍵的數(shù)據(jù)切口。從營收規(guī)模來看，摩爾線程2025年實(shí)現(xiàn)營業(yè)收入15.05億元，同比增長243.37%；毛利總額達(dá)到9.87億元，整體毛利率水平達(dá)65.57%。2026年一季度實(shí)現(xiàn)營收7.38億元，同比增長155.35%，歸母凈利潤2935.92萬元，是公司上市以來首次實(shí)現(xiàn)單季盈利。數(shù)據(jù)的背后隱含一個值得關(guān)注的結(jié)構(gòu)性變化：2026年3月，摩爾線程簽訂了6.6億元的夸娥智算集群大單。這意味著，公司已從“賣卡”向“交付系統(tǒng)級AI基礎(chǔ)設(shè)施”完成關(guān)鍵躍遷——單一大單金額即占全年?duì)I收近四成，大客戶集中度的提升既是商業(yè)能力的體現(xiàn)，也意味著大客戶續(xù)約和復(fù)購將成為未來業(yè)績的重要觀察指標(biāo)。

當(dāng)然，首次單季盈利需要冷靜看待。財(cái)報(bào)顯示一季度有7006萬元政府補(bǔ)助，而同期研發(fā)費(fèi)用約3億-4億元，毛利率水平約65.6%，單季營收需達(dá)8億-10億元以上方能覆蓋當(dāng)期研發(fā)支出。

這些財(cái)務(wù)表象之上，真正塑造公司長期價值的是研發(fā)投入的“縱深”。2025年研發(fā)費(fèi)用13.05億元，占營收比重86.68%。截至2025年底，累計(jì)申請知識產(chǎn)權(quán)2014項(xiàng)，其中發(fā)明專利1743項(xiàng)。這也恰恰說明，摩爾線程選擇了將絕大多數(shù)資源投入底層技術(shù)而非短期營銷，這種“逆周期投入”將決定它能否在下一代算力競爭中占據(jù)主動。2025年，公司基于MTT S5000的夸娥萬卡級智算集群實(shí)現(xiàn)了商業(yè)化部署，成為國內(nèi)極少數(shù)真正具備萬卡級大規(guī)模集群交付能力的GPU供應(yīng)商。從五年五代架構(gòu)五顆芯片的產(chǎn)品迭代節(jié)奏來看，這是一種典型的“用研發(fā)換時間、用架構(gòu)換代換彎道”的打法。

從夸娥萬卡集群的萬卡工程能力，到MT Lambda仿真平臺的三大引擎融合，再到“小麥”全域智能體的端側(cè)閉環(huán)，以及AIBOOK、AICUBE、E300對“云-邊-端”全場景的覆蓋——這些產(chǎn)品線揭示了摩爾線程的系統(tǒng)級戰(zhàn)略：不把自己定位為“賣卡的”，而是做“AI基礎(chǔ)設(shè)施的系統(tǒng)級供應(yīng)商”。

但客觀來看，挑戰(zhàn)同樣嚴(yán)峻。英偉達(dá)已進(jìn)入Rubin架構(gòu)的新周期，而國內(nèi)市場的“國產(chǎn)替代”紅利窗口期也在收窄。當(dāng)華為昇騰有望在2026年占據(jù)中國市場50%份額，當(dāng)海光、寒武紀(jì)、燧原等企業(yè)紛紛在各自細(xì)分市場發(fā)力時，摩爾線程面臨的競爭格局將比過去幾年更加激烈。研發(fā)費(fèi)用率86.68%雖然在技術(shù)攻堅(jiān)期可以理解，但一旦營收增長放緩，這一比例將直接沖擊現(xiàn)金流。26.68億元的存貨+預(yù)付款意味著市場對產(chǎn)品需求的判斷一旦發(fā)生偏差，公司將面臨沉重的資產(chǎn)減值風(fēng)險。

但張建中在2025年年度業(yè)績說明會上對存貨問題作出了解釋，他表示，當(dāng)前國內(nèi)算力需求持續(xù)放量，疊加芯片行業(yè)普遍存在的交期波動、原材料價格浮動、核心產(chǎn)能緊缺等不確定性風(fēng)險，穩(wěn)定的供應(yīng)鏈體系成為企業(yè)核心競爭力。通過儲備充足庫存、鎖定上游產(chǎn)能，摩爾線程有效規(guī)避了行業(yè)供應(yīng)鏈風(fēng)險，筑牢交付護(hù)城河，同時能夠快速響應(yīng)下游批量訂單，大幅縮短產(chǎn)品交付周期，穩(wěn)固市場基本盤。

綜合來看，摩爾線程真正的護(hù)城河不在于某款芯片或者某個集群，而在于能否把“統(tǒng)一架構(gòu)”的技術(shù)路線堅(jiān)持到臨界點(diǎn)——讓全功能GPU在物理AI時代成為不可或缺的算力基礎(chǔ)設(shè)施。當(dāng)訓(xùn)練芯片在中國市場不再稀缺、而是過剩時，決定勝負(fù)的可能不再是單卡峰值算力，而是誰能在同一個芯片上承載AI、仿真、渲染等更多維的計(jì)算任務(wù)，誰能以最低的Token成本交付最多的智能。這恰恰是“全功能GPU”這條看似更艱難的路，所能提供的長期壁壘。

（文｜Leo張ToB雜談，作者｜張申宇，編輯丨楊林）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.