2026年5月19日,上海前灘香格里拉。AMD董事長蘇姿豐(Lisa Su)站在聚光燈下,對兩千多名中國開發(fā)者說了一句過去二十年沒有任何一家美國芯片巨頭CEO公開說過的話:
"中國,是AMD產(chǎn)品路線圖的核心部分。"
![]()
在大洋彼岸,英偉達CEO黃仁勛也曾親口承認,受出口管制影響,英偉達在中國高端AI加速卡市場的份額"已歸零"。
一邊是好不容易跨進門的客人說"我重視你",一邊是曾經(jīng)壟斷者被擋在門外。放在三年前,這一現(xiàn)象想都不敢想。劇情的反轉(zhuǎn)是中國AI算力市場本土三大芯片勢力迅速崛起給予的底氣。
他們是華為昇騰、寒武紀、海光信息。外界叫它"國產(chǎn)AI芯片三駕馬車",但在那些熬夜調(diào)板卡、改編譯器的工程師眼里,這更像一場各懷絕技的"破壁者聯(lián)盟"。
鐵幕:從95%壟斷到"歸零"警告
把時間撥回2020年以前。中國AI訓(xùn)練與推理芯片市場,英偉達占有率高達95%,剩下的5%里還有AMD的 scraps。CUDA是不二法門,H100/A100是硬通貨,買不到?等項目排隊。那時國產(chǎn)芯片連"備胎"都算不上——頂多是PPT。
轉(zhuǎn)折始于2022年10月美國首輪對華AI芯片出口管制,隨后幾輪持續(xù)收緊,H100/A100禁售,特供版H20性能閹割且前景不明。倒逼之下,三大國產(chǎn)路線悄然從"實驗室驗證"走向"商業(yè)放量"。
IDC數(shù)據(jù)顯示:2025年中國AI加速卡總出貨約400萬張,國產(chǎn)廠商合計出貨165萬張,市占率首次突破41%;英偉達份額從早年95%跌至約55%,高端訓(xùn)練卡實質(zhì)歸零。鐵幕沒完全碎,但門縫里已透進光。
華為昇騰——"全棧自主派":從被制裁到定義標(biāo)準(zhǔn)
"你不能只做芯片,你得自己做編譯器、框架、集群拓撲——否則永遠被人掐脖子。"
華為走的是三條路線中最決絕的一條:從指令集(達芬奇架構(gòu))、CANN異構(gòu)計算架構(gòu)、MindSpore框架到Atlas服務(wù)器,全棧自研。
關(guān)鍵里程碑:
昇騰910B(2023–2024量產(chǎn)):FP16~320 TFLOPS,64GB HBM2e,在國內(nèi)智算中心批量部署
昇騰910C(2025量產(chǎn)):FP16達800 TFLOPS,128GB HBM2e,多卡互聯(lián)帶寬784GB/s,部分場景逼近A100
昇騰950PR(2026Q1量產(chǎn)):首搭自研HBM,F(xiàn)P4算力1.56PFLOPS,Atlas 350加速卡算力達英偉達H20的2.87倍
生態(tài)突破:DeepSeek V4發(fā)布首日即完成昇騰原生適配("Day 0適配"),標(biāo)志CUDA壟斷在中國市場被實質(zhì)性挑戰(zhàn)
2025年華為昇騰出貨約81.2萬張,占國產(chǎn)總出貨近50%,穩(wěn)居國產(chǎn)第一、全國市場第二(僅次于英偉達存量)。運營商、政務(wù)云、央企智算中心是其基本盤。
代價也很清楚:CANN生態(tài)較CUDA仍有差距,模型遷移需重寫算子;但"全自主"意味著在美方極限施壓下,它是唯一不會被斷供升級的路線。
![]()
寒武紀——"推理場景專精派":八年虧損,一季翻身
"訓(xùn)練歸訓(xùn)練,推理才是真正的生意。我們要做的是——讓每元錢Tokens產(chǎn)出最大化。"
寒武紀(Cambricon)是國內(nèi)最早登科創(chuàng)板AI芯片公司,早年間因"燒錢難盈利"飽受爭議。轉(zhuǎn)折發(fā)生在2025–2026年:
思元590(2025量產(chǎn)):7nm Chiplet封裝,F(xiàn)P16算力256 TFLOPS,INT8達512TOPS,96GB HBM2e,綜合性能接近A100的80%,功耗低約15%
思元690:送測中,預(yù)計翻倍提升
商業(yè)爆發(fā):2025年全年凈利20.59億元(首年扭虧);2026年Q1單季凈利10.13億元,同比+185%,合同負債從0.01億跳升至3.96億——預(yù)示后續(xù)訂單飽滿
客戶結(jié)構(gòu):字節(jié)跳動(第一大客戶,占營收超26%)、百度、阿里等在搜廣推、內(nèi)容理解等推理場景大規(guī)模部署
寒武紀的策略很清晰——避開英偉達最強的大規(guī)模預(yù)訓(xùn)練陣地,專攻互聯(lián)網(wǎng)大廠海量推理負載,通過自研BangC/BangC++軟件棧做CUDA兼容層,將遷移成本壓低約70%。這是一門苦活、細活,但2026年中國AI推理算力需求已數(shù)倍于訓(xùn)練——它賭對了時間點。
![]()
海光信息——"兼容遷移派":借AMD衣缽,做CUDA最短路徑
"如果你打不贏CUDA,就做它最像的那個兄弟。"
海光是三者中最特殊的:早期獲得AMD x86 CPU及GPGPU(DCU深算系列)技術(shù)授權(quán),走x86 CPU + DCU雙芯驅(qū)動路線。其DCU的DTK軟件棧兼容ROCm/HIP接口,對CUDA代碼遷移成本極低——不改或微改即可跑。
深算二號(DCU K100系列):接近A100水平,主要用于HPC+AI推理,在金融、電信、超算(比如濟南超算)有穩(wěn)定部署
2025年業(yè)績:營收143.77億元(+57%),凈利25.45億元;2026年Q1營收40.34億元(+68%),存貨73.3億創(chuàng)歷史新高,預(yù)示備貨旺盛
生態(tài)適配:已與DeepSeek、Qwen3、混元、智譜等365款主流大模型適配,覆蓋全球99%非閉源大模型
批評者說它"架構(gòu)源自AMD授權(quán)、自主性存疑";支持者說——在合規(guī)前提下,它是現(xiàn)有CUDA存量代碼平滑遷移成本最低的選項,且x86 CPU與DCU可在同一機柜內(nèi)構(gòu)成完全國產(chǎn)算力節(jié)點,符合信創(chuàng)100%國產(chǎn)化時間表要求。
![]()
"鐵幕"不會自己碎——是人鑿開的
此次,無論是AMD高調(diào)宣布免費GPU開發(fā)者計劃、與魔搭ModelScope合作,還是,蘇姿豐稱"中國是我們路線圖核心"。其本質(zhì)上是在英偉達退場后,爭奪"第二選擇"的生態(tài)心智。
但對國產(chǎn)三強而言,AMD既是潛在的異構(gòu)算力補充,其ROCm開放策略也間接給海光DCU、乃至寒武紀兼容層提供了參照系。
更有意思的是,AMD董事長蘇姿豐在上海的大膽預(yù)言Agentic AI時代CPU與GPU比例將從1:4走向1:1,這恰恰呼應(yīng)華為、海光本就有強力x86/ARM CPU業(yè)務(wù)的"雙芯"布局。國產(chǎn)算力破壁,正從"單卡追平GPU"升維到"系統(tǒng)級異構(gòu)優(yōu)化"。
![]()
不過,我們也要保持清醒的認知,2026年的中國AI算力市場,還遠沒到國產(chǎn)"完勝"的地步。超大規(guī)模預(yù)訓(xùn)練集群的多卡通信穩(wěn)定性、軟件棧成熟度、先進制程HBM供應(yīng),都與國際芯片巨頭存在實打?qū)嵉牟罹唷?/p>
但有一點可以確定:英偉達從95%壟斷到高端份額歸零,國產(chǎn)三強拿下41%市場,這不是施舍,是國內(nèi)的工程師無數(shù)個日夜硬鑿出來的。
蘇姿豐來上海說"中國是核心",這是對AI算力市場需求的客觀現(xiàn)實的尊重。而華為昇騰、寒武紀、海光這十幾年默默壘起的指令集、編譯器、驅(qū)動和板卡,則是對"中國算力主權(quán)"完美詮釋。
籠罩在中國AI算力市場頭頂?shù)蔫F幕仍在,但裂縫已現(xiàn)。
真正的破壁者從來不是等待對方開門,而是自己磨出鑰匙。
下次有人問你"國產(chǎn)AI芯片到底行不行",不妨反問——
"你覺得七年前那群在浦東機房熬夜調(diào)PCIe信號的工程師,會放棄嗎?"
其實,答案就寫在每一張點亮的思元、每一臺Atlas機架、每一個跑通的海光DCU終端上,國產(chǎn)的崛起替代之路無法阻擋。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.