我是芯片超人花姐,入行20年,有50W+芯片行業(yè)粉絲。有很多不方便公開發(fā)公眾號的,關(guān)于芯片買賣、關(guān)于資源鏈接等,我會分享在朋友圈。
掃碼加我本人微信
作者簡介:
Craig Melrose 是 HTEC 的半導(dǎo)體與 AI 行業(yè)專家,專注于連接硬件創(chuàng)新與企業(yè)級 AI 部署。Ian Baird 是 HTEC 的高級半導(dǎo)體專家,重點關(guān)注工作負(fù)載遷移、AI 編譯器以及異構(gòu)計算環(huán)境。本文觀點來自 2026 年 3 月進(jìn)行的專家訪談,以及 HTEC 委托 Censuswide 對全球 250 位半導(dǎo)體行業(yè) C 級高管開展的調(diào)研。
硬件熱潮正在降溫。接下來要面對的,是軟件、功耗和推理能力方面的挑戰(zhàn),而行業(yè)里大多數(shù)公司其實還沒有準(zhǔn)備好。
如今,AI 芯片只占全球芯片產(chǎn)量的 0.2%,卻貢獻(xiàn)了大約 50% 的行業(yè)總收入。這個比例本身,就足以說明當(dāng)前半導(dǎo)體行業(yè)的趨勢。AI 正在重塑芯片設(shè)計周期、制造良率優(yōu)化以及部署架構(gòu)。但根據(jù)HTEC對250位半導(dǎo)體高管的全球調(diào)查,只有 44% 的企業(yè)已經(jīng)在多個職能環(huán)節(jié)中全面嵌入 AI,剩下 56% 的企業(yè)仍停留在試點、有限部署或早期探索階段。
也就是說,真正覆蓋全公司的 AI 一體化應(yīng)用,仍未普遍建立起來。結(jié)合這項調(diào)查結(jié)果,以及 HTEC 半導(dǎo)體業(yè)務(wù)高級負(fù)責(zé)人 Craig Melrose 和 Ian Baird 的專家觀點,以下幾大趨勢將定義 2026 年的半導(dǎo)體行業(yè)格局。
01
AI 硬件金字塔將會坍塌
接下來取而代之的是什么
當(dāng)前 AI 半導(dǎo)體行業(yè)的結(jié)構(gòu),就像一個倒立的金字塔。寬的一端,是數(shù)百家芯片公司、數(shù)十億美元的資本投入,以及持續(xù)不斷的硬件創(chuàng)新;窄的一端,則是數(shù)量其實相當(dāng)有限、真正進(jìn)入規(guī)模化生產(chǎn)階段的 AI 應(yīng)用,而這些應(yīng)用正運行在前述所有芯片之上。
0.2% / 50% 這個比例,已經(jīng)清楚表明了行業(yè)今年的關(guān)注重點將轉(zhuǎn)向哪里。正如 Craig 所說:
“當(dāng)前很多關(guān)注點仍然放在硬件上,而不是放在解決現(xiàn)實世界的問題上。”
未來取代這座金字塔的,將是一種更平衡的結(jié)構(gòu):硬件會圍繞少數(shù)幾個主導(dǎo)性軟件生態(tài)進(jìn)行整合,并與制造、物理 AI、醫(yī)療等領(lǐng)域中已經(jīng)驗證過的終端應(yīng)用層相連接。2026 年真正能夠跨越這道鴻溝的企業(yè),將是那些帶著能跑真實企業(yè)工作負(fù)載的軟件棧進(jìn)入市場的公司,而不只是能在實驗室里跑通方案的公司。英偉達(dá)就是一個典型例子。
02
下一家英偉達(dá)
不會由芯片本身決定
英偉達(dá)贏得 AI 芯片競賽,并不是因為它擁有最好的芯片,而是因為它擁有 CUDA——它足夠好、出現(xiàn)得足夠早,而且黏性足夠強,最終成為全球 AI 開發(fā)的默認(rèn)底層平臺。Ian Baird 說得很直接:如今每一家做定制加速器的公司,真正面臨的主要障礙并不是硬件性能,而是軟件兼容性。
英偉達(dá)的優(yōu)勢,來自其為并行處理而生的 GPU 架構(gòu)——而這種架構(gòu)又與 AI 的需求高度契合。此后每一個競爭對手,都不得不逆著一個不斷自我強化的軟件生態(tài)往上爬。Craig Melrose 則借用了 Geoffrey Moore 的技術(shù)采納曲線來解釋:
“硬件是創(chuàng)新者。真正決定誰能成為快速跟隨者、誰能進(jìn)入主流市場的,是軟件。”
對于那些正在開發(fā)或采用新型加速器的半導(dǎo)體公司來說,真正具有決定性的投入,應(yīng)該放在編譯器工具鏈、內(nèi)核庫,以及那些能夠完成工作負(fù)載遷移、補齊軟件短板的工程團(tuán)隊上。
最終能活下來的玩家,往往會具備幾個共同特征:
在軟件上深度投入
聚焦特定的高價值工作負(fù)載
擁有經(jīng)過驗證的部署模式
如果一款加速器在生產(chǎn)環(huán)境中無人使用的特定工作負(fù)載上性能提升30%,那它就無法成為一項可行的業(yè)務(wù)。而如果一款加速器在邊緣計算的視頻推理任務(wù)上效率提升20%,且擁有完整的軟件棧和經(jīng)過驗證的部署路徑,那它就是一項可行的業(yè)務(wù)。
03
到2027年,大多數(shù) AI 推理將運行在邊緣側(cè),但軟件還沒準(zhǔn)備好
“AI 推理默認(rèn)運行在云端”這一假設(shè),正面臨兩股力量的沖擊:一是物理 AI 應(yīng)用的增長,二是數(shù)據(jù)中心算力能耗成本的不斷上升。Craig 的判斷很明確:
“物理 AI 最終大多數(shù)都會跑在邊緣側(cè)。”
機器人、自動駕駛汽車、工廠車間系統(tǒng),都需要在動作發(fā)生的現(xiàn)場完成推理。一個人形機器人,不可能在抓取物體之前,還等著云端來回傳一趟結(jié)果。
“邊緣 AI 真正難的,不是把足夠強的芯片送到邊緣端,而是讓軟件能在所有這些硬件上正確運行。”
但瓶頸并不在硬件。當(dāng)前 NPU 生態(tài)高度碎片化:AMD、Intel、高通、蘋果以及其他數(shù)十家公司都推出了各自的神經(jīng)網(wǎng)絡(luò)處理器,但它們的架構(gòu)和工具鏈彼此并不兼容。Ian 直指問題核心:如何開發(fā)能夠在這樣一個異構(gòu)生態(tài)中高效運行的軟件,才是真正的難題,而現(xiàn)有框架對此只能部分解決。邊緣推理所需的硬件正在到位,但與之匹配的軟件生態(tài)還遠(yuǎn)沒有準(zhǔn)備好。
04
2026年,Chiplet 架構(gòu)將從小眾走向主流
把單體 GPU 視為 AI 默認(rèn)計算平臺的時代,正在結(jié)束。AI 工作負(fù)載的多樣化,使專用化在經(jīng)濟(jì)上變得越來越劃算。Chiplet 架構(gòu)允許企業(yè)將來自不同來源、不同工藝節(jié)點的計算、存儲和 I/O 模塊進(jìn)行靈活組合,從而實現(xiàn)過去單片大芯片設(shè)計難以做到的定制化。
Craig 提到,像 Modular 這樣的公司,正在用非常規(guī)方式切入硬件領(lǐng)域。它們正在開發(fā) Chiplet 和模塊化硬件,甚至在重新定義“什么叫一顆芯片”。Ian 還提到了 D-Matrix,作為另一個例子:其將超低延遲存儲與計算進(jìn)行集成,專門針對視頻生成、提示詞處理等推理負(fù)載進(jìn)行優(yōu)化。Google 的 TPU、微軟的 Maia、亞馬遜的 Trainium,本質(zhì)上都押注于同一件事。超大規(guī)模云廠商幾年前就已經(jīng)看明白了這一點。到了 2026 年,市場的其他玩家才會開始真正跟上。
05
到2027年,推理效率將比原始 FLOPS 更重要
當(dāng)功耗成為約束,效率就會成為護(hù)城河。推理優(yōu)化的前沿,正越來越多地轉(zhuǎn)移到軟件層面。
現(xiàn)在,采購討論的重點,已經(jīng)開始從峰值算力性能,轉(zhuǎn)向每瓦 FLOPS(FLOPS-per-watt)、每次查詢時延(latency-per-query)、每次推理成本(cost-per-inference)。在 2026 年和 2027 年,真正有意義的性能提升,將更多來自軟件層面的推理優(yōu)化——例如模型蒸餾、量化、編譯器調(diào)優(yōu),以及根據(jù)實際工作負(fù)載需求來合理裁剪模型規(guī)模。
在幾乎所有真實生產(chǎn)場景里,一套優(yōu)化良好的小模型,跑在高效芯片上,往往都能勝過一套配置過度、卻運行在高功耗芯片上的大模型。那些把推理優(yōu)化視為核心工程能力,而不是事后補救動作的公司,將擁有一種后來者很難補齊的結(jié)構(gòu)性成本優(yōu)勢。
06
數(shù)據(jù)中心將在2028年前面臨供電不足
AI 基礎(chǔ)設(shè)施建設(shè)中有一個關(guān)鍵風(fēng)險,當(dāng)前仍被低估:能源供給的擴(kuò)張速度,跟不上 AI 算力需求的增長速度。燃?xì)廨啓C——目前新增供電能力最快的路徑——其產(chǎn)能預(yù)訂已經(jīng)排到 2028 年。電力供應(yīng),正在成為數(shù)據(jù)中心擴(kuò)張的硬約束。
一些地方性早期案例已經(jīng)顯現(xiàn),比如美國內(nèi)華達(dá)州一家公用事業(yè)公司計劃優(yōu)先保障數(shù)據(jù)中心用電,而不是現(xiàn)有的電信基礎(chǔ)設(shè)施需求。這類情況說明,這種約束正在開始從紙面問題走向現(xiàn)實。Craig 直接拋出了后續(xù)問題:
“如果那些依賴數(shù)據(jù)中心的系統(tǒng),所依賴的數(shù)據(jù)中心本身出現(xiàn)能源缺口,會發(fā)生什么?如果一個關(guān)鍵生產(chǎn)系統(tǒng)實時依賴云端推理,而該數(shù)據(jù)中心因電力不足而降載,責(zé)任該由誰承擔(dān)?”
這不是一個理論問題,而是一個運營層面的現(xiàn)實問題。那些現(xiàn)在就開始通過邊緣部署和工作負(fù)載優(yōu)先級管理來提升韌性的組織,在后續(xù)約束進(jìn)一步加劇時會更具優(yōu)勢。
07
2026年,物理 AI 的增長將快于數(shù)據(jù) AI
下一波 AI 芯片需求,將來自嵌入在機器人、汽車、工廠和消費設(shè)備等物理系統(tǒng)中的 AI。Craig 認(rèn)為,這一趨勢其實已經(jīng)開始了:那些需要本地實時推理的應(yīng)用場景,增長速度已超過上個周期中占據(jù)主導(dǎo)地位的數(shù)據(jù)中心型應(yīng)用場景。
證據(jù)其實已經(jīng)體現(xiàn)在周邊市場里。智能手表、便攜式心電設(shè)備、智能戒指等消費設(shè)備,以及工業(yè)自動化、自動駕駛汽車,都需要邊緣推理、低功耗、面向垂直場景的軟件棧,以及讓 AI 能夠在完全不同于受控數(shù)據(jù)中心環(huán)境的現(xiàn)實世界中穩(wěn)定運行的能力。
而恰恰是這些應(yīng)用,當(dāng)前的軟件工具鏈最不具備服務(wù)能力。那些最終能把 AI 真正帶入物理世界的公司,會最先意識到:硬件問題和軟件問題,從來就不是兩件彼此獨立的事。
08
結(jié)論
半導(dǎo)體行業(yè)的硬件競賽已經(jīng)全面展開,但最終勝負(fù)將由軟件決定。那些能夠在這輪洗牌中存活下來的加速器和平臺,必須滿足幾個條件:連接到經(jīng)過驗證的應(yīng)用場景,背后有穩(wěn)健的軟件生態(tài)支撐,并且為一個以邊緣優(yōu)先、功耗受限為現(xiàn)實前提的世界而設(shè)計。
我是芯片超人花姐,入行20年,經(jīng)手10億+RMB芯片采購。
原創(chuàng)寫了9年文章,有50W+芯片行業(yè)粉絲。
有很多不方便公開發(fā)公眾號的
關(guān)于芯片買賣、關(guān)于資源鏈接等
我會分享在朋友圈
掃碼加我本人微信
來源:內(nèi)容由芯世相(ID:xinpianlaosiji)編譯自「HTEC」
![]()
點擊查看往期內(nèi)容
將芯世相設(shè)為“星標(biāo)”,第一時間收獲最新推送
求喜歡
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.