所有人都在說大模型牛,那支撐大模型跑起來的根兒到底是什么?
是芯片,
更準確說,是一整條環環相扣、卡脖子卡到你懷疑人生的AI半導體價值鏈。
![]()
整個AI半導體產業鏈,就是全球化分工+寡頭壟斷。
每個核心環節就那么兩三家公司說了算,缺一個環節整個產業都停擺;
現在產業鏈的重心已經從「大模型訓練」往「推理」跑,未來十年推理市場才是真正的主戰場;
最后,邊緣AI肯定來,只是時間問題,去中心化是計算產業逃不開的規律。
1. 上游設計:AI芯片的靈魂,卡設計的不是芯片廠,是工具廠
設計環節是AI芯片的起點,決定了這塊芯片「能做什么、能做多好」,整個環節分成三層,每層都有寡頭拿捏著。
第一層是協同設計的「橋梁玩家」,代表就是博通、美滿電子。
很多人不知道它們,覺得它們不做AI主芯片就沒存在感,其實不對——AI服務器里,算力、存儲、網絡要連起來,就得靠它們做高速接口、互聯芯片、存儲控制器,這些配套做不好,你堆再多GPU也跑不快,整個AI集群的性能上限就是它們定的。
第二層就是大家熟悉的AI芯片設計商,既有英偉達、AMD、英特爾這種傳統巨頭,也有谷歌、亞馬遜、微軟這些云廠親自下場自研。
這個格局怎么來的?
很簡單,AI時代芯片必須和大模型、云服務綁在一起玩,傳統巨頭靠架構能力壟斷了通用算力,云廠為什么要自己做?還不是不想被英偉達卡脖子,軟硬一起優化能直接降算力成本,把自己大模型和云服務的命脈捏在自己手里。
第三層就是絕大多數人都沒聽過,但卻是最底層的「卡脖子門檻」:
EDA工具和IP核,相當于芯片設計的「水電煤」,沒有它們,你連先進制程芯片的圖都畫不出來。
EDA現在就是新思(synopsys)、楷登(cadence)、西門子(mentor)三家壟斷,從前端設計、仿真到后端布線,全流程全包,你想用別家的都沒得用,3nm、2nm芯片離開EDA根本做不出來。
IP核就是現成的芯片模塊化內核,現在ARM就是絕對老大,低功耗適配性又好,不管是手機還是邊緣AI芯片,基本都用ARM的,芯片廠拿過來改改就能用,快得很。
2. 中游制造:AI芯片的肉身,這才是壁壘最高的「算力工廠」
設計畫好了餅,能不能做出來,全看制造。整個制造環節是全球技術壁壘最高的產業,缺一個零件都不行,我們一層一層說。
![]()
半導體制造核心設備廠商分布圖
首先是制造的「工業母機」:晶圓制造設備,四大核心品類全是寡頭壟斷:
光刻:ASML一家獨大,EUV光刻機是3nm以下制程唯一能用的,說它卡了全AI產業的脖子一點不夸張
刻蝕沉積:泛林、東京電子、應用材料三家說了算,一個雕芯片結構,一個鋪材料,制程精度全看它們
檢測:KLA一家獨大,生產過程中找缺陷,控良率全靠它
然后就是晶圓代工,臺積電、三星、英特爾三家,臺積電直接壟斷了全球90%以上的先進制程代工,現在英偉達H100、AMD的MI300、谷歌云廠商的高端AI芯片,全在臺積電產,臺積電的產能,直接決定了全球高端AI算力能供多少貨,承上啟下的核心就是它。
接下來很多人以前忽略的環節:先進封裝,現在已經從配角變成了核心卡點。
以前封裝就是給芯片套個殼保護一下,現在不一樣了,AI芯片要堆算力,單芯片做不下了,就得用臺積電CoWoS這種先進封裝,用芯粒堆疊的方式把多塊芯片拼在一起,算力密度和帶寬直接往上翻。之前英偉達H100交付跟不上,就是因為臺積電CoWoS產能不夠,你說這個環節重要不重要?
最后就是那些隱形的配套:材料、測試設備,材料是信越、SUMCO這些廠商壟斷,測試是愛德萬、泰瑞達雙寡頭,缺了哪個,芯片都量不了產。
3. 下游終端:算力最終交付,現在重心已經變了
芯片做出來了,最終就是賣給不同場景用,現在整個市場已經從訓練往推理轉,格局完全變了,我們分三類說。
第一類:通用GPU和ASIC,現在訓練和通用推理的絕對主力,這個賽道就是英偉達的天下,H100/H200幾乎壟斷,你知道嗎?英偉達數據中心40%的收入已經來自AI推理了,它不止吃訓練的飯,推理市場它已經是老大了。
現在最能打的對手就是AMD,MI300X顯存更大,大批次推理吞吐量更高,大小批次場景成本都更優,目標就是今年干到50億美元AI營收,盯著的就是推理這塊大蛋糕。
而且說個實話,英偉達的壁壘真不是只靠GPU硬件,CUDA生態、NVLink高速互聯、整套系統解決方案,這才是別人很難抄走的,新手玩家想直接硬剛真的很難。
第二類:推理專用芯片,這是現在AI產業鏈最火的新戰場,一堆初創公司拿著融資往里沖,比如Tenstorrent、Groq這些。
![]()
為什么這么火?
因為生成式AI要落地賺錢,最大的瓶頸就是推理成本——你大模型能不能賺錢,就看單次推理花多少錢、延遲有多高。
這些專用芯片就是沖著這個來的,專門針對推理做架構,在特定場景下,能效比比通用GPU高很多,成本也更低,靠性價比搶市場。
但難點也很明顯,英偉達的生態墻擺在那,云廠商自己也做自研芯片,這些初創公司只能扎進細分場景,做出來絕對的成本優勢才能活下來。
第三類:邊緣AI芯片,這是未來最大的增量市場,也是AI的去中心化革命。
現在核心玩家既有蘋果、高通、谷歌這種消費電子巨頭,也有英偉達、英特爾,還有一堆初創公司。
邊緣推理其實是雙贏:把推理放到用戶終端跑,企業不用花那么多錢建數據中心,省了大把成本;用戶用起來延遲更低,數據也不用上傳,隱私更好。
![]()
現在這個事的可行性越來越高了,小語言模型的能力越來越強,比如o1-mini,跑在終端完全夠用。
其實計算產業發展從來都是這個規律:大型機干掉大型機,然后小型機起來,然后PC,然后智能手機,都是高端算力解決了大部分人不需要的問題,最后就會往輕量化、去中心化走。
等哪天大模型能力「夠用了」,小模型+終端NPU成熟了,邊緣AI直接就起來了,消費電子會是最大的落地場景,整個價值鏈都會被重構。
4. 講透核心邏輯:未來AI半導體的變局在哪?
看完整個價值鏈,我們總結四個核心規律,你搞懂了就能看懂未來AI產業的走向:
第一,全球化分工+寡頭壟斷是永遠的特征,每個核心環節就那么兩三家說了算,斷一個環節整個產業鏈都要地震,這就是為什么各國都在搶產業鏈核心話語權,根本不是為了面子,是為了不被卡脖子。
第二,重心已經從訓練轉向推理了,過去幾年大家都搶著訓大模型,把英偉達捧上了天,未來大模型都落地了,推理的算力需求會是訓練的幾十倍,絕對是未來十年的主戰場。甚至那些原來訓模型的高端硬件,升級之后都會轉去做推理,這個市場只會越來越大。
第三,競爭核心從單芯片參數,變成了全棧生態和總成本,你參數做得再好沒用,客戶最后算的是全生命周期的總成本和好不好用。英偉達的領先從來不是只堆參數,是整套方案給你準備好了,別人要搶市場,就得先過生態這關。
第四,邊緣AI不是會不會來,是什么時候來,等小模型夠用,終端算力跟得上,AI肯定從全集中在云端,變成「云端+邊緣」分布式,那時候原來的價值分配就變了,終端廠商和邊緣芯片公司話語權會大很多。
5. 最后說句實在的
AI半導體價值鏈,就是整個AI產業的底層權力地圖,現在AI剛從技術突破往規模化商用走,每個環節都在洗牌。
不管是巨頭堆生態,還是初創公司玩架構創新,最后都繞不開「更高性能、更低成本」這個核心命題。誰能捏住核心環節的技術壁壘,給客戶掏出真金白銀的成本優勢,誰就能在這場算力軍備競賽里,站到最后。
作為普通人,你記住這幾個方向就夠了:推理是下一個風口,邊緣AI是未來十年的大增量,產業鏈自主可控是長期確定性方向,跟著這個方向走,踩坑的概率會小很多。
參考:
https://www.zionmarketresearch.com/report/edge-artificial-intelligence-chips-market
https://iot-analytics.com/leading-generative-ai-companies/
https://www.generativevalue.com/p/the-inference-landscape
文章來源于 歪睿老哥 ,作者 歪睿老哥
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.