我是芯片超人花姐,入行20年,有50W+芯片行業粉絲。有很多不方便公開發公眾號的,關于芯片買賣、關于資源鏈接等,我會分享在朋友圈。
掃碼加我本人微信
作者簡介:
湯之上隆先生為日本精密加工研究所所長,曾長期在日本制造業的生產第一線從事半導體研發工作,2000年獲得京都大學工學博士學位,之后一直從事和半導體行業有關的教學、研究、顧問及新聞工作者等工作,曾撰寫《日本“半導體”的失敗》、《“電機、半導體”潰敗的教訓》、《失去的制造業:日本制造業的敗北》等著作。
AI數據中心的投資,如今已明顯達到異常水平。Microsoft、Google、Amazon、Meta等超大規模云服務商(Hyperscaler)正競相投入每年數千億美元的資本支出。據TrendForce的報道,2026年上述四大超大規模云服務商的數據中心投資總額,最高將達7550億美元(圖1)。若以1美元兌160日元換算,約合120.8萬億日元,超過2025年度日本國家預算(一般會計總額約115萬億日元規模,來源:財務省)的水平。
![]()
圖1:四大超大規模云服務商對數據中心的瘋狂資本支出;來源:根據TrendForce數據等由筆者制作
之所以需要如此巨額的投資,是因為搭載在AI服務器上的AI半導體價格正在飆升。以AI半導體的代表產品——英偉達(NVIDIA)的GPU為例,在其當前的主力架構“Blackwell”中(按1美元=160日元計算),單塊GPU“B200”的價格在500萬至800萬日元之間,搭載8個B200的服務器“DGX B200”售價為4000萬至7000萬日元,基于該服務器的AI機架“GB200 NVL72”則達到數億至10億日元級別(圖2)。正因為需要將大量此類AI機架并排部署以構建AI數據中心,各超大規模云服務提供商的投資額才會超過1000億至2000億美元。
![]()
圖2:NVIDIA GPU的AI服務器及數據中心價格結構(Hopper、Blackwell、Rubin); 來源:根據NVIDIA技術發布及產品資料、TSMC相關報道、Micron Technology與SK hynix的HBM發布、各類行業分析(Reuters、SemiAnalysis、TrendForce等)由作者制作(價格及部分配置為推算)
然而,這已超出了“增長投資”這一術語所能涵蓋的范疇,反而呈現出一種更接近于“為競爭而進行的軍備競賽”的態勢。
在這種情況下,有一個至關重要卻幾乎未被正面討論的問題。那就是“這項投資真的能夠收回成本嗎”這一極其基本且本質的問題。在AI熱潮中,人們往往只強調需求強度和技術創新,但在資本密集型產業中,最終被問及的始終是投資回報的成敗。
本文將AI數據中心的成本結構分解為GPU、高帶寬內存(HBM)、電力三個要素,并進一步利用Microsoft和Google的實際披露數據,對當前AI投資的收益結構進行定量分析。在此基礎上,嘗試推算在哪個時間節點將陷入無法回收的境地,即所謂"崩潰臨界線"。
此外,本文的分析以GPU基礎設施按時計費的直接收益為對象,不包含AI所帶來的間接收益效果(如搜索廣告質量提升、SaaS附加價值增加等)。請讀者在理解這一前提的基礎上閱讀本文。
若先行揭示結論:美國各超大規模云服務商對AI數據中心近乎瘋狂的投資,極有可能已經破產。用動畫《北斗神拳》中拳四郎的名言來說,就是“你已經死了”。
01
從Microsoft與Google
看投資規模的實態
圖3以定量方式呈現了從Microsoft與Google案例中所見的投資規模實態。基于該數據,我們可以看出Microsoft以及Alphabet旗下Google的數據中心投資已達到何等異常的水平。
![]()
圖3:從Microsoft與Google看投資規模的實態;來源:根據Microsoft FY2025年度報告、Alphabet Earnings Call FY2025數據由筆者制作
1-1)Microsoft的情況
根據Microsoft 2025財年年度報告,資本支出(固定資產的增加)已達645億美元(來源:Microsoft Form 10-K, FY2025)。此外,公司說明以AI基礎設施為中心的投資有望超過800億美元(來源:Microsoft官方發布, 2025年)。
將這一規模與Microsoft 云業務的銷售額1680億美元(來源同上)相比較,資本支出約占銷售額的38%,按公司披露數據計算則約為48%。通常情況下,在穩定的基礎設施業務中,資本支出超過銷售額30%的情況極為罕見,這一水平極為異常。
更為重要的是,折舊費用已達220億美元(來源同上)。這意味著過去投資的負擔已開始影響損益,未來數年間這一負擔持續增加的可能性極高。
此外,如前圖1所示,2026年Microsoft的資本支出預計將比上年增長約2.4倍,達到1900億美元。因此,可以預測Microsoft的損益將大幅向負方向移動。
1-2)Google的情況
另一方面,擁有Google的Alphabet進行了更為激進的投資。2025年的資本支出達914億美元,其中大部分投向了服務器和數據中心等技術基礎設施(來源:Alphabet Earnings Call, FY2025)。相比之下,Google Cloud的年度銷售額約為588億美元,營業利潤約為139億美元(來源同上)。
當然,914億美元的資本支出不僅面向Cloud業務,也支撐著搜索引擎、AI研究基礎設施等全公司層面的基礎設施。但即便假設其中一半用于Cloud,也約達457億美元,相當于Cloud銷售額的約80%、營業利潤的約3.3倍。即便考慮到這一點,當前投資規模已大幅偏離傳統投資回收模型。
此外,與Microsoft同樣,預計2026年Google整體的設備投資將達到1800億至1900億美元,較上年增長約2.4至2.5倍。鑒于如此高水平的設備投資,不難想象云業務的投資回收將變得更加困難。
02
AI數據中心的成本結構
投資規模之所以能膨脹至此,原因在于AI數據中心特有的成本結構。首先,我們來推測AI數據中心的成本結構及市場范圍(圖4)。
![]()
圖4:AI數據中心的成本結構、市場區間(文中所載代表值);來源:根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作
首先是GPU。當前的AI基礎設施在很大程度上依賴于NVIDIA生產的GPU。例如,H100的系統價格雖因配置而異,但據稱每塊約為2.5萬至4萬美元(來源:各類市場調研、供應商報價范圍),在8塊GPU的配置下,每機架成本可達約300萬美元。此外,在GB200世代,每機架價格將升至數百萬美元后半段(約350萬至550萬美元規模)(來源:行業分析師估算)。
更重要的是,投資并非針對單個GPU,而是以“集群為單位”。在當前的AI數據中心中,每個集群投入數千至數萬個GPU的情況正逐漸成為常態,單個集群的投資額可達數億美元至約7億美元。
其次是HBM。在H100和GB200中,每塊GPU通常搭載6至8棧HBM的配置。HBM的單價雖因代際和合同條款而異,但據TrendForce等各類內存市場報告顯示,HBM3/3E的每棧價格約為1000至1500美元。因此,每塊GPU的HBM成本約為1萬美元左右,在GPU總成本中占據極高比例。
更重要的是供應限制。HBM市場幾乎僅由SK海力士、三星電子和美光這三家公司壟斷,尤其在尖端HBM領域,SK海力士的市場份額據稱超過50%(來源:TrendForce, 2025)。這種供應集中形成了抑制價格下降的結構。
第三是電力問題。AI數據中心的功耗與傳統云服務相比高出數個數量級(圖5)。例如,H100的TDP(注:Thermal Design Power的縮寫,指為冷卻芯片所需的預估最大發熱量)約為700W,而GB200則達到1kW級別(來源:NVIDIA規格)。假設構建一個由1萬個GPU組成的集群,僅GPU部分就需10MW的電力,若包含網絡和冷卻系統,總功耗將達到20~30MW。
![]()
圖5:AI數據中心年度電力消耗及其總費用;來源:根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作
回到圖5的說明,換算為年度電力量,20MW的情況下,20MW × 24小時 × 365天 ≒ 1.75億kWh/年。若電力單價為0.14美元/kWh(約等于20日元/kWh),則年度電力成本可達約2500萬美元。實際上,考慮到冗余配置和冷卻損耗,達到3500萬美元規模/年的情況也被認為并不罕見。
如上所述,GPU(資本支出)、HBM(供應制約)、電力(運營支出)三要素均隨規模的擴大而加速增長。其結果是,AI基礎設施的成本在結構上持續高位,與傳統模式相比,幾乎不存在通過規模擴張實現成本削減的余地。
03
傳統回收模式已不再適用
傳統的云基礎設施,得益于服務器單價的持續下降和利用率的提升,發揮了規模經濟效應。隨著摩爾定律和虛擬化技術的進步,一臺服務器隨著時間的推移能夠處理“更便宜、更多”的服務,這支撐了傳統的投資回收模式。然而,在AI數據中心中,情況大不相同。圖6展示了其成本結構的前提條件,圖7則展示了基于該前提條件計算出的AI數據中心投資回收線。
![]()
圖6:計算AI數據中心回收模型所用的前提條件;來源:根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作
![]()
圖7:AI數據中心回收臨界線的推算;來源:根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作
假設一個擁有1萬個GPU的集群的初始投資為7億美元(包括GPU、服務器、網絡和冷卻系統),并在會計上分5年攤銷,則年攤銷費用為1.4億美元。加上3500萬美元的電力成本和3500萬美元的運營費用(維護、人工、數據中心租金等),年總成本約為2.1億美元。
由此,每塊GPU所需的回收計費單價可通過下列公式計算:
所需計費單價 = 年總成本 ÷(GPU數量 × 8760小時 ×稼動率)
假設稼動率為70%,則:
2.1億美元 ÷(1萬 × 8760小時 × 0.7)≒ 約3.43美元/GPU小時
也就是說,如果每塊GPU無法在接近滿負荷運行的狀態下持續產生每小時3.43美元以上的收益,就無法收回投資。這是"下限"而非"平均值",稼動率一旦下降,所需單價將進一步跳升。
然而在現實市場中,生成式AI的推理價格正在急速下降。例如,據報道大型語言模型(LLM)的API(應用程序編程接口)價格在2023年至2025年間已出現下降至十分之一以下的案例(來源:OpenAI、Google、各類API價格比較)。此外,隨著開源模型的普及,價格競爭愈發激烈。
此處值得關注的是,盡管API價格急劇下滑,GPU、HBM及電力成本卻反而呈上升態勢。至此,傳統的成本回收模式已難以成立。AI基礎設施正從"越擴規模越有利的模式"轉變為"越擴規模固定成本風險越大的模式"。那么,在何種水平下將陷入無法回收的境地?下面將基于Microsoft和Google的實際數據,對回收條件加以探討。
04
回收臨界線的實態
如第1章所述,Microsoft在持續保持年均600億至800億美元規模投資的同時,截至2025年已承擔超過200億美元的折舊費用。若試圖以Microsoft Cloud的營業利潤覆蓋這220億美元的折舊費用,則將大幅壓低Cloud業務的營業利潤率。另一方面,Google Cloud業務的營業利潤為139億美元,而僅資本支出的一半(推算為Cloud向部分)就已達457億美元規模,以單一年度來看,投入到投資中的資金相當于營業利潤的3倍以上。
這揭示了一個結構性問題。AI基礎設施必須對所投資本持續維持極高的收益率,方能成立。然而現實中,AI服務價格持續下滑,GPU和HBM的成本高位不退,電力成本不斷攀升。
在這三種因素同時作用的環境下,投資回收的條件正在急速惡化。可以說,當前的AI投資已陷入一種結構性困境:除非極高的稼動率與高單價同時成立,否則回收極為困難。
05
投資為何仍不停歇
那么,這場近乎瘋狂的資本支出會減速嗎?結論是否定的。
Microsoft持有約3680億美元的合同未履行余額(Remaining Performance Obligations:在手訂單)(來源:Microsoft Earnings Call, FY2025 Q4),需求依然超過供給。Google也已明確表示將進一步擴大資本支出,以應對AI及云需求(來源:Alphabet Earnings Call, FY2025)。
此處值得關注的是,兩家公司并非"因為能回收才投資"。恰恰相反,正是因為"一旦停止投資便會被淘汰出競爭",才不得不持續投資。
當前的AI投資,已從追求利潤最大化的投資,異變為規避出局的投資。AI投資應被認為已不再處于"成長"階段,而是進入了"消耗戰"階段。
只要這一結構持續,AI熱潮將繼續擴大,而其內部將不斷積累著無法收回投資的風險這一“扭曲”。這一扭曲將在某一臨界點驟然顯現。這便是下一章所揭示的"崩潰臨界線"。
06
探尋崩潰臨界線
如前所述,判斷AI投資的可持續性,需要將GPU數量、HBM、電力乃至電源基礎設施作為一個整體來審視,而非僅著眼于GPU臺數。本章以1萬顆GPU級集群為代表案例,定量呈現在何種水平下投資將陷入無法回收的境地——即"崩潰臨界線"。
6-1)從GPU臺數反推,HBM與電力需求將呈何種增長趨勢?
首先以1萬顆GPU集群為前提。圖8示每個集群所需的年度電量及其核電換算基準。
![]()
圖8:構成崩潰臨界線前提的所需電力消耗物理規模;來源:根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作
假設每顆GPU搭載8棧HBM,則所需HBM合計達8萬棧。以每棧24GB換算,總搭載量約為1.92PB。電力方面,若每顆GPU約為1kW級,包含冷卻、變電、網絡負荷在內整體設施負荷約為2倍,則1萬顆GPU集群的設施負荷約為20MW。
年度電力量可達約175.2GWh,若以此除以1座1GW級核電站以90%設備利用率運行時的年發電量,相當于約0.022座核電站的發電量。反言之,這意味著1座核電站僅能支撐約45個站點,若大規模擴建AI集群,若不新建核電站級電源,根本無法滿足需求。
6-2)崩潰臨界線的定義
如前所述,以1萬顆GPU集群、初期投資7億美元、會計攤銷5年、年度運營費3500萬美元、年度電力費約3500萬美元計算,年度總成本約為2.10億美元。此時損益平衡條件如第3章所述,可由以下公式表示:
所需計費單價 = 年度總成本 ÷(GPU臺數 × 24小時 × 365天 × 稼動率)
以稼動率70%為前提,所需計費單價約為3.43美元/GPU小時。這便是本文所稱的"崩潰臨界線"。即,一旦AI服務價格跌破這一水平,或稼動率跌破這一前提,投資即刻進入無法回收的領域。
此外,會計上5年的攤銷期與NVIDIA GPU的技術迭代周期(大致每2年換代)相比,是較為樂觀的前提。在后述的崩潰情景③中,將驗證攤銷期縮短對收益結構的影響。
6-3)崩潰會驟然發生
在通常的基礎設施產業中,利潤率是逐漸下降的。但在固定成本極為龐大的AI數據中心中,由于以下三個原因,一旦跌破某一臨界線,損益將驟然惡化。
GPU與HBM的初期投資巨大且固定
電力與冷卻負荷高企,難以輕易降低
而另一方面,所需計費單價(市場價格)卻在競爭壓力下單方面下降
因此,AI投資的惡化并非線性,而是非線性的結構。即并非"略有惡化則略感吃力",而是"一旦超過某一臨界點,赤字便驟然擴大的結構"。這便是崩潰臨界線的本質。
下面將AI數據中心走向崩潰的情景分為三類,進行定量推算。各情景的共同條件見圖9。
![]()
圖9:計算AI數據中心崩潰臨界線時的共同條件;來源:根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作
6-4)三條崩潰情景
關于三個崩潰情景,基于圖10示以下模擬結果。
![]()
圖10:AI數據中心走向崩潰的三個情景模擬;來源:根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作
① 軟性崩潰
最易發生的是AI企業間價格競爭激化的情景。當計費單價降至2.90美元/GPU小時、稼動率下降至65%時,所需計費單價將上升至3.69美元,年度損益將出現約4490萬美元的虧損。
不過,如圖10所示,這一階段尚未達到全面崩潰,但利潤已完全消失,投資回收正悄然走向破產。表面上需求得以維持,但內部的資本效率已然瓦解。
② 硬性崩潰
下一個危險情景是電力、冷卻、部署等物理成本的上升。在計費單價3.00美元、稼動率55%的條件下,疊加電力單價上漲及設施負荷增大,所需計費單價將跳升至4.70美元,年度損益將出現約8170萬美元的虧損。
從圖10可以看出,在這一階段虧損幅度急劇擴大。這并非需求問題,而是基礎設施成本摧毀盈利能力的典型案例。
③ 金融崩潰
最為嚴峻的是金融層面率先爆發崩潰的情景。即便計費單價為3.20美元、稼動率為60%,一旦疊加攤銷期縮短(5年→4年)與8%的資本成本負擔,所需計費單價將達5.73美元,年度損益將出現約1.33億美元的虧損。
其結果如圖10最下行所示,這一階段的損失已達到無法吸收的水平(1.33億美元/年)。設備在物理上損壞之前,資本市場將率先判定"無法回收"——這便是本情景的本質。
6-5)崩潰以"非線性"方式發生
圖11示AI數據中心稼動率與所需計費單價之間的關系。此處值得關注的是,這一關系并非線性。
![]()
圖11:AI數據中心進入崩潰區域的臨界條件;來源:根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作
稼動率70%時所需計費單價約為3.43美元,但稼動率降至60%時將上升至接近4美元。若進一步降至50%,所需單價將驟然跳升至接近5美元。
圖11所示的"BREAKDOWN ZONE"直觀呈現了這一非線性特征。市場價格區間(2.5~3.0美元:基于AWS、Azure、Lambda Labs等H100/H200小時單價區間)已深度進入這一區域,當前AI服務價格在結構上很可能已低于回收臨界線。
6-6)電力制約:AI已成國家基礎設施問題
更為重要的是,AI投資的規模化直接依賴于電力基礎設施。如圖12所示,1萬顆GPU約需20MW,10萬顆GPU則需200MW,100萬顆GPU則達2000MW(即2GW)。這已不僅僅是數據中心的擴張,而意味著電力供應基礎設施本身的擴張。
![]()
圖12:從1萬GPU→10萬GPU→100萬GPU,所需電力急劇增長;來源:根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作
若將這部分電力換算為核電站,則為:
1萬個GPU集群:0.02座
10萬個GPU集群:0.2座
100萬個GPU集群:2.2座
由此可見,AI投資的擴大本身即是電力基礎設施的擴張。AI數據中心已不再僅僅是IT產業的問題,而是轉化為電力、土地、建設能力等"國家供給能力的問題"。
6-7)AI投資所面臨的"崩潰"
當前對AI數據中心的投資,不僅"無法盈利",更具有"在物理上也無法持續"的結構。市場價格下跌、稼動率降低、電力成本上升、資本市場趨嚴——其中任何一個因素單獨推進,崩潰臨界線便會即刻顯現。而這一崩潰并非逐漸發生,而是在超過某一臨界點的瞬間驟然降臨。這已不僅僅是半導體產業的問題,同時也是國家層面電力供給能力的問題。
結語
據日本經濟新聞等媒體報道,2026年4月3日,高市早苗首相與美國超大規模云服務商之一Microsoft的總裁布拉德·史密斯會談,對該公司向日本投資規模達100億美元(約1.6萬億日元)的數據中心表示歡迎。
然而如本文所示,這筆投資具有盈利崩潰、大量消耗電力、對國家基礎設施造成負擔的結構。對此類投資表示歡迎,難以稱之為有利于國家利益的成長戰略,恐將淪為把本國的電力與資本拱手相讓給外資AI基礎設施的結果。
在AI熱潮的狂熱背后,我們現在有必要冷靜審視日本將為此付出的代價之沉重。
領取100G半導體產業資料包
![]()
點擊查看往期內容
將芯世相設為“星標”,第一時間收獲最新推送
求喜歡
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.