網易首頁 > 網易號 > 正文申請入駐

一年數千億美元，AI數據中心投資會崩潰嗎？

2026-06-01 15:38:56　來源: 芯世相

上海舉報

分享至

我是芯片超人花姐，入行20年，有50W+芯片行業粉絲。有很多不方便公開發公眾號的，關于芯片買賣、關于資源鏈接等，我會分享在朋友圈。

掃碼加我本人微信

作者簡介：

湯之上隆先生為日本精密加工研究所所長，曾長期在日本制造業的生產第一線從事半導體研發工作，2000年獲得京都大學工學博士學位，之后一直從事和半導體行業有關的教學、研究、顧問及新聞工作者等工作，曾撰寫《日本“半導體”的失敗》、《“電機、半導體”潰敗的教訓》、《失去的制造業：日本制造業的敗北》等著作。

AI數據中心的投資，如今已明顯達到異常水平。Microsoft、Google、Amazon、Meta等超大規模云服務商（Hyperscaler）正競相投入每年數千億美元的資本支出。據TrendForce的報道，2026年上述四大超大規模云服務商的數據中心投資總額，最高將達7550億美元（圖1）。若以1美元兌160日元換算，約合120.8萬億日元，超過2025年度日本國家預算（一般會計總額約115萬億日元規模，來源：財務省）的水平。

圖1：四大超大規模云服務商對數據中心的瘋狂資本支出；來源：根據TrendForce數據等由筆者制作

之所以需要如此巨額的投資，是因為搭載在AI服務器上的AI半導體價格正在飆升。以AI半導體的代表產品——英偉達（NVIDIA）的GPU為例，在其當前的主力架構“Blackwell”中（按1美元=160日元計算），單塊GPU“B200”的價格在500萬至800萬日元之間，搭載8個B200的服務器“DGX B200”售價為4000萬至7000萬日元，基于該服務器的AI機架“GB200 NVL72”則達到數億至10億日元級別（圖2）。正因為需要將大量此類AI機架并排部署以構建AI數據中心，各超大規模云服務提供商的投資額才會超過1000億至2000億美元。

圖2：NVIDIA GPU的AI服務器及數據中心價格結構（Hopper、Blackwell、Rubin）；來源：根據NVIDIA技術發布及產品資料、TSMC相關報道、Micron Technology與SK hynix的HBM發布、各類行業分析（Reuters、SemiAnalysis、TrendForce等）由作者制作（價格及部分配置為推算）

然而，這已超出了“增長投資”這一術語所能涵蓋的范疇，反而呈現出一種更接近于“為競爭而進行的軍備競賽”的態勢。

在這種情況下，有一個至關重要卻幾乎未被正面討論的問題。那就是“這項投資真的能夠收回成本嗎”這一極其基本且本質的問題。在AI熱潮中，人們往往只強調需求強度和技術創新，但在資本密集型產業中，最終被問及的始終是投資回報的成敗。

本文將AI數據中心的成本結構分解為GPU、高帶寬內存（HBM）、電力三個要素，并進一步利用Microsoft和Google的實際披露數據，對當前AI投資的收益結構進行定量分析。在此基礎上，嘗試推算在哪個時間節點將陷入無法回收的境地，即所謂"崩潰臨界線"。

此外，本文的分析以GPU基礎設施按時計費的直接收益為對象，不包含AI所帶來的間接收益效果（如搜索廣告質量提升、SaaS附加價值增加等）。請讀者在理解這一前提的基礎上閱讀本文。

若先行揭示結論：美國各超大規模云服務商對AI數據中心近乎瘋狂的投資，極有可能已經破產。用動畫《北斗神拳》中拳四郎的名言來說，就是“你已經死了”。

從Microsoft與Google

看投資規模的實態

圖3以定量方式呈現了從Microsoft與Google案例中所見的投資規模實態。基于該數據，我們可以看出Microsoft以及Alphabet旗下Google的數據中心投資已達到何等異常的水平。

圖3：從Microsoft與Google看投資規模的實態；來源：根據Microsoft FY2025年度報告、Alphabet Earnings Call FY2025數據由筆者制作

1-1）Microsoft的情況

根據Microsoft 2025財年年度報告，資本支出（固定資產的增加）已達645億美元（來源：Microsoft Form 10-K, FY2025）。此外，公司說明以AI基礎設施為中心的投資有望超過800億美元（來源：Microsoft官方發布, 2025年）。

將這一規模與Microsoft 云業務的銷售額1680億美元（來源同上）相比較，資本支出約占銷售額的38%，按公司披露數據計算則約為48%。通常情況下，在穩定的基礎設施業務中，資本支出超過銷售額30%的情況極為罕見，這一水平極為異常。

更為重要的是，折舊費用已達220億美元（來源同上）。這意味著過去投資的負擔已開始影響損益，未來數年間這一負擔持續增加的可能性極高。

此外，如前圖1所示，2026年Microsoft的資本支出預計將比上年增長約2.4倍，達到1900億美元。因此，可以預測Microsoft的損益將大幅向負方向移動。

1-2）Google的情況

另一方面，擁有Google的Alphabet進行了更為激進的投資。2025年的資本支出達914億美元，其中大部分投向了服務器和數據中心等技術基礎設施（來源：Alphabet Earnings Call, FY2025）。相比之下，Google Cloud的年度銷售額約為588億美元，營業利潤約為139億美元（來源同上）。

當然，914億美元的資本支出不僅面向Cloud業務，也支撐著搜索引擎、AI研究基礎設施等全公司層面的基礎設施。但即便假設其中一半用于Cloud，也約達457億美元，相當于Cloud銷售額的約80%、營業利潤的約3.3倍。即便考慮到這一點，當前投資規模已大幅偏離傳統投資回收模型。

此外，與Microsoft同樣，預計2026年Google整體的設備投資將達到1800億至1900億美元，較上年增長約2.4至2.5倍。鑒于如此高水平的設備投資，不難想象云業務的投資回收將變得更加困難。

AI數據中心的成本結構

投資規模之所以能膨脹至此，原因在于AI數據中心特有的成本結構。首先，我們來推測AI數據中心的成本結構及市場范圍（圖4）。

圖4：AI數據中心的成本結構、市場區間（文中所載代表值）；來源：根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作

首先是GPU。當前的AI基礎設施在很大程度上依賴于NVIDIA生產的GPU。例如，H100的系統價格雖因配置而異，但據稱每塊約為2.5萬至4萬美元（來源：各類市場調研、供應商報價范圍），在8塊GPU的配置下，每機架成本可達約300萬美元。此外，在GB200世代，每機架價格將升至數百萬美元后半段（約350萬至550萬美元規模）（來源：行業分析師估算）。

更重要的是，投資并非針對單個GPU，而是以“集群為單位”。在當前的AI數據中心中，每個集群投入數千至數萬個GPU的情況正逐漸成為常態，單個集群的投資額可達數億美元至約7億美元。

其次是HBM。在H100和GB200中，每塊GPU通常搭載6至8棧HBM的配置。HBM的單價雖因代際和合同條款而異，但據TrendForce等各類內存市場報告顯示，HBM3/3E的每棧價格約為1000至1500美元。因此，每塊GPU的HBM成本約為1萬美元左右，在GPU總成本中占據極高比例。

更重要的是供應限制。HBM市場幾乎僅由SK海力士、三星電子和美光這三家公司壟斷，尤其在尖端HBM領域，SK海力士的市場份額據稱超過50%（來源：TrendForce, 2025）。這種供應集中形成了抑制價格下降的結構。

第三是電力問題。AI數據中心的功耗與傳統云服務相比高出數個數量級（圖5）。例如，H100的TDP（注：Thermal Design Power的縮寫，指為冷卻芯片所需的預估最大發熱量）約為700W，而GB200則達到1kW級別（來源：NVIDIA規格）。假設構建一個由1萬個GPU組成的集群，僅GPU部分就需10MW的電力，若包含網絡和冷卻系統，總功耗將達到20～30MW。

圖5：AI數據中心年度電力消耗及其總費用；來源：根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作

回到圖5的說明，換算為年度電力量，20MW的情況下，20MW × 24小時 × 365天 ≒ 1.75億kWh/年。若電力單價為0.14美元/kWh（約等于20日元/kWh），則年度電力成本可達約2500萬美元。實際上，考慮到冗余配置和冷卻損耗，達到3500萬美元規模/年的情況也被認為并不罕見。

如上所述，GPU（資本支出）、HBM（供應制約）、電力（運營支出）三要素均隨規模的擴大而加速增長。其結果是，AI基礎設施的成本在結構上持續高位，與傳統模式相比，幾乎不存在通過規模擴張實現成本削減的余地。

傳統回收模式已不再適用

傳統的云基礎設施，得益于服務器單價的持續下降和利用率的提升，發揮了規模經濟效應。隨著摩爾定律和虛擬化技術的進步，一臺服務器隨著時間的推移能夠處理“更便宜、更多”的服務，這支撐了傳統的投資回收模式。然而，在AI數據中心中，情況大不相同。圖6展示了其成本結構的前提條件，圖7則展示了基于該前提條件計算出的AI數據中心投資回收線。

圖6：計算AI數據中心回收模型所用的前提條件；來源：根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作

圖7：AI數據中心回收臨界線的推算；來源：根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作

假設一個擁有1萬個GPU的集群的初始投資為7億美元（包括GPU、服務器、網絡和冷卻系統），并在會計上分5年攤銷，則年攤銷費用為1.4億美元。加上3500萬美元的電力成本和3500萬美元的運營費用（維護、人工、數據中心租金等），年總成本約為2.1億美元。

由此，每塊GPU所需的回收計費單價可通過下列公式計算：

所需計費單價＝年總成本 ÷（GPU數量 × 8760小時 ×稼動率）

假設稼動率為70%，則：

2.1億美元 ÷（1萬 × 8760小時 × 0.7）≒ 約3.43美元/GPU小時

也就是說，如果每塊GPU無法在接近滿負荷運行的狀態下持續產生每小時3.43美元以上的收益，就無法收回投資。這是"下限"而非"平均值"，稼動率一旦下降，所需單價將進一步跳升。

然而在現實市場中，生成式AI的推理價格正在急速下降。例如，據報道大型語言模型（LLM）的API（應用程序編程接口）價格在2023年至2025年間已出現下降至十分之一以下的案例（來源：OpenAI、Google、各類API價格比較）。此外，隨著開源模型的普及，價格競爭愈發激烈。

此處值得關注的是，盡管API價格急劇下滑，GPU、HBM及電力成本卻反而呈上升態勢。至此，傳統的成本回收模式已難以成立。AI基礎設施正從"越擴規模越有利的模式"轉變為"越擴規模固定成本風險越大的模式"。那么，在何種水平下將陷入無法回收的境地？下面將基于Microsoft和Google的實際數據，對回收條件加以探討。

回收臨界線的實態

如第1章所述，Microsoft在持續保持年均600億至800億美元規模投資的同時，截至2025年已承擔超過200億美元的折舊費用。若試圖以Microsoft Cloud的營業利潤覆蓋這220億美元的折舊費用，則將大幅壓低Cloud業務的營業利潤率。另一方面，Google Cloud業務的營業利潤為139億美元，而僅資本支出的一半（推算為Cloud向部分）就已達457億美元規模，以單一年度來看，投入到投資中的資金相當于營業利潤的3倍以上。

這揭示了一個結構性問題。AI基礎設施必須對所投資本持續維持極高的收益率，方能成立。然而現實中，AI服務價格持續下滑，GPU和HBM的成本高位不退，電力成本不斷攀升。

在這三種因素同時作用的環境下，投資回收的條件正在急速惡化。可以說，當前的AI投資已陷入一種結構性困境：除非極高的稼動率與高單價同時成立，否則回收極為困難。

投資為何仍不停歇

那么，這場近乎瘋狂的資本支出會減速嗎？結論是否定的。

Microsoft持有約3680億美元的合同未履行余額（Remaining Performance Obligations：在手訂單）（來源：Microsoft Earnings Call, FY2025 Q4），需求依然超過供給。Google也已明確表示將進一步擴大資本支出，以應對AI及云需求（來源：Alphabet Earnings Call, FY2025）。

此處值得關注的是，兩家公司并非"因為能回收才投資"。恰恰相反，正是因為"一旦停止投資便會被淘汰出競爭"，才不得不持續投資。

當前的AI投資，已從追求利潤最大化的投資，異變為規避出局的投資。AI投資應被認為已不再處于"成長"階段，而是進入了"消耗戰"階段。

只要這一結構持續，AI熱潮將繼續擴大，而其內部將不斷積累著無法收回投資的風險這一“扭曲”。這一扭曲將在某一臨界點驟然顯現。這便是下一章所揭示的"崩潰臨界線"。

探尋崩潰臨界線

如前所述，判斷AI投資的可持續性，需要將GPU數量、HBM、電力乃至電源基礎設施作為一個整體來審視，而非僅著眼于GPU臺數。本章以1萬顆GPU級集群為代表案例，定量呈現在何種水平下投資將陷入無法回收的境地——即"崩潰臨界線"。

6-1）從GPU臺數反推，HBM與電力需求將呈何種增長趨勢？

首先以1萬顆GPU集群為前提。圖8示每個集群所需的年度電量及其核電換算基準。

圖8：構成崩潰臨界線前提的所需電力消耗物理規模；來源：根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作

假設每顆GPU搭載8棧HBM，則所需HBM合計達8萬棧。以每棧24GB換算，總搭載量約為1.92PB。電力方面，若每顆GPU約為1kW級，包含冷卻、變電、網絡負荷在內整體設施負荷約為2倍，則1萬顆GPU集群的設施負荷約為20MW。

年度電力量可達約175.2GWh，若以此除以1座1GW級核電站以90%設備利用率運行時的年發電量，相當于約0.022座核電站的發電量。反言之，這意味著1座核電站僅能支撐約45個站點，若大規模擴建AI集群，若不新建核電站級電源，根本無法滿足需求。

6-2）崩潰臨界線的定義

如前所述，以1萬顆GPU集群、初期投資7億美元、會計攤銷5年、年度運營費3500萬美元、年度電力費約3500萬美元計算，年度總成本約為2.10億美元。此時損益平衡條件如第3章所述，可由以下公式表示：

所需計費單價＝年度總成本 ÷（GPU臺數 × 24小時 × 365天 × 稼動率）

以稼動率70%為前提，所需計費單價約為3.43美元/GPU小時。這便是本文所稱的"崩潰臨界線"。即，一旦AI服務價格跌破這一水平，或稼動率跌破這一前提，投資即刻進入無法回收的領域。

此外，會計上5年的攤銷期與NVIDIA GPU的技術迭代周期（大致每2年換代）相比，是較為樂觀的前提。在后述的崩潰情景③中，將驗證攤銷期縮短對收益結構的影響。

6-3）崩潰會驟然發生

在通常的基礎設施產業中，利潤率是逐漸下降的。但在固定成本極為龐大的AI數據中心中，由于以下三個原因，一旦跌破某一臨界線，損益將驟然惡化。

GPU與HBM的初期投資巨大且固定
電力與冷卻負荷高企，難以輕易降低
而另一方面，所需計費單價（市場價格）卻在競爭壓力下單方面下降

因此，AI投資的惡化并非線性，而是非線性的結構。即并非"略有惡化則略感吃力"，而是"一旦超過某一臨界點，赤字便驟然擴大的結構"。這便是崩潰臨界線的本質。

下面將AI數據中心走向崩潰的情景分為三類，進行定量推算。各情景的共同條件見圖9。

圖9：計算AI數據中心崩潰臨界線時的共同條件；來源：根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作

6-4）三條崩潰情景

關于三個崩潰情景，基于圖10示以下模擬結果。

圖10：AI數據中心走向崩潰的三個情景模擬；來源：根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作

① 軟性崩潰

最易發生的是AI企業間價格競爭激化的情景。當計費單價降至2.90美元/GPU小時、稼動率下降至65%時，所需計費單價將上升至3.69美元，年度損益將出現約4490萬美元的虧損。

不過，如圖10所示，這一階段尚未達到全面崩潰，但利潤已完全消失，投資回收正悄然走向破產。表面上需求得以維持，但內部的資本效率已然瓦解。

② 硬性崩潰

下一個危險情景是電力、冷卻、部署等物理成本的上升。在計費單價3.00美元、稼動率55%的條件下，疊加電力單價上漲及設施負荷增大，所需計費單價將跳升至4.70美元，年度損益將出現約8170萬美元的虧損。

從圖10可以看出，在這一階段虧損幅度急劇擴大。這并非需求問題，而是基礎設施成本摧毀盈利能力的典型案例。

③ 金融崩潰

最為嚴峻的是金融層面率先爆發崩潰的情景。即便計費單價為3.20美元、稼動率為60%，一旦疊加攤銷期縮短（5年→4年）與8%的資本成本負擔，所需計費單價將達5.73美元，年度損益將出現約1.33億美元的虧損。

其結果如圖10最下行所示，這一階段的損失已達到無法吸收的水平（1.33億美元/年）。設備在物理上損壞之前，資本市場將率先判定"無法回收"——這便是本情景的本質。

6-5）崩潰以"非線性"方式發生

圖11示AI數據中心稼動率與所需計費單價之間的關系。此處值得關注的是，這一關系并非線性。

圖11：AI數據中心進入崩潰區域的臨界條件；來源：根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作

稼動率70%時所需計費單價約為3.43美元，但稼動率降至60%時將上升至接近4美元。若進一步降至50%，所需單價將驟然跳升至接近5美元。

圖11所示的"BREAKDOWN ZONE"直觀呈現了這一非線性特征。市場價格區間（2.5～3.0美元：基于AWS、Azure、Lambda Labs等H100/H200小時單價區間）已深度進入這一區域，當前AI服務價格在結構上很可能已低于回收臨界線。

6-6）電力制約：AI已成國家基礎設施問題

更為重要的是，AI投資的規模化直接依賴于電力基礎設施。如圖12所示，1萬顆GPU約需20MW，10萬顆GPU則需200MW，100萬顆GPU則達2000MW（即2GW）。這已不僅僅是數據中心的擴張，而意味著電力供應基礎設施本身的擴張。

圖12：從1萬GPU→10萬GPU→100萬GPU，所需電力急劇增長；來源：根據各類市場調查、供應商報價區間、行業分析師推算、以TrendForce為首的各類內存市場報告、NVIDIA規格等由筆者制作

若將這部分電力換算為核電站，則為：

1萬個GPU集群：0.02座

10萬個GPU集群：0.2座

100萬個GPU集群：2.2座

由此可見，AI投資的擴大本身即是電力基礎設施的擴張。AI數據中心已不再僅僅是IT產業的問題，而是轉化為電力、土地、建設能力等"國家供給能力的問題"。

6-7）AI投資所面臨的"崩潰"

當前對AI數據中心的投資，不僅"無法盈利"，更具有"在物理上也無法持續"的結構。市場價格下跌、稼動率降低、電力成本上升、資本市場趨嚴——其中任何一個因素單獨推進，崩潰臨界線便會即刻顯現。而這一崩潰并非逐漸發生，而是在超過某一臨界點的瞬間驟然降臨。這已不僅僅是半導體產業的問題，同時也是國家層面電力供給能力的問題。

結語

據日本經濟新聞等媒體報道，2026年4月3日，高市早苗首相與美國超大規模云服務商之一Microsoft的總裁布拉德·史密斯會談，對該公司向日本投資規模達100億美元（約1.6萬億日元）的數據中心表示歡迎。

然而如本文所示，這筆投資具有盈利崩潰、大量消耗電力、對國家基礎設施造成負擔的結構。對此類投資表示歡迎，難以稱之為有利于國家利益的成長戰略，恐將淪為把本國的電力與資本拱手相讓給外資AI基礎設施的結果。

在AI熱潮的狂熱背后，我們現在有必要冷靜審視日本將為此付出的代價之沉重。

領取100G半導體產業資料包

點擊查看往期內容

將芯世相設為“星標”，第一時間收獲最新推送

求喜歡

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.