![]()
![]()
作者:我是阿闖
來源:阿闖走大道(ID:ChuangDaDao)
1
過去兩三年,黃仁勛的發言實在太多了。
多到很多人聽他講AI,已經不太分得清哪些是他真看到的東西,哪些是他希望市場相信的未來。
但他講的話依然值得認真讀,因為他所處的位置太重要了。
黃仁勛是AI時代賣鏟子的人。
他不押注哪一個大模型會贏,也不靠某一個AI應用賺錢。他賣算力給所有人,OpenAI、谷歌、Meta、xAI、各國政府,還有大量創業公司,只要要建AI基礎設施,很多都會繞不開英偉達。
這個位置,讓他能看到整個行業的算力橫截面:客戶到底怎么部署,卡在哪里,錢往哪個環節流,哪一種計算正在替代哪一種計算。
2
當然,正是因為他所處的位置,也會讓他的話帶來偏差。
賣鏟子的人,天然希望所有人相信金礦足夠大,所以當他講市場空間有多大,長期需求是幾萬億,每個國家都需要主權AI時,就要打個折扣。
這些未必全是他看到的現實,更像是他希望市場相信的未來。
這幾天,我把這三年黃仁勛的發言通讀了一遍,總結出了三個關鍵內容,也是本文要分享的重點。
第一,AI時代的計算單位,不再是一顆芯片,而是一整座數據中心。
第二,英偉達面對的競爭,不只是GPU對ASIC,而是誰能在同樣的電力和機房里產出更多token。
第三,推理需求確實變了,它不再只是一次性回答,而會變成持續消耗算力的過程,但最后還要看多出來的推理開銷,能不能被答案質量和生產效率的提升覆蓋回來。
同時,我也讀到一些比較夸張的說辭,比如“十億倍”、“幾萬億”、“每個國家都需要主權AI”這類說法,它們未必錯,但太難驗證,不能和上面這3點放在一起。
3
先說第一點,AI時代的計算機,不再是一顆芯片,而是一整座數據中心。
過去我習慣把英偉達看成一家賣GPU的公司。
順著這個看法,觀察問題的視角就變成了:GPU會不會被更便宜的ASIC替代,大客戶會不會自己研芯片,芯片價格會不會隨著供給增加往下走。
盡管這些問題都成立,但它們默認的是同一個前提:英偉達賣的是一顆芯片。然而,黃仁勛反復講的,不是一顆芯片,而是一整座數據中心。
比如,2023年5月,英偉達FY2024 Q1財報電話會上,有分析師問他怎么看來自專用芯片的競爭。
他的回答沒有停在芯片性能的比較上,而是說,計算機就是數據中心,數據中心就是計算機,它不是一顆芯片。
這句話當時更像是一句即興判斷,用來回應一個具體的競爭質疑。
一年后,這個判斷變成了英偉達的正式語言。
2024年5月,英偉達在FY2025 Q1官方財報稿里寫下,很多公司和國家正在與英偉達合作,把傳統數據中心轉向加速計算,并建造一種新型數據中心——AI工廠——用來生產人工智能這種新商品。
2024年8月,英偉達又在FY2025 Q2財報稿里把Blackwell放在full-stack、data center-scale platform的語境里講,而不是只把它當成一顆GPU。
到這一步,“數據中心就是計算機”已經不只是一次反駁,而變成了英偉達描述自己產品時的默認框架。
再往后,這個框架收斂成了一句更徹底的自我定義。2026年4月,黃仁勛在Dwarkesh Patel的訪談里說,英偉達的心智模型是:輸入是電子,輸出是token,中間是英偉達。
這說明英偉達已經把自己放在了電力和token之間的轉換環節上。
![]()
三年時間,AI工廠從黃仁勛一句回應競爭的即興話,變成了英偉達對自己的定義,也影響著英偉達怎么組織產品和客戶關系。
4
如果計算機變成一整座數據中心,競爭的單位也就變了。
問題就不再只是“誰的芯片更快、更便宜”,而是整套系統在同樣的電力、同樣的機房里,誰能產出更多token。
這也是為什么我后來再看GPU和ASIC的競爭時,不再只看芯片價格。
因為在黃仁勛這套框架里,便宜的芯片如果不能帶來更高的每瓦token產出,反而可能是更貴的選擇。
值得注意的是,黃仁勛也并不回避競爭。
早在2023年5月,英偉達FY2024 Q1財報電話會上,他就主動承認,競爭來自四面八方,有初創公司,有半導體大廠,也有云廠商自己研的芯片。
但他的反駁點沒有落在“我的芯片更快”,而是落在兩個地方:一是全棧,二是最低的總擁有成本。他還提到,別人交付一套系統到能用,可能要按月、按年算,而英偉達可以按周算。
到了2025年9月,BG2 Pod《NVIDIA:OpenAI,Future of Compute,and the American Dream》這場訪談里,他把這件事講得更鋒利。
在他的論證里,即便競爭對手把芯片定價為零,客戶也未必會轉向對手。
理由很簡單,每個人都受電力限制。
假設你只有一定的電力,就會希望這點電力換來盡可能多的收入。如果英偉達每瓦性能是對手的兩倍,同樣的數據中心就能產出兩倍收入。
他給的數字是,Blackwell相比上一代Hopper,性能提升約三十倍。在一吉瓦的電力里放棄三十倍的產出,機會成本太高了。高到對手就算把芯片白送,也未必補得回來。
這個論證之所以有力,是因為它把競爭的落點從“芯片標價”挪到了“每瓦產出”和“機會成本”上。
一旦這么算,ASIC便宜不便宜,就不再是唯一的問題。上線速度、集群效率、網絡、軟件、利用率、供電限制,全都進入了同一個公式。
5
2026年4月,Dwarkesh Patel在訪談里繼續追問ASIC和自研芯片的問題。
對方質疑,大客戶完全有能力自己寫軟件,繞開英偉達的護城河。黃仁勛的回應,是把InferenceMAX這個公開基準擺出來:它就在那里,對手可以來證明自己的推理成本優勢,但TPU不來,Trainium不來。
他的意思是,我歡迎他們來證明自己宣稱的成本優勢。
他還拆了一個很常見的假設。
很多人以為自研ASIC一定更省錢,因為省掉了英偉達很高的毛利。但黃仁勛指出,ASIC本身的毛利也很高,甚至大約65%,客戶仍然要付錢給ASIC供應商。
兩者一比,省下的并沒有想象中多。
6
最后一點,推理是真的變了,但推理這一點,必須分開看,因為同一段敘事里,既有真東西,也有包裝。
先看真實變化。
以前很多人理解的推理,更像是一次性響應:你問一句,模型答一句。
但黃仁勛在2025年9月BG2 Pod《NVIDIA:OpenAI,Future of Compute,and the American Dream》這場訪談里講的新推理,不只是給出一個答案,而是模型在回答前先多想一會兒。它會嘗試、檢索、核對,再想一輪,然后才生成答案。
他把AI需求的增長分成三層:先是預訓練,然后是后訓練,最后是推理時的思考。
第三層最關鍵。因為推理本身,從一個一次性的動作,變成了一個會持續消耗算力的過程。
這個變化不是空談,它有財報口徑支撐。英偉達管理層在2024年至少兩次給過明確口徑:推理已經貢獻了數據中心收入約40%,甚至超過40%。
也就是說,在“推理時思考”這個概念被講得很熱之前,推理作為算力需求,就已經不是純愿景。
這是真實發生的需求變化,不能忽略,但這件事還要再往商業上問一步。
推理時多“想一會兒”,確實會消耗更多算力,也可能帶來更好的答案,但更好的答案不等于客戶一定愿意長期買單。
最后還是要看這些reasoning模型,能不能在代碼、客服、搜索、金融、醫療、企業工作流這些場景里,創造出足夠高的增量價值,覆蓋掉更高的推理成本。
所以我愿意相信推理需求正在變重,但這不等于可以盲目樂觀。
真正要觀察的,是客戶愿不愿意為更多token帶來的更高推理開銷持續付費,以及這些開銷能不能換來更高的生產效率或收入。
7
正因為如此,同一段敘事里貼著的另一個東西,就不能照收了:十億倍。
在BG2 Pod那場訪談里,黃仁勛說,推理的算力需求會增長十億倍,并且又說,自己當年講十億倍時還低估了。
這就是需要注意的地方。推理性質變了,是一個可以觀察、可以驗證的判斷。
但“十億倍”不是判斷,它更像是一個標簽,一個貼在真實變化上的、無法驗證的數量級。你沒辦法去驗證它,也很難去證偽它,這也就不應該成為判斷公司的依據。
更要小心的是,當一個方向大致對了之后,他再回頭說“當年講十億倍還低估了”,等于用一個很難證偽的數字,反過來追認自己的遠見。
軟件這條線也要單獨看。
英偉達這幾年一直在講它的軟件棧,AI Enterprise、NIM、Omniverse,這些可以繼續觀察,但不能和推理硬需求混成同一個確定結論。
推理作為算力需求,有收入數據撐著。企業軟件作為一門生意能做多大,目前的驗證程度,遠沒有硬件那么硬。
因此,兩者要分開看。
8
到了主權AI,他的話就不在同一個層級了。
前面幾條判斷,有一個共同特征:越被追問,越落到具體的東西上。比如數據中心、TCO、每瓦token、公開基準。
但黃仁勛的發言里,還有一類判斷,不能和前面幾條放在同一層。
最典型的是主權AI。他在BG2 Pod那場訪談里講到主權AI時說,每個國家都需要自己的AI能力,也把AI和能源、通信、互聯網基礎設施放在一起。
我想說清楚,這個方向未必錯,各國確實在建自己的算力,但問題是,這類話很難被證偽。它不限定時間,不限定規模,也不限定“需要”到底是什么意思。
它和“推理占數據中心收入四成”不在一個層級上。
后者是一個帶時間、帶數字、可以核對的事實。前者是一句聽上去很難反駁,但什么都沒說死的話。
9
怎么正確讀黃仁勛?我分享一下個人經驗。
如果你看到他被追問時,那些越具體,越指向客戶部署、工程約束、公開基準的內容,就越值得重視;越轉向長期總量、國家敘事和難以證偽的大判斷,就越要打折。
說到底,正是因為黃仁勛和其他業內人士不一樣。
其他人預測未來,說對說錯,事后才知道。但黃仁勛手里握著GTC、供應鏈、和所有大客戶的關系,還有幾百億美元的投資。
他在2026年4月Dwarkesh Patel的訪談里其實自己說破了這一點:他會把各行業的CEO召集到一起,告訴他們這個行業會有多大,和他們一起推理,讓他們像他一樣推理。
他也承認,GTC的演講被設計成一場教育和布道,目的是讓整個上下游都理解、都相信將要發生什么。
這意味著,他不只是在判斷未來,他還有能力下場,讓一部分判斷變成現實。
他說AI工廠是未來,然后真的去投資,把AI工廠建出來;他說推理需求會增長,然后真的去動員供應鏈準備產能。
他過去的樂觀預測之所以常常應驗,有一部分原因是,他能讓整個生態圍著他的敘事行動。
10
這也提醒我們,要盡量客觀看待黃仁勛的發言。
他的發言更有價值,是因為他真能看到、也真能推動結構性的變化;但也正因為如此,我們更要分清楚:哪些是他已經看到的產業變化,哪些是他正在推動市場相信、并試圖一起做成的未來。
所以我個人覺得讀黃仁勛,不能把他當先知,但也不能因為他是英偉達利益相關方就急于否定他。
而是把他說的話拆開:留下那些能被追問、能被驗證、能解釋結構變化的部分,剝掉那些只能制造震撼、很難證偽、服務于市場擴張的部分。
總的來說,對我們研究公司而言,最關鍵的是面對一個既有信息、又有立場、還能推動現實的人,能不能把他的話放回具體事實和商業邏輯里重新檢驗。
版權聲明:部分文章推送時未能與原作者取得聯系。若涉及版權問題,敬請原作者聯系我們。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.