網易首頁 > 網易號 > 正文 申請入駐

直擊GTC:1萬億美元GPU、為龍蝦做“CUDA”,老黃就指著你燒 token 了

0
分享至


周一笑 |zhouyixiao@pingwest.com
王兆洋 | wangzhaoyang @pi ngwest.com

今年顯然又是英偉達這家33歲公司又一個關鍵時刻,人們像期待數碼產品一樣期待它的芯片更新,對超預期的財報甚至都提不起興趣,眼看有些江郎才盡的時刻,黃仁勛又帶來了新的故事。

3月16日,在2026年英偉達GTC大會上,黃仁勛做了萬眾期待的主旨演講。人們看待英偉達,關心和擔心的都是它的增長。而今年GTC,一個花20億美金收購來的Groq,一個突然就改變了一切并看起來解決了“應用普及問題”的OpenClaw,成了增長故事里的絕對主角。

Groq的新芯片融入英偉達體系后,英偉達宣稱會給它的客戶們解鎖一個3000億美金的增量市場;


同時英偉達也會把Groq更深入融入下一代芯片架構Feynmann 里;

而在他絕對不會遲到的“小龍蝦”狂熱里,黃仁勛要讓英偉達變成OpenClaw們的底層,再次上演一出CUDA同樣的戲碼。

盡管相比GTC最輝煌的那些發布,今年的整個發布的大多時間顯得有點乏善可陳,但這些已經足夠讓黃仁勛信心滿滿,他表示:

2025年到2027年,英偉達的芯片生意將會繼續上漲,漲到1萬億美金。

1

Vera Rubin + Groq,七顆芯片合體

黃仁勛展示了他形容為全新的AI基礎設施層的全貌。

他不再舉著一顆芯片說“this is our new GPU”了。他把整個Vera Rubin機架搬上了舞臺,說這一次英偉達想的是整套系統,從芯片到軟件到互連,端到端垂直整合,作為一臺超級計算機來優化。


上一代Blackwell Ultra已經實現了對比Hopper 50倍的吞吐效率提升,而Vera Rubin + Groq在此基礎上又把前沿推到了新的區間,這套系統由七顆芯片組成。核心Rubin GPU采用臺積電3nm工藝,雙芯片封裝,336B晶體管,配備288GB HBM4內存和22TB/s帶寬,NVFP4推理性能達到50 PFLOPs,比上一代Blackwell提升5倍,訓練性能35 PFLOPs,提升3.5倍。配套的Vera CPU是88核定制Arm架構(代號Olympus),176線程,全球首款在數據中心采用LPDDR5的CPU,專門為Agent推理場景下的高單線程性能和數據處理做了優化。黃仁勛說這顆CPU獨立賣“肯定會成為數十億美元的業務”。

但今晚真正的新聞是第七顆芯片,Groq 3 LPU。去年圣誕夜英偉達花200億美元拿下Groq的技術授權和核心團隊,今天是首次產品落地,而且已經在量產。


為什么需要Groq?黃仁勛在臺上講得很清楚,GPU擅長高吞吐的并行計算,做prefill和attention很強,但在超高速token生成這個區間會力不從心。他的原話是NVL72在超過400 tokens/s/user的區間“runs out of steam”(跑不動了)。而Groq的LPU是一種完全不同的處理器,確定性數據流架構,芯片上全是SRAM,沒有運行時動態調度,編譯器在編譯階段就把每個時鐘周期的計算和數據搬運全部排好了。這種架構天然適合低延遲的decode和token生成。

問題在于SRAM雖快但容量極小。單顆Groq 3 LPU只有500MB SRAM,而Rubin GPU是288GB HBM4,差了500多倍,根本存不下萬億參數的模型。英偉達的解法是用一套叫Dynamo的軟件把推理過程拆成兩半,Rubin負責prefill和attention,處理上下文需要大量算力和大容量內存;Groq負責feed-forward部分的decode和token生成,需要極低延遲和極高帶寬。兩者通過以太網緊耦合,延遲減半。

黃仁勛管這個叫disaggregated inference(解耦推理),并且總結說高吞吐和低延遲本質上enemies of each other(彼此矛盾),而Groq就是解決這個矛盾的那一半拼圖。


舞臺上的那張對比圖視覺沖擊很強。

左邊一顆Rubin GPU,288GB HBM4、22TB/s帶寬、50 PFLOPs。

右邊一排8顆Groq 3 LPU組成的陣列,4GB SRAM、1,200TB/s SRAM帶寬(Rubin的55倍)、9.6 PFLOPs。

兩種極端的處理器,統一成一個推理系統。Groq 3 LPX整機把256顆LPU裝進一個機架,提供128GB SRAM、40PB/s帶寬、315 PFLOPS推理算力和640TB/s互連帶寬。


整套NVL72系統100%液冷,用45度熱水冷卻,把原來花在空調上的能耗省回來給計算用。安裝時間從兩天壓縮到兩小時。第六代NVLink提供3.6TB/s全互連帶寬。首款CPO(共封裝光學)交換機Spectrum X已經量產。

目前,微軟Azure已經跑起了第一套Vera Rubin機架,Satya Nadella在演講期間直接發消息確認。

黃仁勛還給了一個極其直觀的對比,同一個1GW數據中心,兩年內token生成速率從2200萬提升到7億,350倍。他說這就是極致協同設計的力量。

1

1萬億GPU,和新的商業模式可能

在演講里,黃仁勛再次給出數據的指引。

去年GTC他給出的關于英偉達產品的需求估算是5000億美元(覆蓋Blackwell和Rubin到2026年),而今年直接翻倍,他說現在看到的是:

到2027年至少1萬億美元。

驅動力是他反復提到的“推理拐點”,從ChatGPT到o1再到Claude Code,AI從能聊天變成能推理再變成能干活,每一步跳躍都讓單次推理需要的算力暴增,而使用量也在同步起飛。黃仁勛說Claude Code是第一個agentic model,英偉達100%的軟件工程師都在用。



然后他用一張圖把這個宏觀判斷翻譯成了具體的商業邏輯。

整場演講最值得反復看的就是這張,標題叫inference Performance and Efficiency Drive Company Results。


縱軸是吞吐量(TPS/MW,每兆瓦每秒生成的token數),橫軸是交互速度(TPS/User,每用戶每秒拿到的token數)。橫軸越往右意味著AI越“聰明”,模型更大、上下文更長、思考鏈更深,但吞吐量會下降,因為資源被單個用戶的推理任務占用了更多。高吞吐和低延遲本質上矛盾。

黃仁勛在橫軸上切了五檔定價。Free層用Qwen 3(235B參數,32K上下文,免費),Medium層用Kimi K2.5(1T參數,128K上下文,3美元/百萬token),High層用GPT MoE(2T參數,128K,6美元),Premium層同樣是GPT MoE但上下文窗口拉到400K、價格到45美元,Ultra層150美元。

然后他把四代硬件的曲線疊上去。Hopper只能覆蓋Free和Medium層,在高交互區間曲線貼著底部。Blackwell大幅上移,讓Premium層變得經濟可行。Vera Rubin再上一檔。加上Groq LPX之后,曲線在400+ TPS/User的高交互區間向右延伸出去,對比Hopper提升35倍,讓一個目前還不存在的Ultra層(150美元/百萬token)成為可能。

作為一個“首席銷售”,在第二張圖,黃仁勛直接把這個邏輯翻譯成了營收數字。


假設一個1GW數據中心按25%算力分配給每個層級,每GW年營收Blackwell能做300億美元,Rubin做1500億(5倍),加上Groq LPX做3000億(10倍)。

兩張圖合在一起看,敘事邏輯很清晰:第一張為了告訴大家,Rubin讓Premium推理($45/M tokens)變得賺錢,而第二張則證明了,Rubin + LPX可以讓一個尚不存在的Ultra推理市場($150/M tokens)成為可能。

黃仁勛借此定義了一套token定價階梯,并在這最重要的大會上,直接告訴所有客戶,這里面每一層的經濟可行性都直接綁定在英偉達的硬件代際升級上。

換句話說,沒有我的芯片,你到不了下一個價格層級,你的商業模型跑不通。有了我,商業模型的新可能就出現了。

“數據中心是生產token的工廠;推理是工作負載,token是新商品,算力等于營收;未來每個CEO都要盯著自己token工廠的效能看。”

他繼續推銷英偉達:“用得越多省錢閱多。我們是唯一一個在每一個模型里都在被使用的產品,這讓我們成為最強又最便宜的。英偉達的系統是全球范圍內你可獲取的成本最低的AI基礎設施。 ”

黃仁勛甚至直接給了不同客戶部署方案:如果工作負載主要是高吞吐的批量推理,100%配Vera Rubin就夠了。如果有大量編程、高價值實時推理和Agent交互需求,拿25%數據中心配Groq LPX,其余75%純Rubin。

1

Feynman劇透,2028年全部換代

在Rubin介紹完后,Feynman的劇透來了。

英偉達給自己路線圖節奏鎖死,每年一代新架構。當前Blackwell,2026下半年Vera Rubin,2027年Rubin Ultra搭配全新Kyber機架(計算節點改為垂直插入,前置計算后置互連,支持144顆GPU),2028年Feynman。

Feynman是黃仁勛今晚的one more thing式劇透,七個組件全部換代。全新GPU(此前傳聞臺積電A16 1.6nm),LP40 LPU(黃仁勛說是big step up,Groq團隊加入英偉達后共同設計,首次在LPU中加入NVFP4計算能力),Rosa CPU(全名Rosalind,致敬發現DNA結構的Rosalind Franklin),BlueField 5 DPU,ConnectX-10 SuperNIC,NVLink 8。Kyber機架同時支持銅纜和CPO光學互連。

關于銅纜還是光互連的行業爭論,黃仁勛一句話終結,銅的要做,光的也要做,CPO也要做,每一種都需要更多的產能。

中間他還順便提了Vera Rubin Space-1,要把計算模塊送上太空做數據中心。太空沒有傳導和對流只有輻射,散熱是個問題,但英偉達已經在做了。


1

為龍蝦做“CUDA”,NemoClaw定義Agent時代的操作系統

對于最近瘋狂的龍蝦熱,黃仁勛稱Agent是一個全新的計算平臺,并直接把OpenClaw的定位拔到了和Windows、Linux、Kubernetes同一級別。

他用操作系統的語法拆解了OpenClaw的本質,管理資源、調度任務、調用工具、連接大模型、多模態IO、派生子Agent。OpenClaw幾周內超越Linux 30年的GitHub Star數,是人類歷史上增長最快的開源項目。黃仁勛認為它的意義等同于HTML之于互聯網、Kubernetes之于移動云,每家公司都需要一個OpenClaw戰略。

然后話鋒一轉,講了企業場景的致命問題。Agent在公司內網能訪問敏感信息、能執行代碼、能對外通信。黃仁勛讓全場默念了一遍這三條,然后說,這顯然不能被允許。

NemoClaw就是英偉達的解法,但它不是另起爐灶,而是給OpenClaw套上一層企業安全殼。核心組件叫OpenShell,已經集成進OpenClaw,包含策略引擎接口(對接企業已有的安全合規系統)、網絡護欄(限制Agent網絡訪問邊界)和隱私路由(防止敏感數據外傳)。開源,Apache 2.0協議,深度整合NeMo框架、Nemotron模型和NIM推理微服務。

這里的類比關系是,NemoClaw之于OpenClaw生態,就像CUDA之于GPU生態。

CUDA讓GPU從游戲顯卡變成了通用計算平臺,NemoClaw要讓龍蝦從個人玩具變成企業基礎設施。OpenClaw提供了Agent的操作系統,NemoClaw提供了在這個操作系統上安全運行企業應用的開發平臺和工具鏈。

黃仁勛的行業判斷是,未來每家SaaS公司都會變成GaaS(Generative-as-a-Service)公司,企業IT從2萬億美元的工具產業升級為多萬億美元的Agent產業。他甚至預測未來每個工程師入職時都會拿到一份年度token預算,基本工資之外再加一半用于購買token,讓個人生產力放大10倍。“你的offer帶多少token”會成為硅谷新的談判籌碼。


配合Agent生態,英偉達同時宣布了Nemotron Coalition(開源模型聯盟)。六大模型家族全部達到前沿水平,Nemotron(語言推理,OpenClaw評測前三)、Cosmos(物理AI世界模型)、Alpamayo(自動駕駛,號稱首個會思考推理的自動駕駛AI)、Groot(通用機器人)、BioNeMo(生物化學)、Earth 2(天氣氣候)。Nemotron 3 Ultra定位為世界最好的基礎模型,供各國做主權AI定制。聯盟首批成員包括Black Forest Labs、Cursor、LangChain(10億+下載量)、Mistral、Perplexity、Thinking Machines(Mira Murati創辦)等。

英偉達的增長故事不能停。這一次一個可能成為近年英偉達最重要的收購的Groq,和一個突然出現的現象級全民狂熱的OpenClaw讓這個故事得以繼續,黃仁勛也抓住了這些被他形容為“必須抓住的時間窗口”,把大量資源賭在了上面,剩下的,就靠各位一起瘋狂燒token了。



點個愛心,再走 吧

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
明水經濟技術開發區黨工委副書記、管委會副主任李屹東接受審查調查

明水經濟技術開發區黨工委副書記、管委會副主任李屹東接受審查調查

魯中晨報
2026-04-21 11:16:03
楚超隊員撞臉王鶴棣?本人回應

楚超隊員撞臉王鶴棣?本人回應

極目新聞
2026-04-21 17:39:34
男子買彩票中了5340萬 偷偷轉給別的女人2100萬 前妻起訴返還 法院判了

男子買彩票中了5340萬 偷偷轉給別的女人2100萬 前妻起訴返還 法院判了

閃電新聞
2026-04-21 10:35:14
朝鮮戰場整支部隊失蹤 7 天,歸來竟押 119 名俘虜凱旋

朝鮮戰場整支部隊失蹤 7 天,歸來竟押 119 名俘虜凱旋

嘮叨說歷史
2026-01-28 14:32:25
烏克蘭卷土重來摧毀紅軍村指揮部!挫敗俄軍滲透庫皮揚斯克

烏克蘭卷土重來摧毀紅軍村指揮部!挫敗俄軍滲透庫皮揚斯克

項鵬飛
2026-04-19 18:04:26
美國失望了:中伊貿易暴跌80%,伊朗被打廢,中國外貿卻逆市大漲

美國失望了:中伊貿易暴跌80%,伊朗被打廢,中國外貿卻逆市大漲

壹只灰鴿子
2026-04-20 23:21:22
追夢談與布克沖突:我罵的不是他,而是杰倫-格林和狄龍

追夢談與布克沖突:我罵的不是他,而是杰倫-格林和狄龍

懂球帝
2026-04-21 16:03:37
前腳邀請內塔尼亞胡來匈牙利,后腳放話“入境就抓”

前腳邀請內塔尼亞胡來匈牙利,后腳放話“入境就抓”

觀察者網
2026-04-21 16:58:11
中年以后,少吃,真的可以保命

中年以后,少吃,真的可以保命

洞見
2026-04-21 09:06:51
養心就是養命!建議大家吃:心臟最喜歡的8種菜,每天吃點不遭罪

養心就是養命!建議大家吃:心臟最喜歡的8種菜,每天吃點不遭罪

美食店主
2026-03-31 00:10:41
藍眼北京人控訴陳麗華20余年,比女首富更該銘記

藍眼北京人控訴陳麗華20余年,比女首富更該銘記

老蝣說體育
2026-04-19 17:40:22
300123,近138萬手封“20cm”跌停!一季報高增長優質股曝光(附名單)

300123,近138萬手封“20cm”跌停!一季報高增長優質股曝光(附名單)

數據寶
2026-04-21 18:59:59
中東,突傳大消息!特朗普最新發聲!原油跳水,黃金、白銀突變!

中東,突傳大消息!特朗普最新發聲!原油跳水,黃金、白銀突變!

證券時報e公司
2026-04-21 07:44:39
交完錢就“跑路”?海南一幼兒園突然閉園,上百家庭學費打水漂,老師工資泡湯!

交完錢就“跑路”?海南一幼兒園突然閉園,上百家庭學費打水漂,老師工資泡湯!

蓬勃新聞
2026-04-20 21:48:04
人為什么要戒色

人為什么要戒色

今夜無局
2026-04-20 16:37:17
馬英九基金會風暴,李德維怒了,向馬英九開火,蕭旭岑回應亮了

馬英九基金會風暴,李德維怒了,向馬英九開火,蕭旭岑回應亮了

DS北風
2026-04-20 16:48:04
憤怒啊!5000元、月休2天招做飯阿姨,網友:竟要干7個人的工作量

憤怒啊!5000元、月休2天招做飯阿姨,網友:竟要干7個人的工作量

火山詩話
2026-04-21 18:56:19
觸目驚心!央視曝光上海一中醫館:從醫生到病人全是演員!

觸目驚心!央視曝光上海一中醫館:從醫生到病人全是演員!

人間頌
2026-04-20 10:16:00
李亞鵬:我那“抽煙喝酒打麻將”的前妻王菲,竟是世上最好的媽媽

李亞鵬:我那“抽煙喝酒打麻將”的前妻王菲,竟是世上最好的媽媽

舊事別提
2026-04-21 12:05:27
破案了!趙繼偉罕見發文怒批隊友的原因找到,遼寧球迷說出實情

破案了!趙繼偉罕見發文怒批隊友的原因找到,遼寧球迷說出實情

后仰大風車
2026-04-21 07:10:13
2026-04-21 19:24:49
硅星人 incentive-icons
硅星人
硅(Si)是創造未來的基礎,歡迎來到這個星球。
3024文章數 10491關注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

男子買"隨用隨取"保險后得知百歲才能取本金 法院判了

頭條要聞

男子買"隨用隨取"保險后得知百歲才能取本金 法院判了

體育要聞

62歲,成為中國足壇最火的人

娛樂要聞

周潤發時隔16年再賣樓,變現數億資產

財經要聞

現實是最大的荒誕:千億平臺的沖突始末

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態度原創

游戲
時尚
親子
教育
家居

萬代大作擺爛放棄D加密?剛被破解三周

今年春夏最流行的4組通勤穿搭,誰穿誰時髦!

親子要聞

高齡備孕如何提高生育力?備孕輔酶q10需要吃多久?

教育要聞

以沃土育良種——王淑慧家教好故事

家居要聞

詩意光影 窺見自然之境

無障礙瀏覽 進入關懷版