亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

逐項解讀黃仁勛GTC演講:Vera Rubin、token王、英偉達“龍蝦”、太空計算和雪寶|甲子光年

0
分享至



AI工廠啟動,人類歷史上最大基礎設施建設正在發(fā)生。

作者|蘇霍伊 周悅

編輯|王博

美國當?shù)貢r間3月16日上午11點15分,英偉達創(chuàng)始人、CEO黃仁勛出現(xiàn)在了圣何塞SAP中心的舞臺上,開始GTC 2026的主題演講。

面對全場的歡呼聲,黃仁勛說:“我想提醒大家,這是一場科技大會。”

這里距離英偉達總部辦公室只有10分鐘車程,是每年英偉達GTC主題演講的舉辦地。雖然黃仁勛經(jīng)常出現(xiàn)在各種場合發(fā)表演講,但是在這里,他明顯更自然、放松。

圣何塞才是黃仁勛的主場。

雖然圣何塞的酒店價格飛漲,會場周邊的酒店甚至超過了2000美元一晚,但仍有大量的參會者來到這里,希望聽到AI行業(yè)最前沿的分享,尋找更多合作機會。

“GTC已經(jīng)不只是一個技術大會,而是觀察全球AI產(chǎn)業(yè)趨勢的重要窗口。”北大學生人工智能創(chuàng)新會創(chuàng)始理事長謝小璇Valeri告訴「甲子光年」,“這次主要是看黃仁勛會怎么定義未來一年AI行業(yè)的重點方向,尤其是算力平臺、Agent、機器人和企業(yè)級應用這些領域。”

Eigen AI聯(lián)合創(chuàng)始人、麻省理工學院計算機科學博士金帝則告訴「甲子光年」,他最關注的是LPU會給AI推理帶來多大的重塑。

這次,黃仁勛的主題演講主要有五項重要技術發(fā)布。

第一,下一代AI計算平臺Vera Rubin。該平臺將7款芯片整合在一起協(xié)同運行,通過5種機架組成一臺強大的AI超級計算機,能夠支持從大規(guī)模預訓練、后訓練和測試階段擴展,到實時的Agent式推理等階段的AI計算需求。

第二,下一代AI工廠參考設計Vera Rubin DSX。英偉達為企業(yè)和數(shù)據(jù)中心運營商提供一套完整指南,用于設計、建設和運營下一代AI工廠。

第三,“企業(yè)版OpenClaw”——NemoClaw。NemoClaw是英偉達為OpenClaw Agent平臺提供的企業(yè)級運行與管理軟件棧,可理解為OpenClaw的企業(yè)版運行環(huán)境。

第四,太空計算計劃。英偉達計劃將AI計算能力從地面數(shù)據(jù)中心延伸到軌道空間。通過將數(shù)據(jù)中心級計算能力部署到體積、重量和功耗受限的航天環(huán)境中,英偉達希望支持軌道數(shù)據(jù)中心、地理空間情報處理以及自主航天任務等新型應用。

第五,全新物理AI數(shù)據(jù)藍圖——NVIDIA Physical AI Data Factory Blueprint。這是一種開放參考架構,可統(tǒng)一并自動化訓練數(shù)據(jù)的生成、增強與評估,從而降低大規(guī)模訓練物理AI系統(tǒng)的成本、時間和復雜性。

「甲子光年」注意到,在今天演講中,除了“AI”一詞之外,黃仁勛說得最多的詞就是“token”:“token是新的商品”“英偉達的token成本是世界級的,無人能及”……甚至他舉起雙拳說:“古有美猴王,今有Token王。

從前段時間黃仁勛發(fā)布“AI是一塊五層蛋糕(AI is a five-layer cake)”理論到今天GTC上的發(fā)布,可以看出,黃仁勛想要擺脫芯片公司的標簽,把英偉達打造成一家AI基礎設施公司。在他眼中,AI就是“人類歷史上規(guī)模最大的基礎設施建設”。


演講現(xiàn)場,圖片來源:「甲子光年」拍攝

1.揭秘Vera Rubin

去年GTC,黃仁勛就提到了Vera Rubin平臺;今年GTC,黃仁勛揭秘了Vera Rubin平臺的詳細構成。

“Vera Rubin是一次跨時代的飛躍,它是由7款突破性芯片、5種機架組成的一臺巨型超級計算機,旨在為AI的每一個階段提供動力,”黃仁勛說,“隨著Vera Rubin的推出,Agentic AI的拐點已經(jīng)到來,也將引發(fā)史上規(guī)模最大的基礎設施建設浪潮。”

其中,7款芯片指的是:

  • NVIDIA Vera CPU

  • NVIDIA Rubin GPU

  • NVIDIA NVLink 6 交換機

  • NVIDIA ConnectX-9 SuperNIC

  • NVIDIA BlueField-4 DPU

  • NVIDIA Spectrum-6 以太網(wǎng)交換機

  • NVIDIA Groq 3 LPU

5種機架指的是:

  • Vera Rubin NVL72 GPU機架

  • Vera CPU機架

  • NVIDIA Groq 3 LPX推理加速器機架

  • NVIDIA BlueField-4 STX存儲機架

  • NVIDIA Spectrum-6 SPX 以太網(wǎng)機架


黃仁勛發(fā)布NVIDIA Vera Rubin,圖片來源:「甲子光年」拍攝

在這7款芯片中,最受關注的是此次新發(fā)布的Vera CPU和Groq 3 LPU。

Vera CPU是全球首款為agentic AI和強化學習專門打造的處理器,在效率上達到傳統(tǒng)機架級CPU的兩倍,并且速度提高了50%。目前Vera CPU已進入全面量產(chǎn),并將于今年下半年向合作伙伴提供。

Vera CPU的發(fā)布意味著傳統(tǒng)CPU的設計路徑正在被AI重新定義。

過去,游戲CPU追求單核性能,云CPU強調(diào)多核并發(fā),移動設備的CPU則優(yōu)先能效,而三者往往難以兼得。但AI工作負載同時要求高并發(fā)、低延遲和高能效,使得CPU必須在“多核、單核性能與能效”三者之間實現(xiàn)平衡。

這也就是說,AI需要一款全新的CPU,它不再沿用傳統(tǒng)CPU的單一優(yōu)化邏輯,而是面向AI工廠,成為一個融合多核擴展性、單線程性能和能效的系統(tǒng)級調(diào)度中樞。

Vera CPU的創(chuàng)新之處在于與GPU和網(wǎng)絡架構的深度協(xié)同。在Vera Rubin 平臺中,CPU、GPU、DPU和高速網(wǎng)絡被設計為一個整體系統(tǒng)。通過高速互聯(lián)和統(tǒng)一的數(shù)據(jù)流管理,Vera CPU可以更高效地協(xié)調(diào)AI推理請求、模型加載以及大規(guī)模Agent任務的執(zhí)行,從而提升整個AI工廠的吞吐效率和資源利用率。

從已披露的規(guī)格來看,Vera CPU采用88核設計,支持高達1.5TB內(nèi)存與1.2TB/s帶寬,并通過 NVLink實現(xiàn)與GPU之間高達1.8GB/s的互聯(lián)。這種帶寬和互聯(lián)能力,使CPU首次成為AI系統(tǒng)中的核心數(shù)據(jù)調(diào)度節(jié)點,而不再只是外圍控制單元。

“Vera CPU專為極高的單線程性能、極高的數(shù)據(jù)輸出能力、卓越的數(shù)據(jù)處理能力和極致的能效而設計。它是全球唯一一款數(shù)據(jù)中心專用中央處理器。”黃仁勛說。

而在本次GTC開幕前夕,就有媒體爆料英偉達將帶來一款“世界從未見過的芯片”

答案也很快揭曉——Groq 3 LPU,這是一款專門用于大語言模型推理的處理器。

在大模型推理過程中,通常可以拆分為兩個階段:一是Prefill(預填充)階段,即在輸入prompt后進行大規(guī)模矩陣計算;二是Decode(解碼)階段,模型按token逐步生成輸出內(nèi)容。GPU在前一個階段中具備顯著優(yōu)勢,但在后一個階段中,由于生成過程具有強順序性、對延遲高度敏感,且難以形成高效并行,往往導致算力利用率下降。

Groq 3 LPU就是專門為解碼階段優(yōu)化。在Vera Rubin平臺中,Groq 3 LPU會與GPU協(xié)同工作。

從硬件指標來看,Groq 3 LPU采用約500MB片上SRAM,并提供高達150TB/s的片上帶寬,遠高于傳統(tǒng)依賴外部HBM內(nèi)存的GPU架構,從而顯著降低數(shù)據(jù)訪問延遲。同時,其FP8算力達到約1.2 PFLOPs,晶體管規(guī)模達980億,體現(xiàn)出較強的計算能力與集成度。


Rubin GPU與Groq 3 LPU,圖片來源:「甲子光年」拍攝

相比單純追求算力規(guī)模,Groq 3 LPU更強調(diào)通過大容量片上存儲與超高帶寬的數(shù)據(jù)流架構,將數(shù)據(jù)“留在芯片內(nèi)”高速流動,從根本上優(yōu)化大模型推理過程中最關鍵的延遲瓶頸。

Groq此前是一家獨立的公司,成立于2016年,長期專注于AI推理基礎設施,除了LPU之外,也自建了GroqCloud推理平臺。2025年12月,英偉達與Groq達成一項非獨家推理技術授權協(xié)議,吸納部分核心成員加入英偉達,以推進相關技術規(guī)模化。

英偉達引入Groq并推出Groq 3 LPU,本質(zhì)上是為了補齊其在“推理時代”的關鍵短板。隨著 AI 從訓練轉向推理,尤其是Agent AI的興起,低延遲token生成成為核心瓶頸。英偉達構建GPU+LPU的異構推理體系,本質(zhì)上是在從“訓練芯片公司”升級為“推理基礎設施公司”。

而在5種機架中,Vera Rubin NVL72機架的發(fā)布吸引了廣泛關注。

黃仁勛將Vera Rubin NVL72明確定位為新一代“AI工廠核心單元”。這一系統(tǒng)以機架為單位,集成72個Rubin GPU與36個Vera CPU,并通過NVLink 6、高速網(wǎng)絡與DPU構建統(tǒng)一計算架構,實現(xiàn)計算、存儲與數(shù)據(jù)流的深度耦合。

本質(zhì)上,NVL72已不再是傳統(tǒng)服務器,而是一臺面向AI全流程的“整機級超級計算機”。


Vera Rubin NVL72,圖片來源:「甲子光年」拍攝

Vera Rubin NVL72單機可提供高達3600 PFLOPS推理性能,并通過NVLink 6實現(xiàn)260TB/s的機架級互聯(lián)帶寬,顯著降低跨GPU通信瓶頸。 同時,HBM4內(nèi)存容量與帶寬大幅提升,使其能夠支持更大上下文和更復雜的Agent推理任務。相比上一代架構,整體推理性能提升數(shù)倍,token成本也顯著下降。


黃仁勛介紹NVIDIA Vera Rubin NVL72,圖片來源:GTC 2026

而Vera CPU機架則是一個為AgenticAI和強化學習任務設計的CPU機架系統(tǒng),單機架包含 256個Vera CPU、400TB內(nèi)存、300TB/s LPDDR5x 帶寬,以及64個BlueField-4 DPU。

通過與Spectrum-X以太網(wǎng)網(wǎng)絡深度集成,Vera CPU機架可以在AI工廠內(nèi)部實現(xiàn)多節(jié)點環(huán)境的高效同步,使強化學習與Agent系統(tǒng)能夠在大規(guī)模分布式環(huán)境中穩(wěn)定運行。

官方數(shù)據(jù)顯示,相比傳統(tǒng)數(shù)據(jù)中心CPU,該系統(tǒng)在性能與能效上實現(xiàn)約2倍效率提升和50%性能提升。這一架構不僅為大規(guī)模Agentic AI 提供了基礎支撐,也標志著CPU在AI數(shù)據(jù)中心中的角色,從通用計算單元轉向“環(huán)境生成與調(diào)度引擎”。

英偉達還同步推出Groq 3 LPX推理加速器機架,專門面向大模型推理階段的低延遲需求。該機架集成了256個LPU處理器,提供高達128GB片上SRAM和640TB/s機架級帶寬。在這一架構中,大量LPU被組織為一個統(tǒng)一的“邏輯處理器”,以確定性數(shù)據(jù)流方式執(zhí)行推理任務,使token生成過程具備更高吞吐與更低延遲。


NVIDIA Groq 3 LPX,圖片來源:「甲子光年」拍攝

這釋放出一個更加清晰的信號:在英偉達的設想里,未來的計算單元,將不只是GPU機架,而會出現(xiàn)GPU機架、CPU 機架、LPU機架、存儲機架、網(wǎng)絡機架等分工更細的模塊化組合。

黃仁勛表示,Vera Rubin的發(fā)布代表著計算能力在10年內(nèi)提升了4000萬倍。至于交付情況,他提到Grace Blackwell當初因為NVLink 72的整合,早期送樣很復雜,“但Vera Rubin的送樣進展非常順利”。“

事實上,微軟的CEO薩提亞·納德拉(Satya Nadella)應該已經(jīng)對外公布了,第一臺Vera Rubin已在微軟Azure上點亮運行了。”黃仁勛說。


NVIDIA Vera Rubin,圖片來源:GTC 2026

「甲子光年」認為,Vera Rubin標志著AI計算從單一芯片競爭,邁向以整機系統(tǒng)為核心的“AI 工廠級基礎設施”時代。

2.建設AI工廠,成為token王

AI工廠是英偉達近兩年一直在強調(diào)的概念。

AI工廠本質(zhì)上就是把數(shù)據(jù)中心重新定義成“智能產(chǎn)線”:輸入是電力、數(shù)據(jù)、模型和調(diào)度系統(tǒng),輸出則是 token、智能體執(zhí)行能力和行業(yè)場景中的實際生產(chǎn)率。

圍繞這一概念,英偉達發(fā)布了下一代AI工廠參考設計Vera Rubin DSX,這一參考設計覆蓋計算、網(wǎng)絡、存儲、電力和冷卻等整個基礎設施棧,并通過軟硬件協(xié)同設計,實現(xiàn)更高的token 產(chǎn)出效率和能源利用率。

同時,英偉達還推出 Omniverse DSX Blueprint,利用數(shù)字孿生技術對AI工廠進行高精度建模與仿真,使開發(fā)者能夠在實際建設前模擬數(shù)據(jù)中心運行、優(yōu)化性能并降低部署風險。通過這一架構,英偉達希望將AI數(shù)據(jù)中心從傳統(tǒng)IT設施升級為“生產(chǎn)智能token的工廠”。


Vera Rubin DSX,圖片來源:「甲子光年」拍攝

黃仁勛在演講中稱:“英偉達正在從一家芯片公司,轉向一家AI工廠公司、AI 基礎設施公司。”


黃仁勛談AI工廠,圖片來源:「甲子光年」拍攝

在黃仁勛看來,AI時代真正重要的是誰能把整套系統(tǒng)做得更好,讓AI工廠以更低成本持續(xù)運行。這樣看,Rubin的意義也就不只是Blackwell的下一代,英偉達想借此定義AI工廠這套新基礎設施。

黃仁勛提出了一套更鮮明的觀點AI工廠是AI時代的工業(yè)基礎設施,推理是核心負載,Token 是新的商品,算力就是收入。這意味著,未來的數(shù)據(jù)中心不再只是堆放服務器的機房,而是生產(chǎn)智能的工廠。衡量這座工廠效率的關鍵,不只是算力有多強,而是能以多高效率、多少成本持續(xù)產(chǎn)出Token。

在今天的演講中,黃仁勛反復強調(diào)token成本,并援引SemiAnalysis的測算稱,英偉達目前在這一指標上處于世界領先位置。他還半開玩笑地說,過去大家講“美猴王(Monkey King)”,現(xiàn)在更值得爭奪的是Token王(Token King。他稱:“我們的token成本是全球最低的。”暗示英偉達是當之無愧的“Token王”。


黃仁勛表示英偉達Token成本全球最低,揮手示意為“Token King”,圖片來源:GTC 2026

黃仁勛強調(diào),相較上一代GPU Blackwell,Rubin將帶來更大的商業(yè)空間,并有望釋放高達1500億美元的收入。


黃仁勛展示Rubin與Blackwell收入對比,圖片來源:「甲子光年」拍攝

黃仁勛以一座1吉瓦級AI數(shù)據(jù)中心為例,將算力按免費、中端、高端和旗艦服務分層,各占25%,強調(diào)不同token服務對應不同商業(yè)價值,并以此說明AI工廠的收入結構正在發(fā)生變化。

他指出,隨著架構升級,單位功耗可產(chǎn)生的token數(shù)量持續(xù)提升,而token成本不斷下降,從而顯著放大整體收入空間。

在這一框架下,Blackwell相比Hopper在吞吐與效率上的提升,已帶來顯著的收入能力增長,而Vera Rubin平臺在此基礎上進一步提升系統(tǒng)級性能,使AI工廠的商業(yè)模型繼續(xù)向高密度、高效率演進。與此同時,通過引入GPU與LPU的異構架構,對推理流程進行分工優(yōu)化,還可以進一步提升低延遲場景下的token產(chǎn)出效率,從而釋放更高價值的應用收入。

他建議用戶“盡快遷移到Vera Rubin”,因為token成本持續(xù)下降的同時吞吐量還在上升。如果進一步將25%的數(shù)據(jù)中心配備Groq用于高速編程類token生成,收入還能進一步提升。


NVIDIA Rubin NVL72與Blackwell NVL72推理速度及效率對比,圖片來源:「甲子光年」拍攝

“但要真正爆發(fā),吞吐量和單token成本還需要持續(xù)優(yōu)化。”Eigen AI聯(lián)合創(chuàng)始人金帝在GTC現(xiàn)場告訴「甲子光年」。

在主題演講中,黃仁勛展示了各推理服務商在Kimi K2.5 Reasoning模型上的輸出速度排名中,其中Eigen AI以439 tokens/s位列第一。“我們是一家專注于高性能、低成本的大模型訓練與推理的全棧基礎設施公司,感到很幸運黃仁勛Cue到了。”金帝說。


截至2026年3月14日全球領先的推理服務商,左一為Eigen AI。圖片來源:「甲子光年」拍攝

從商業(yè)視角看,這意味著英偉達的天花板正在被重新打開。一旦機架成為產(chǎn)品單位,英偉達可售賣的就不只是芯片本身,還包括整機、網(wǎng)絡、存儲、軟件棧、調(diào)度框架,乃至AI工廠的設計藍圖。對于黃仁勛來說,這比賣一代又一代GPU的故事,要大得多。

在GTC現(xiàn)場,GMI Cloud創(chuàng)始人&CEO Alex Yeh告訴「甲子光年」:“我們會開始買Vera Rubin平臺的硬件來在各國開展sovereign AI(主權AI)的AI數(shù)據(jù)中心建設。”

3.每家公司都該有自己的OpenClaw策略

黃仁勛在介紹Vera Rubin、AI工廠時,經(jīng)常提到的一個詞是Agentic AI。

OpenClaw(龍蝦)在硅谷熱度不減,GTC現(xiàn)場經(jīng)常能看到頭戴龍蝦裝飾的觀眾,甚至黃仁勛的Keynote頁面上還引用了國內(nèi)社交媒體上流傳很廣的一張“龍蝦主題”線下聚會圖。

就在黃仁勛演講開始前,OpenClaw創(chuàng)始人彼得·斯坦伯格(Peter Steinberger)出現(xiàn)在了GTC的場外直播中。他表示,Agent已經(jīng)徹底改變了他的日常工作方式:那些無聊的重復性任務現(xiàn)在全由Agent搞定,他自己已經(jīng)不怎么寫代碼了,更多時間花在思考架構和方向上。


彼得·斯坦伯格做客GTC現(xiàn)場直播節(jié)目,圖片來源:「甲子光年」拍攝

“現(xiàn)在最大的挑戰(zhàn)反而是‘不’,因為東西太容易實現(xiàn)了,一句prompt就能做出來,但你還是得想清楚到底要往哪走。”斯坦伯格分享,他的Agent甚至能自動把郵件、issue tracker和各種討論線索關聯(lián)起來,讓他一眼看到該做什么,然后只專注在真正有意思的事情上。

而在演講中,黃仁勛花了很長時間分享OpenClaw的作用及價值,他對OpenClaw評價極高:“OpenClaw是人類歷史上排名第一,也是最受歡迎的開源項目。”他認為,OpenClaw的意義“就像當年的Linux、HTML和Kubernetes”,甚至稱它在短短幾周內(nèi)做到的事,“超過了Linux 30年做到的事”。

黃仁勛認為,OpenClaw不只是一個agent,而更像是“Agentic Computer的操作系統(tǒng)”:它能連接大模型、調(diào)用工具、訪問文件系統(tǒng)、執(zhí)行任務調(diào)度、拆解復雜問題,還能調(diào)用子代理,通過多模態(tài)方式與人交互。

由此,黃仁勛拋出一個判斷:“現(xiàn)在,每一家軟件公司、每一家技術公司,都必須有自己的OpenClaw策略和Agent策略。


“推理的拐點到來”,圖片來源:「甲子光年」拍攝

但他隨即強調(diào),Agentic AI一旦進入企業(yè)網(wǎng)絡,也會帶來全新的安全問題——它可以接觸敏感信息、執(zhí)行代碼、并對外通信。

為了解決這方面的問題,英偉達推出了NemoClaw。這并不是英偉達版的OpenClaw,而是英偉達為OpenClaw提供的企業(yè)級運行與管理軟件棧。

通過NemoClaw,開發(fā)者可以安裝NVIDIA Nemotron開源模型和OpenShell運行環(huán)境,為AI Agent提供安全隔離的執(zhí)行環(huán)境,并加入數(shù)據(jù)隱私、網(wǎng)絡訪問和策略控制等安全機制,使長期運行的AI Agent更加可靠和可擴展。

NemoClaw可以在任何專用平臺上運行,包括配備NVIDIA GeForce RTX的臺式機和筆記本電腦或配備NVIDIA RTX PRO的工作站,以及NVIDIA DGX Station和 NVIDIA DGX Spark人工智能超級計算機。它可為自主化Agent提供本地計算,使其能夠全天候運行。


NemoClaw,圖片來源:「甲子光年」拍攝

“知識型工作的苦活正在被徹底轉移,有些公司已經(jīng)完全理解了這一點,但有些還沒有意識到我們能做到的和實際做到的之間,差距是驚人的。”斯坦伯格描述了他作為開發(fā)者的切身體會。

圍繞這一點,黃仁勛進一步判斷:“未來每一家SaaS公司都會成為AaaS(Agentic as a Service)公司。”在他看來,軟件公司未來賣的不再只是工具,而是能執(zhí)行任務的“數(shù)字員工”或“專業(yè)Agent”;工程師除了工資,甚至還會擁有自己的token預算,而這些token,則將由各家的AI工廠持續(xù)生產(chǎn)。

果殼CEO、未來光錐前沿科技基金創(chuàng)始合伙人姬十三聽完黃仁勛演講后也對此感觸很深:“我這幾天在硅谷聊下來,發(fā)現(xiàn)OpenClaw生態(tài)已經(jīng)繁榮,有人做專屬硬件,有人做更好的OpenClaw,有人做垂直行業(yè)版。2026年應該妥妥是Agent元年了。”

而英偉達的合作伙伴也做好了準備,作為首批與英偉達Dynamo合作并支持OpenShell運行時的云提供商之一,GMI Cloud的創(chuàng)始人&CEO Alex Yeh告訴「甲子光年」,GMI Cloud正在為NemoClaw提供基礎設施服務。

4.奔向太空,走進物理世界

這次黃仁勛的主題演講中還有兩個值得關注的發(fā)布。

太空計算計劃。英偉達計劃將AI計算能力從地面數(shù)據(jù)中心延伸到軌道空間。通過將數(shù)據(jù)中心級計算能力部署到體積、重量和功耗受限的航天環(huán)境中,英偉達希望支持軌道數(shù)據(jù)中心、地理空間情報處理以及自主航天任務等新型應用。

例如,新的Space-1 Vera Rubin Module可在太空環(huán)境中提供高性能AI推理能力,這一專為太空環(huán)境設計的AI計算模塊,搭載新一代Rubin GPU,其AI推理性能比H100高出25倍,支持在軌道上運行大型語言模型和實時數(shù)據(jù)處理。而IGX Thor和Jetson Orin平臺則為衛(wèi)星和航天器提供實時AI處理與邊緣計算能力。

通過這些技術,AI可以在數(shù)據(jù)產(chǎn)生的地方——包括衛(wèi)星、軌道設施和航天器上,直接進行分析和決策,從而減少數(shù)據(jù)回傳延遲,并推動太空基礎設施向“智能化、自主化”演進。


NVIDIA Space-1 Vera Rubin Module發(fā)布,圖片來源:GTC 2026

另外就是全新物理AI數(shù)據(jù)藍圖——NVIDIA Physical AI Data Factory Blueprint。這是一種開放參考架構,可統(tǒng)一并自動化訓練數(shù)據(jù)的生成、增強與評估,從而降低大規(guī)模訓練物理AI系統(tǒng)的成本、時間和復雜性。

通過該架構,開發(fā)者可以利用NVIDIA Cosmos開放世界基礎模型和編碼Agent,將有限的真實數(shù)據(jù)擴展為大規(guī)模、多樣化的數(shù)據(jù)集,并生成現(xiàn)實中難以采集的極端或長尾場景,從而大幅降低訓練物理AI系統(tǒng)的成本與復雜度。該藍圖還將與云平臺結合,把大規(guī)模計算資源轉化為高效的數(shù)據(jù)生產(chǎn)引擎,幫助機器人、自動駕駛和視覺 AI 應用更快迭代與部署。

圍繞機器人,英偉達形成了完整的三層計算體系:用于訓練的計算機、用于合成數(shù)據(jù)和仿真的計算機,以及部署在機器人本體內(nèi)部的計算機;同時配套 Isaac Lab、Newton、Cosmos、GR00T等軟件和模型棧。黃仁勛反復強調(diào),真實世界過于復雜,“我們需要從AI和仿真中獲得新的數(shù)據(jù)”,單靠真機數(shù)據(jù)永遠不夠。


黃仁勛與機器人同臺,圖片來源:「甲子光年」拍攝

在自動駕駛和機器人部分,黃仁勛表示:“自動駕駛迎來了ChatGPT 時刻。”英偉達宣布新增比亞迪、現(xiàn)代、日產(chǎn)、吉利等車企加入RoboTaxi Ready平臺,并與ABB、Universal-Robots、Kuka、Caterpillar、Foxconn、Disney Research等公司合作,把物理AI推向制造、物流、自動駕駛和娛樂等更具體的現(xiàn)實場景。


黃仁勛宣布新增比亞迪等車企加入RoboTaxi Ready Platform,圖片來源:GTC 2026

在演講的壓軸環(huán)節(jié),黃仁勛請出了一位特別嘉賓——由英偉達、迪士尼、谷歌DeepMind聯(lián)合打造的《冰雪奇緣》雪寶(Olaf)機器人。


雪寶機器人亮相GTC,圖片來源:GTC 2026

這個可愛的角色機器人能夠自主行走,還能與黃仁勛俏皮互動。雪寶通過NVIDIA Newton物理引擎在Omniverse中以深度強化學習訓練而成,黃仁勛開玩笑說:“你的電腦是我給的——Jetson,就在你肚子里。”他還暢想未來迪士尼樂園里各種角色機器人自由漫步的場景。

最后,黃仁勛放了一部機器人唱歌、演奏的短片,如釋重負地坐在舞臺上,和雪寶一起享受這場機器人的表演。


黃仁勛和雪寶一起看機器人演出視頻,圖片來源:「甲子光年」拍攝

謝幕時他感慨道:“I still love Disney (我還是最喜歡迪士尼)。”

5.如何看黃仁勛這次演講

每年GTC,整個AI產(chǎn)業(yè)都在等待黃仁勛再一次定義這場技術革命的敘事。

過去兩年,圍繞生成式AI的討論大多集中在模型能力和算力規(guī)模,但最近黃仁勛發(fā)文,給出了一個更系統(tǒng)的框架——AI是一塊“五層蛋糕”(AI is a five-layer cake):從底部的能源,到芯片、AI基礎設施,再到模型與應用,層層疊加,構成一整套新的工業(yè)體系。


五層蛋糕框架,圖片來源:英偉達

這個比喻背后的含義很清晰:AI是一場基礎設施革命。如果說過去的互聯(lián)網(wǎng)時代主要改變的是信息流,那么AI時代改變的則是算力、能源、數(shù)據(jù)中心和軟件系統(tǒng)共同構成的“生產(chǎn)系統(tǒng)”。在這個體系中,GPU只是其中一層,而真正決定產(chǎn)業(yè)規(guī)模的,是整塊蛋糕的協(xié)同生長。

黃仁勛認為,在過去的一年里,AI跨越了一個重要的門檻。模型性能顯著提升,可以大規(guī)模投入使用。推理能力增強,幻覺現(xiàn)象減少,落地應用能力大幅提升。基于AI構建的應用首次開始創(chuàng)造真實的經(jīng)濟價值。

黃仁勛透露,去年GTC DC時他看到的高確信需求和訂單是5000億美元(覆蓋Blackwell和Rubin到2026年),而僅僅一年后,“站在今天這個位置,到2027年我看到的至少是1萬億美元”,而且他確信實際需求會遠高于此。

推動這一增長的核心是推理拐點的到來:AI從能感知、能生成,進化到能推理、能執(zhí)行任務,每一次思考都要消耗推理算力,過去兩年所需的計算量增長了大約一萬倍。

與此同時,英偉達的客戶基礎也在快速擴大,他特別提到Anthropic和MSL(Meta)在過去一年選擇了英偉達平臺,加上多家開源模型廠商的加入,合計占據(jù)全球約三分之一的AI算力。從業(yè)務構成看,60%來自前五大超大規(guī)模云廠商,其中既包括內(nèi)部AI消費(推薦系統(tǒng)、搜索等工作負載正在向大模型遷移),也包括通過英偉達生態(tài)落地的AI原生公司;另外40%則遍布區(qū)域云、主權AI、企業(yè)、工業(yè)、機器人和邊緣計算。黃仁勛強調(diào),“AI的多樣性就是它的韌性,這不是一個單一應用的技術,這是一次根本性的計算平臺遷移。”


黃仁勛展示推理拐點驅(qū)動的增長,圖片來源:「甲子光年」拍攝

今年是CUDA的二十周年,黃仁勛認為,CUDA真正的壁壘在于二十年間積累的數(shù)以億計的GPU裝機量,覆蓋了全球每一家云廠商和幾乎每一個行業(yè)。

龐大的裝機量吸引開發(fā)者,開發(fā)者帶來算法突破,如深度學習等。而突破催生新市場,新市場又進一步擴大裝機量,形成持續(xù)加速的飛輪。

他以六年前發(fā)貨的Ampere GPU為例,稱其云端定價不降反升,原因是CUDA生態(tài)下可運行的應用極其豐富,基礎設施的有效使用壽命遠超預期。英偉達也因此愿意持續(xù)為所有在役GPU更新軟件,每一次優(yōu)化都能惠及數(shù)百萬用戶,不斷壓低計算成本,而更低的成本又反過來刺激新的增長。


CUDA20周年,圖片來源:「甲子光年」拍攝

一直以來,憑借GPU架構和CUDA生態(tài)的壁壘,英偉達締造了AI時代的算力帝國,占據(jù)全球90%的算力市場份額。

但未來呢?

「甲子光年」認為,觀察今年GTC的一個重要視角,是看英偉達如何在這五層結構中守住并繼續(xù)擴展自己的位置。從下一代GPU架構、機架級AI系統(tǒng),到推理時代的數(shù)據(jù)中心設計,再到Agent與物理AI應用,英偉達正在堅定把自己從一家芯片公司,重新定義為AI基礎設施的核心平臺提供者

這是一次必須要做的轉型,也是一次充滿意味的新敘事。

(封面圖來源:GTC 2026)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美媒:俄烏沖突警示日本,中國戰(zhàn)機除殲20外不畏F15J

美媒:俄烏沖突警示日本,中國戰(zhàn)機除殲20外不畏F15J

花寒弦絮
2026-04-18 23:03:44
切記,半夜醒來千萬不要看時間!

切記,半夜醒來千萬不要看時間!

環(huán)球網(wǎng)資訊
2026-04-16 07:56:25
伊朗一仗點醒普京,俄羅斯或不再是世界大國,中國不是第二強?

伊朗一仗點醒普京,俄羅斯或不再是世界大國,中國不是第二強?

阿雹娛樂
2026-04-16 07:46:23
斯洛伐克將支持歐盟的900億對烏援助法案!匈牙利大選連鎖反應

斯洛伐克將支持歐盟的900億對烏援助法案!匈牙利大選連鎖反應

項鵬飛
2026-04-17 19:29:12
邪門!沒見過這樣傷!濃眉把醫(yī)生都整破防了!

邪門!沒見過這樣傷!濃眉把醫(yī)生都整破防了!

柚子說球
2026-04-18 09:12:44
“鬼城”又添一座!房價2萬暴跌到4千,住戶:晚上開燈才可怕!

“鬼城”又添一座!房價2萬暴跌到4千,住戶:晚上開燈才可怕!

貓叔東山再起
2026-04-18 11:10:10
2013年,王石和前妻同框,參加岳父王寧告別儀式,一張罕見的留影

2013年,王石和前妻同框,參加岳父王寧告別儀式,一張罕見的留影

阿廢冷眼觀察所
2026-04-15 13:20:06
簽字蓋章后,西班牙首相離京,登機前叫板特朗普,請中國主持公道

簽字蓋章后,西班牙首相離京,登機前叫板特朗普,請中國主持公道

近史博覽
2026-04-17 12:16:53
阿森納迎來生死戰(zhàn)

阿森納迎來生死戰(zhàn)

王衜曉
2026-04-17 22:11:27
睡前默念這5個字,百歲高僧開示:這是最簡單的“修心聚能”法

睡前默念這5個字,百歲高僧開示:這是最簡單的“修心聚能”法

溫情郵局
2026-03-31 09:34:25
突然暴跌!油價最新消息

突然暴跌!油價最新消息

秦皇島發(fā)布
2026-04-18 12:06:49
正式發(fā)行!2026版人民幣來了!如何兌換?

正式發(fā)行!2026版人民幣來了!如何兌換?

天天紀念幣
2026-04-18 10:04:23
沒油了!姚明老隊友打了20年,賺2.8億,場均1.2分真要退役了

沒油了!姚明老隊友打了20年,賺2.8億,場均1.2分真要退役了

大西體育
2026-04-18 21:58:23
貴州省紀委監(jiān)委案件審理室原主任桂芳被查

貴州省紀委監(jiān)委案件審理室原主任桂芳被查

21世紀經(jīng)濟報道
2026-04-18 16:20:57
特朗普:有望一兩天內(nèi)達成協(xié)議,以色列將獲利極大;伊朗:7項聲明均不屬實

特朗普:有望一兩天內(nèi)達成協(xié)議,以色列將獲利極大;伊朗:7項聲明均不屬實

上觀新聞
2026-04-18 08:28:06
新疆多地遭遇強沙塵暴,數(shù)十米高沙墻撲面而來,“天瞬間就黑了”,多趟列車受影響晚點或停運

新疆多地遭遇強沙塵暴,數(shù)十米高沙墻撲面而來,“天瞬間就黑了”,多趟列車受影響晚點或停運

極目新聞
2026-04-18 11:59:30
創(chuàng)紀錄,日本軍艦臺海逗留14小時!不只是挑釁,真正危險信號來了

創(chuàng)紀錄,日本軍艦臺海逗留14小時!不只是挑釁,真正危險信號來了

老赳說歷史
2026-04-18 22:31:41
搭載40名中國游客大巴在俄羅斯翻車,或因司機打盹兒致車輛失控

搭載40名中國游客大巴在俄羅斯翻車,或因司機打盹兒致車輛失控

紅星新聞
2026-04-18 19:08:29
拉夫羅夫抵京:76歲外交老人的最后一程,世界也到了十字路口

拉夫羅夫抵京:76歲外交老人的最后一程,世界也到了十字路口

通文知史
2026-04-17 18:20:03
下周有一波橫財要接!這3個生肖驚喜不斷,錢包要鼓起來了

下周有一波橫財要接!這3個生肖驚喜不斷,錢包要鼓起來了

毅談生肖
2026-04-18 11:37:22
2026-04-19 00:44:49
甲子光年
甲子光年
中國科技產(chǎn)業(yè)化前沿智庫
3415文章數(shù) 9263關注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領袖發(fā)聲

體育要聞

時隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應潘宏彬去世,拒談喪禮細節(jié)

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

本地
房產(chǎn)
藝術
教育
親子

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

房產(chǎn)要聞

官宣簽約最強城更!海口樓市,突然殺入神秘房企!

藝術要聞

波蘭美女奧拉·卡茲馬雷克,絕美風情讓人驚艷!

教育要聞

成都英才領辦的新學校來了,今年小學招生,明年開初一!

親子要聞

退燒藥怎么用?90%家長都搞錯了

無障礙瀏覽 進入關懷版