網易首頁 > 網易號 > 正文申請入駐

3萬字全文| 黃仁勛 GTC2026 臺北主題演講：智能體時代的算力革命與 AI 工廠

2026-06-02 10:33:30　來源: 圖解金融

上海舉報

分享至

Web3SkyCity.AI

NVIDIA GTC 臺北2026：智能體時代的算力革命與 AI 工廠

在 2026 年6月1號的臺北，英偉達（NVIDIA）創始人兼首席執行官黃仁勛回到了他的家鄉，不僅帶回了他的父母，更帶來了一場重塑全球計算產業的革命性演講。在這一次的 GTC 大會上，黃仁勛正式宣告：人工智能已經跨越了簡單的生成式階段，全面進入“智能體時代”（Agentic AI）。這不僅僅是技術的更迭，更是一場從數據中心到底層架構，再到個人電腦與物理機器人的全棧式范式轉移。

全局摘要和核心觀點

智能工廠：Tokens 開啟的新前沿

臺灣生態系統：從供應鏈到 AI 工廠

實用 AI 與智能體：重塑生產力

智能體計算模型與工具使用

Vera Rubin 與 AI 工廠藍圖

算力經濟：買得越多，賺得越多

Vera CPU：專為智能體打造的“指揮家”

企業級 AI 工具包與 Nemotron 模型

RTX Spark：重塑個人電腦產業

物理 AI 與機器人：Cosmos 3 與 Isaac Groot

總結：邁向下一個飛躍

全局摘要

在本次 GTC Taiwan 主題演講中，NVIDIA 創始人兼首席執行官黃仁勛（Jensen Huang）宣布了 AI 產業的重大轉型——從生成式 AI 邁向智能體 AI（Agentic AI）時代。演講涵蓋了從數據中心到個人電腦的全棧創新，包括新一代 Vera Rubin 架構、首款為智能體設計的 Vera CPU、重構個人電腦的 RTX Spark 平臺，以及面向物理 AI 的 Cosmos 3 模型，強調了臺灣生態系統在這一全球基礎設施建設浪潮中的核心地位。

核心觀點

實用的智能體時代到來
：AI 已經從簡單的問答演變為能夠觀察、推理、規劃并使用工具執行復雜任務的智能體，這將帶來數倍的生產力提升。
算力即營收
：在 AI 工廠時代，每一個生成的 Token 都是利潤單位，單位瓦特的吞吐量直接決定了企業的收入。
Vera Rubin 架構與定制 CPU
：Vera Rubin 是首款專為智能體時代打造的多機架集群超級計算機，而 Vera CPU 則打破了傳統 CPU 為人類設計的邏輯，專注于為智能體提供極低延遲與極高帶寬。
重塑個人電腦 (PC)
：與 Microsoft 合作推出的 RTX Spark 將 PC 轉化為個人 AI 智能體終端，標志著 40 年來計算平臺的首次徹底重塑。
物理 AI 與 Cosmos 3
：通過 Cosmos 3 和 Isaac Groot 平臺，NVIDIA 正在解決物理 AI 數據稀缺的問題，推動通用人形機器人進入現實世界。

智能體：重塑生產力的全新計算范式

黃仁勛在演講開篇便拋出了一個震撼的數據：全球三四千萬名軟件工程師創造了約 3 萬億美元的薪資價值，并帶動了 100 萬億美元的全球產業。而現在，智能體的介入讓這一產出曲線發生了斜率突變。“實用的 AI 已經到來。在 2026 年的頭幾個月，代碼提交量幾乎翻了三倍，這意味著我們用同樣的薪資成本創造了三倍的生產力”。

他詳細定義了“智能體”的結構：它不再是單一的大型語言模型，而是一個由執行框架、工作記憶、長期記憶和工具鏈組成的復雜系統。智能體能夠像人一樣思考、觀察環境、制定計劃并調用各種工具。黃仁勛強調，“未來將會有數量龐大的智能體，世界將不再受限于人口數量，這些智能體將比以往任何時候都更頻繁地使用各類工具”。這種轉變意味著軟件公司不會倒閉，反而會因為智能體對工具的極度渴求而迎來爆發式增長。

算力經濟學：每一瓦電力都是利潤

在黃仁勛的視野中，未來的數據中心不再只是存儲數據的機房，而是“生產智能”的工廠。他提出了一個極具商業洞察的觀點：“算力即營收，算力即利潤。在 AI 工廠里，每一個生成的 Token 都是可以計量的盈利單位”。

這一邏輯徹底改變了數據中心的建設標準。過去，人們關注芯片的單價；而現在，效率和吞吐量才是核心。“如果你擁有一吉瓦的電力，單位瓦特的吞吐量就是你的收入。僅僅因為芯片更便宜而選擇錯誤的架構，是無法轉化為效益的。買得越多，賺得越多”。為了支撐這種高強度的智能生產，英偉達推出了 DSX AI 工廠藍圖，通過數字孿生技術，在破土動工前就完成電力、散熱和網絡部署的模擬。黃仁勛指出，到本十年末，全球將有 100 吉瓦的 AI 工廠上線，而英偉達的目標是確保每一瓦電力都能發揮出最高效的代幣生成能力。

Vera Rubin 與專為智能體打造的 CPU

作為全場關注的焦點，新一代 Vera Rubin 架構正式亮相。黃仁勛強調，這不僅僅是一個圖形處理器（GPU），而是一個專為智能體時代打造的多機架集群超級計算機。“Vera Rubin 是我們公司歷史上最雄心勃勃的壯舉，它是首款專為處理智能體循環而構建的系統”。

為了解決智能體在調用工具時的延遲瓶頸，英偉達推出了具有革命意義的 Vera CPU。黃仁勛直言：“過去所有的 CPU 都是為人類構建的，人類習慣于秒級的響應；但智能體是不耐煩的，它們生活在納秒的世界里”。Vera CPU 采用了全新的 Olympus 內核，擁有世界級的單線程性能和超高的內存帶寬。它不再追求傳統意義上的核心租賃，而是專注于協調 GPU、管理內存緩存以及極速啟動各種 AI 工具。“CPU 現在是指揮家，而 GPU 是管弦樂隊。Vera CPU 的出現，是為了確保智能體的思考和執行過程不被任何環節阻塞”。

RTX Spark：重塑個人電腦的 40 年

在消費電子領域，黃仁勛宣布與微軟深度合作，通過 RTX Spark 平臺重塑個人電腦。“Windows 95 讓 PC 實現了個人化，而 40 年后的今天，我們將徹底重塑 PC 的運作方式”。

RTX Spark 筆記本電腦搭載了集成 20 核 Grace CPU 和 Blackwell GPU 的 SoC 芯片，具備驚人的 AI 算力。黃仁勛演示了一個場景：一個運行在本地的智能體通過簡單的草圖和提示詞，自主在專業建模軟件中完成房屋設計、結構優化并生成渲染圖。“未來的 PC 將不再是點擊和輸入的工具，它會變成一個 24 小時運行的個人助手，它了解你的需求，能夠觀察、協助并為你做研究”。他預言，未來每個家庭可能都會擁有一臺運行各種智能體的 AI 超級計算機，它對人類生活的意義將如同當年的智能手機。

物理 AI：通用機器人的黎明

演講的最后，黃仁勛將目光投向了物理世界。他認為，物理 AI 是目前最具挑戰性的領域，核心困難在于數據的稀缺。“語言模型有互聯網數據，但要讓機器人學會動作，必須從機器人的第一人稱視角獲得數據”。

為此，英偉達發布了 Cosmos 3 物理 AI 基礎模型，它能夠理解物理規律、生成合成視頻并進行閉環仿真。通過“計算即數據”的思路，英偉達正在利用 Omniverse 模擬器大規模生成訓練數據。同時，參考人形機器人 Isaac Groot 的發布，標志著英偉達已經打通了從模型訓練、數據生成到硬件運行的全流程。“人形機器人是 AI 的下一個大飛躍。我們構建了一個開放平臺，讓全世界的研究人員都能在這個基礎上開發屬于自己的機器人”。

結語：一個全新的起點

從臺北出發，黃仁勛向全球科技界展示了一個由智能體驅動的未來。在這個世界里，計算不再是昂貴的支出，而是創造財富的生產線；PC 不再是冷冰冰的機器，而是數字化身的承載者。正如他所言：“計算機行業已經徹底改變了，明年將會更加精彩”。隨著 Vera Rubin 全面投產，智能體時代的大幕已經正式拉開，而英偉達正站在這個新紀元的最前哨。

完整訪談

天空之城全文| NVIDIA GTC 臺北2026：智能體時代的算力革命與 AI 工廠

智能工廠：Tokens 開啟的新前沿

旁白

這就是智能的創造方式。一種全新的工廠。

Tokens 的生成器，即 AI 的構建基塊。Tokens 開辟了新的前沿，將數據轉化為知識、推理和行動。

它們揭示了復雜性中的模式。我們此前從未見過的模式。映射我們的城市以保障我們的安全。

并將我們帶向更高處。

Tokens 助力機器人向我們學習。

與我們并肩工作。

它們去往我們無法企及之地。

并非如此。為我們提供助力，伸出援手。

縮短希望與療愈之間的距離，讓我們能更輕松地呼吸。讓幼小的心靈跳動得更加強勁。Tokens 正在幫助我們開辟新的領域。以一種從未嘗試過的規模。

因此我們能夠抵達 Star Cloud One，分離確認，奔向無限，超越無限。我們共同邁向下一個偉大的飛躍，奔向一個為全人類而構建的光明未來。而這一切，始于 Taipei。

臺灣生態系統：從供應鏈到 AI 工廠

主持人

女士們、先生們，女士們、先生們，歡迎來到 NVIDIA，創始人黃仁勛，有請 NVIDIA 創始人兼首席執行官 Jensen Huang 上臺。

黃仁勛

大家好。歡迎參加 GTC Taiwan。

很高興見到大家。回到家感覺真好。我把我的父母帶回家了。我的父母在哪里？請大家為我的父母鼓掌。

再為我的父母鼓掌。

也為我們的賽前表演嘉賓 Superstars 鼓掌，女士們、先生們。看看他們有多可愛。臺灣的超級巨星們。今天這里有這么多人在場。

我們目前正向其他 70 個觀看派對進行同步轉播，遍布臺灣各地。70 場不同的會議正在同時進行。大家都在觀看這場主題演講。我們有太多的內容要告訴大家，也有太多的合作伙伴需要感謝。我們在臺灣的生態系統發展得如此龐大，簡直令人難以置信。

大多數時候，當人們想到生態系統時，他們想到的是我們的軟件棧，他們想到的是在 Nvidia 構建的計算系統之上的開發者生態系統。但 Nvidia 的生態系統涵蓋了從臺灣所有上游供應鏈——一切的起點，一直到下游的數據中心，最終觸達終端用戶的全過程。今天，我們將討論幾乎所有的生態系統。有太多人需要感謝。我熱愛這里的生態系統。

這里有太多的公司，還有一些我喜愛的生態合作伙伴，以至于我甚至記不清了。抱歉。太多了。太多了。

臺灣豐富的生態系統，這個生態系統。

最豐富的生態系統。最豐富的生態系統。最佳供應鏈生態系統。不可思議。那么，感謝大家今天來到這里。今年，我們的業務正在共同實現令人難以置信的增長。

事實上，昨晚有人告訴臺灣的年度 GDP 增長率將接近 10%。不可思議。不可思議。

實用 AI 與智能體：重塑生產力

好了，我們有很多內容要談。我們開始吧。兩年前，當我在這里時，我開始向大家探討 AI 是如何從生成式 AI 演變，以及即將到來的其他 AI 浪潮。下一波 AI 浪潮是代理式 AI。今天，我們可以說代理式 AI 已經到來，實用的 AI 已經到來。

那么，這意味著什么呢？這是 GitHub。當然，代理式 AI 最早的應用場景之一就是軟件編碼。這是最有價值的職業之一，擁有極其龐大的生態系統。全球有 3000 萬到 4000 萬名專業軟件開發人員，可能還有另外幾億名學生和愛好者等等，但可以說全球有 3000 萬到 4000 萬名軟件開發人員是以編程為生的。而這代表了他們中的大多數。

這是 GitHub。拉取請求（pull request）是指他們下載軟件并進行修改，而提交（commit）則是指他們將其推送回去。

明白嗎？如果觀察一下，2023 年的提交次數是 3 億次。

2024 年是 4 億次，2025 年是 5 億次。提交次數。

在 2026 年的最初幾個月里，這一數字幾乎翻了三倍。

那么，這意味著什么呢？3000 萬名軟件開發人員創造了約 3 萬億美元的 GDP，他們每年獲得的薪資總額為 3 萬億美元，這為其他行業帶來了經濟增長。

可以說，價值 100 萬億美元的全球產業受到了這 3 萬億美元薪資的影響或由其帶動。

那 3 萬億美元，抱歉，那 3 萬億美元的薪資現在創造出的產出幾乎是原來的三倍。

實際上，這相當于用 3 萬億美元的薪資成本創造了 9 萬億美元的生產力。

這有道理嗎？這種差異極其驚人。這就是潛力所在。這就是 AI 的愿景。軟件工程師的人數實際上正在增加。人們談論 AI 會減少就業崗位，這完全是無稽之談。這促使了更多軟件工程師被錄用，原因非常簡單。如果你能雇傭一名軟件工程師并創造出價值 9 萬億美元的生產力成果，你為什么不想雇傭更多的軟件工程師呢？

如果那條曲線是平坦的，那么人們顯然會減少軟件工程師的招聘。但正因為產出如此驚人，人們才想要雇傭更多的軟件工程師。這在不久的將來會以某種方式在我們的經濟中顯現出來。

所以，首先一點是：實用的 AI 已經到來。那么，從行業的角度來看，這意味著什么呢？從行業的角度來看，這意味著 Tokens 現在需求非凡，因為如果你能做到這一點，你就會想要生產更多。并且因為 Tokens 現在是盈利單位。Tokens 現在是創收的盈利單位。因為現在有利可圖，AI 公司想要構建更多的 token，生成更多的 token，建設更多的 AI 工廠，這就是臺灣地區算力需求激增的原因。

這正是你們大家如此忙碌、業務如此興隆的原因。事實上，這在你們的部分股票價格中已經有所體現。算力模式已經改變了。一切都變了。所以第一個觀點是：實用的 AI 已經到來。AI 現在是利潤的創造者。AI 現在是 GDP 的創造者。在這背后，是一種全新的計算模式。不僅僅是大型語言模型，而是智能體。今天，我們要討論的幾乎所有內容都將基于此。

智能體計算模型與工具使用

那么，請允許我花點時間向大家展示我所指的內容。在這里面，這是一個智能體。它是一個智能體應用程序。在過去，這會是應用程序，這會是代碼，而這會是操作系統。應用程序，在應用程序內部運行的代碼，以及在操作系統內部。而今天，它是智能體，由一個或多個大型語言模型構成，它們駐留在一個執行框架內，該框架協助并編排它們去完成生產性工作。這是輸入。

當輸入進入時，它必須進行理解、觀察、推理、行動并使用工具，該工具可以是電子表格、網頁瀏覽器、數據處理引擎或數據庫引擎等。

這是經過編排的，這一執行框架在每次涉及處理上下文、理解正在發生的事情、推斷后續行動、制定可付諸實施的計劃時，都會對信息流向進行編排，這一編排路徑是由某種軟件來控制的。因此，這從根本上就是一個智能體。

它處理被稱為工作記憶的短期記憶，以及長期記憶，就像我們人類一樣，我們也擁有長期記憶。所以內存管理系統極其重要。整個系統被稱為智能體。大語言模型被用來進行思考，而支撐框架則將一切連接在一起，就像操作系統一樣。

明白了嗎？這就是新的計算模型，這就是智能體。它能夠完成不可思議的事情。這就是重大的突破。大語言模型能夠出色地進行思考、推理、規劃和使用工具，再加上我們現在擁有了管理記憶和調度工具的支撐框架，這幾者的融合促成了這一切。我們現在可以完成驚人的事情。

讓我給你們舉幾個例子。這是一個提示詞。這就是那個提示詞。這是生成的代碼。然后就輸出了這個。這是輸入。這是輸入。這就是輸出。大家覺得怎么樣？

非常神奇，我們這里使用的是 cloud code，但 code exit 也表現得非常出色。

這是另一個例子。這是輸入內容。創建一個 GIF，NVIDIA，黑色背景上的綠色散點，形成臺北 101 大樓，變形為 GTC, Taipei, 2026，再變形為 Nvidia I logo，然后散開并循環。你剛才看到了。這就是提示詞。

這是下一個例子。我弄丟了遙控器的電池蓋。它長這樣。創建一個 CAD 文件。它使用一種工具，創建一個 CAD 文件，準備好進行 3D打印，從而創造出一個全新的產品。這合理嗎？

這正是新的計算范式。過去我們習慣啟動應用程序、點擊并輸入，而現在我們取而代之的是向 AI 解釋我們的需求和意圖，由 AI 生成代碼或使用工具，并產出必要的成果。這就是未來計算機的工作方式。這就是 Agentic AI。兩年來，我們一直朝著這個目標努力，現在它已經成為現實。

當然，目前的重大突破之一就是工具使用。很多人都說，Jensen，AI 時代即將來臨，Agentic AI 時代即將來臨。因此，所有的軟件公司都將面臨倒閉。我說過，事實恰恰相反。

因為未來將會有數量龐大的智能體（agent），世界將不再受限于人口數量。

因此，這些智能體將比以往任何時候都更頻繁地使用各類工具。對于軟件公司而言，這實際上是一個不可思議的時代。但軟件必須以智能體能夠使用的方式呈現給它們。這是一個巨大的突破。

事實上，我們需要呈現給智能體的內容。正如你所知，所謂的 Nvidia 寶藏，其實就是我們所有的 CUDA 庫。我稱它們為 CUDA 庫。這就是 Nvidia 的寶藏。今天，我們現在能夠將這些 CUDA-X 庫提供給智能體使用，它們能比人類更有效地運用這些庫。因此，現在是 CUDA-X 庫發展的絕佳時期。

讓我們來看一看。多年前，我們構建了 CUDA，這是一個用于加速計算的單一架構。我們重塑了計算。上千個 CUDA-X 庫正在幫助開發者在科學和工程的各個領域取得突破。CUDA-X 庫是智能體的工具。用于計算光刻技術的 cuLitho。用于決策優化的 cuOpt。

用于直接稀疏求解器的 cuDSS。AIQ 用于對結構化和非結構化文檔進行深度研究。用于 AI-RAN 的 Aerial。用于可微物理的 Warp。

用于基因組學的 Parabricks。它們的基礎是算法。

而且它們很美。我不知道。我不知道。我不知道。我不知道。我不知道。你知道。我要為數學獻上一輪掌聲。

數學是美的。計算模式，軟件的計算模式即將發生改變。事實上，讓我們回到這一點。這就是 Agent。它是終極的解耦與分布式計算模型。為了處理這個 Agent，將有如此多不同的計算機被激活。Agent 由模型、工具鏈、工具與技能，以及運行時組成。

所有這些都在數據中心的不同位置運行。你可以把模型看作大腦。

把驅動框架看作身體，它所使用的工具在運行時環境下工作，就像一個車間。

所以這就像一個人，一名在車間里使用工具的工人。當然，這一切都是在極大規模下完成的。每一個步驟都在計算機的不同部分運行。你可以看到大型語言模型正在思考。處理上下文、觀察、理解環境、推理、制定計劃并執行該計劃。每一次發生這種情況，整整一個機架的 Grace Blackwell NVLink 72 都會被激活。它正在用大型語言模型進行思考。

每當使用一個工具時，都會用到 CPU。該工具可能是 C 編譯器。可能是 Python。也可能是 JavaScript。

亦或是加速計算。當下的智能體是相對簡單的工具使用者。未來，它們將成為非常復雜的工具使用者，這也是我向你們展示的 CUDA-X 庫將會受到智能體極度青睞的原因。它們解決了當今世界所知的最重要的一些問題。

并且我們所有的 CUDA-X 庫現在都將配備 AI 可以學習使用的技能。因此，CUDA-X 庫加上一些技能，基本上就是一本手冊，AI 閱讀后會說，啊，原來是這樣使用的。智能體使用這些庫的能力將是不可思議的。因此，這些工具在 CPU、GPU 和大語言模型上運行。

安全防護層在 CPU 和名為 DPU（即 NVIDIA 的 BlueField）的安全處理器上運行。所有這一切的編排均在 CPU 上運行。這是整個防護架構，而 CPU 負責編排所有工作。最困難的部分之一是內存。

你可以試想一下。工作內存被稱為 KV cache。要記住什么？如何緊湊化（不只是壓縮），以及如何檢索？你是檢索結構化數據嗎？你是檢索非結構化數據嗎？你是將其所有這些不同的數據檢索至其自身嗎？整個處理過程極其復雜。AI 的內存系統將徹底改變現有的存儲系統。

正如你所見，這種計算模型、這種計算模式以及這種被稱為 agent 的新應用的方方面面，都與過去應用程序的運行方式有著本質的區別。大量的軟件駐留在二進制文件中，駐留在操作系統內部。這正是我們構建下一代產品的核心原因：解決這種解構式、分布式、異構化的計算問題。

Vera Rubin 與 AI 工廠藍圖

Vera Rubin 不僅僅是一個芯片。

Vera Rubin 不僅僅是一個 GPU。它始于 GPU，但不僅限于此。但 Vera Rubin 非常驚人。一切始于 GPU。不可思議。整個系統核心是 Vera Rubin。從始至終貫穿全局。

它配備了 GPU、Vera Rubin 和 NVLink，以及 72。

它由我接下來要詳細介紹的 Vera CPU 協同調度。存儲系統實現了革命性的飛躍，Vera 配合 CX9、我們的軟件棧 Doca，以及內置的安全處理器，確保一切數據皆可加密。無論數據處于靜態、傳輸中還是使用中。由于 AI 模型極其珍貴，整個系統的每個環節都受到安全保護。這就是整個系統遵循機密計算的原因。

這些系統中的每一個單獨拿出來，都將是一場徹底的革命。Vera Rubin 是我們公司歷史上最雄心勃勃的壯舉。整個公司致力于在所有 40,000 名工程師中推動 Vera Rubin 項目。更不用說在座的各位了。你們所有人都參與了整個系統的創建。Vera Rubin 確實是一個奇跡，它不僅僅是一艘飛船。而是如此之多。甚至遠不止于此。

很久以前，Nvidia 曾經是一家 GPU 公司。

但多年來，我們已經進化成為一家系統公司。

你們現在看到的正是這一點。這是有史以來設計的最復雜、最底層且最復雜的系統。但歸根結底，我們的客戶和合作伙伴并不想購買計算機。他們想要構建 AI 工廠。這就是 NVIDIA 真正開始再次自我轉型的原因。

你可以看到，我們眾多的技術目前都已達到整個基礎設施的規模。我們的合作伙伴也處于基礎設施規模。發電機、冷卻系統、電網供應商，如此多的工業公司現在都是我們生態系統的一部分，因為歸根結底，我們正試圖構建整個技術棧，就像 GPU 一樣，就像我們在構建 Grace Blackwell NVLink 72 時那樣，也正如現在所做的那樣，我們正在構建一個全棧系統，以便我們的客戶能夠構建出令人驚嘆的 AI 基礎設施。

讓我們來看一下。世界正在競相建設 AI 工廠，這是人類歷史上最大規模的基礎設施建設。AI 工廠在每一個層面都極其復雜。芯片、機架、網絡、電力、散熱、電網，必須進行端到端的協同設計，因為計算即營收。Nvidia DSX 是構建和運營 AI 工廠的藍圖，即一套參考設計。旨在實現最高效率與盈利能力。

這始于 DSX-Sim。借助 DSX-Sim Omniverse Blueprint，合作伙伴可以在安裝第一個機架之前，先行設計并驗證 Nvidia Vera Rubin AI 工廠。他們規劃布局。模擬電力和散熱系統。設計網絡。驗證每一項集成。在數字孿生中測試每一次變更。

工廠啟動。DSXOS 接管預留、運行、監控并修復基礎設施。將已安裝的系統轉化為可信賴的、多租戶的、彈性且具備 AI 就緒能力的算力資源。如今的 AI 工廠電力過度配置高達 40%。DSX Max LPS 讓運營商能在相同的電力預算內安全部署更多的 GPU。從而增加數十億美元的年收入。突破性的 45 攝氏度高溫液冷技術減少了水資源和能源的消耗。讓更多的電力用于產生收入的計算任務。

令人難以置信。動態功率分配可將電力從一個機架引導至另一個機架，回收閑置瓦特，并將其輸送到工作負載所在的位置。機架內電力平滑，能夠消除峰值電流尖峰和電涌。在整個工廠中，AI agent 團隊與 DSX Max LPS 協作，持續協調以平衡冷卻和電力，從而滿足工作負載需求。DSX AI 工廠是靈活的能源資產，能夠與電網協同運作。DSX flex 可以讀取實時電網信號，并在電網需要減壓時動態調整工廠電力。

到本十年末，將有 100 吉瓦的 AI 工廠上線。

NVIDIA DSX AI 工廠以最高效率運行，能夠以最低成本生成 token，并增強電網的穩定性。

我曾向大家展示過過去的生態系統幻燈片，其中 NVIDIA 的計算層、軟件以及計算棧被集成到他人的平臺、第三方平臺和市場服務庫中。那是一個計算生態系統。這是一個 AI 工廠生態系統。這在你們所有人的下游。

我的上游是你們所有人，而我們的下游就是這個生態系統。因為歸根結底，我們不僅是在制造 GPU，也不僅是在構建系統，我們是在幫助客戶建設這些 AI 工廠，即那些極其復雜的 AI 基礎設施。

每一個千兆瓦級別的項目起步成本就是 200 億到 300 億美元。

現在已經達到 500 億到 600 億美元，很快每千兆瓦的成本將達到 800 億甚至 1000 億美元。向一座 AI 工廠投入 1000 億美元。它必須一次運行成功，并且必須立即投入使用。其資本成本高得驚人。其復雜程度也高得驚人。正如你們所見，我們過去是在電腦里設計芯片。后來，我們在電腦里模擬整個系統。而今天，你們剛才所看到的，一切都是在 Omniverse 中構建完成的。我和大家一起使用 Omniverse 已經很長一段時間了。這夢想成真了，使我們能夠在數字框架、數字模擬器以及數字世界中構建這些規模宏大的系統，遠在正式破土動工和投入資金之前即可完成。

這就是我們的生態系統。我們稱之為 DSX。RTX 是針對我們的 GPU。DGX 是針對我們的系統，而現在的 DSX，基本上就是基礎設施。正是因為我們在這里所做的工作，橫跨了整個技術棧，包括我們的系統和軟件，才使得我們能夠與小型公司合作，并助力它們成為世界級的 AI 云服務商。我接下來要向大家展示的每一家公司在不久前都還是小型公司，而現在 CoreWeave 的估值已達到 500 億、600 億、700 億美元，并且還在以驚人的速度增長。最近我們與 Nebius 進行了合作，同樣，他們也正在以驚人的速度增長。這些云服務商每一家都有著令人矚目的客戶。

軟件編程公司 Cursor、Black Mountain Labs、圖像生成公司、World Labs、世界基礎模型、領先的金融服務 AI 公司 Revolut 以及 Shopify。這是又一家公司。這是 N-scale，他們的客戶包括 British Telecom、Google；Google 正在使用我們的其中一個 AI 云，Thinking Machines 是一家 Frontier Labs 旗下的公司，這非常令人興奮。

這是韓國的 Naver Cloud、Bank of Korea、Hyundai，有這么多不可思議的公司。

這是印度的一家公司，Yoda，非常出色的公司。這是一個位于新加坡、在澳大利亞進行建設的項目，還有 Together AI，以及新加坡的項目。這是印度尼西亞的一個項目。這些公司中的每一家，每一家公司，都在服務于區域及全球客戶。AI 將會在各個地方運行。每家公司都將由它驅動。每個地區都將構建它。這是印度尼西亞的 Indosat。這是臺灣的 GMI。

這是臺灣的 GMI。鼓掌是可以的。

所以，這些令人難以置信的公司，有著令人難以置信的機會，但它們都需要幾樣東西。當然，它們需要計算棧。這整個底層的技術棧。這就是讓 NVIDIA 成名的原因。我們所有的硬件、軟件和庫，以及我們與全球第三方開發者生態系統的連接，使得任何人都有可能建立起一個 AI 云。

然而，如今的 AI 云非常復雜。這是軟件版本。這是計算機科學版本。這是財務版本。資產版本就是我之前向你們展示的那樣。這是一個巨大的工廠。僅擁有這種能力是不夠的，這就是 Nvidia 成為一家 AI 基礎設施公司的原因。如今，把這件事做好，并極其擅長幫助客戶構建 AI 工廠并部署 AI 工廠，顯得至關重要。

算力經濟：買得越多，賺得越多

其原因如下。算力即營收。算力即利潤。缺乏營收和利潤即為虧損。因此，必須意識到這就是一個 AI 基礎設施上線的案例，它可能上線得很快，也可能需要一段時間；它的吞吐量可能很高，也可能很低；它的彈性和可靠性可能很好，也可能很差；其有效壽命可能很長，也可能很短。因為這代表了 500 億、600 億，乃至將要達到 1000 億美元的規模，所以這條曲線至關重要，這條曲線影響巨大。

這就是 Nvidia 成為如此出色的合作伙伴的原因。與我們合作，得益于我們全面集成的能力，我們所提供的不僅僅是一份 PowerPoint 演示文檔。我們構建了完整的底層基礎設施。我們將一切連接在一起。我們親手打造了數十億計的組件，以確保一切運作良好。因此，我們的首字延遲、首次推理時間以及訓練啟動時間都大幅縮短。

其次，得益于我們世界領先的單位瓦特吞吐量及單位瓦特 Token 處理能力。其原因在于我們將所有環節進行集成，從底層開始全面設計，對整個系統進行仿真，并采用了極致的協同設計。正如我剛才向大家展示的 Vera Ruben Rack 一樣，一切設計旨在實現這種卓越的吞吐量。如果你的數據中心或工廠擁有 1 吉瓦的電力，它不會再有更多。1 吉瓦就是 1 吉瓦。你所能完成的發電量就只有這些了。

如果你擁有一吉瓦的電力，那么單位瓦特的吞吐量就是收入。

因為每一個 Token 都是盈利的。每一個 Token 都是收入。這就是未來。算力即收入。單位瓦特的性能就是你的收入。僅僅因為芯片更便宜而選擇錯誤的架構，是無法轉化為實際效益的。這在邏輯上是不通的。你需要確保你的單位瓦特收入是多少？

買得越多，賺得越多。

那么，是以什么為單位的 Token？那么，是以什么為單位的 Token？

最后，非常輕松地，第二，第三點是可靠性。如果你有機會參觀這些數據中心，你會發現那里有無數的運動部件和數以百萬計的線纜。讓所有這些計算機和諧協同工作的能力，其可靠性極低。這極其困難。我們進行超大規模運營已經有很長一段時間了。這種經驗至關重要。這就是差異所在。意思是，中斷之間的間隔時間，這極其重要。

最后一點，這非常困難。

這些系統的生命周期，這些系統的生命周期，軟件一直在不斷變化。四年前，也就是在 Hopper 的時代，AI 已經徹底改變了。六年前，這是 Ampere 的時間框架。AI 已經徹底改變了。我們起初談論的是 CNN。而現在我們處于這個階段。接著我們談論了 transformers。然后我們談論了 mixture of experts。現在我們談論的是 agentic systems。每一個世代，每隔幾個月，軟件行業就會涌現出新技術。如果你的架構缺乏靈活性，如果你的生態系統不夠豐富，那么這條曲線就不可能長久。你無法預測你的系統能持續多久。

但我可以。Nvidia 系統遍布世界各地。軟件開發者從 Nvidia CUDA 開始。因此，根據定義，其生命周期、生態系統以及有用資產的存續時間都會長得多。其區別本質上在于成本。你可以將其視為收入，但收入的另一面是成本。如果資產的生命周期不長。那么總擁有成本（TCO）就很低。這就是區別所在。這就是算力呈現出的樣子。買得越多，賺得越多。

賺得越多。

現在，你們所有人都正在與我一同經歷這一切。難道不是嗎？你們所有的需求。你們的工廠正在全力運轉。你們的人民在整個臺灣地區都在努力工作，因為每個人都想賺錢。他們意識到 AI，即實用的 AI，已經到來。盈利的 AI 已經到來。算力。需求高得驚人。而算力需求正是制約因素。

因此，讓我們加倍努力，助力全球構建 AI。

各地的工廠。這就是為什么它如此重要。我感到非常高興。我正站在你們面前。

Vera Rubin 正處于全面生產階段。

Vera Rubin 正處于全面生產階段。我們為 Vera Rubin 創建的供應鏈規模是 Grace Blackwell 的兩倍。沒錯，這太不可思議了。過去組裝一個 Grace Blackwell 機架需要兩個小時，現在只需要五分鐘。因此，不僅容量更高，吞吐量也快得多，我們需要這一切來滿足需求。這個生態系統非同尋常，數百萬平方英尺的設施已經上線以支持 Grace Blackwell，目前正在為 Vera Rubin 進行籌備和擴產。我想感謝你們所有人。Vera Rubin 現已全面投產。

謝謝。

讓我們來看一下。大語言模型負責生成答案。現在 AI 智能體可以執行工作了。但處理智能體化 AI 是一個完全不同的問題。智能體通過觀察、推理、規劃并使用工具來運作。它們管理著海量的上下文，并在工作記憶與長期記憶之間進行調度。它們啟動子智能體，即按需調用的專家。

NVIDIA Vera Rubin 是一款多機架集群規模的系統，專為處理智能體 AI 而構建，現已全面投入生產。貫穿整個供應鏈的制造、自動化和編排，這堪稱見證了一個奇跡。我們的征程始于推出首款 AI 超級計算機 NVIDIA DGX-1。在接下來的十年里，我們將每一款芯片和系統都推向了極限，從 Pascal 和首款 NVLink，到 Grace Blackwell，再到首款機架級 AI 超級計算機。

而現在，Vera Rubin 來了，這是首款專為智能體時代打造的多機架集群規模超級計算機。一切始于 TSMC。構成 Vera Rubin 的 7 款新芯片通過數百道工藝步驟逐步成型。3 納米工藝、CoWoS-R 和 CoWoS-L 封裝、HBM 格式。來自 Micron、SK Hynix 和 Samsung。Vera Rubin 計算板。單塊主板集成了 6 萬億個晶體管和超過 18,000 個組件。

Vera Rubin NVL-72 負責思考、提示詞與上下文理解、推理及規劃。接下來是一款全新的模塊化計算機，采用了全新的 PCB 中板設計、超級芯片、Connect X9 SuperNix 以及 Bluefield 4 DPU，所有組件均原位組裝且無電纜連接，以實現 AI 工廠規模下的高可靠性。包含 18 個計算托盤、9 個可熱插拔的 NVLink 交換機托盤、新型高效歧管及液冷母線，承載電流超過 5000 安培，相當于 20 輛全速加速的電動汽車。總計 130 萬個組件構成了這一第三代 MGX 機架設計。

祝賀 Microsoft 成功部署其 Vera Rubin NVL-72 工程機架。同時也祝賀 Dell 和 CoreWeave 成功建立各自的 Vera Rubin NVL-72 工程機架。隨后是 Vera CPU 機架，在單個液冷機架中容納 256 個 CPU，負責編排模型、調度內存以及啟動工具。

在 Foxconn 和 Quanta，GB200 NVL72 正在成型。16 個托盤中集成了 256 個 GB200 LPU，提供每秒 40 PB 的 SRAM 帶寬以實現超低延遲。當 NVL-72 以最高吞吐量生成 Token 時，GB200 NVL72 則以最低延遲完成生成。Vera Bluefield 4 STX，AI 的記憶存儲之地。

由 Bluefield 4 加速的存儲處理，連接了內存、存儲和芯片內安全技術。

以及 NVIDIA Spectrum X Ethernet Photics。這是全球首款采用 200 千兆位共封裝光學的以太網交換機，融合了 TSMC 的 COUPE 工藝、芯片級封裝，以及磷化銦上的超高功率激光染料技術。Vera Rubin 5 連接的機架級系統，這是一款專為 AI Agent 打造的超級計算機，涵蓋了臺灣 150 家供應鏈合作伙伴，數百萬平方英尺的工廠車間，數百個站點，以及將芯片、封裝、系統和數據中心推向尺寸、功耗和規模極限的工程成果。這就是我們所謂的極限代碼設計。

我們與臺灣共同完成了這一切。我們攜手重塑了 AI 時代的計算。臺灣從一開始就與我們同行。今天，當我們向世界推出 Vera Rubin 時，依然如此。謝謝你，臺灣。

女士們，先生們，Vera Rubin。Vera Rubin 不僅僅是為了 AI 而生。

AI。Vera Rubin 并非僅僅為了運行 AI 而構建。Vera Rubin 是為了運行智能體而構建的。這是一個智能體系統。想象一下其復雜程度。這就是為什么智能體是計算機科學的最后一次重大突破。智能體歷經多年才得以實現其潛力并發揮作用。因此，運行它的計算機是世界上最先進的，這合情合理。這就是 Vera Rubin。讓我們來看一下。可以請 Vera Rubin 上臺嗎？

謝謝。Janine，我們有那些機架和系統了嗎？

看起來很重。這是 Vera Rubin。Vera Rubin NVLink 72。這是 GB200 LPU。在下一屆 GTC 上，我將和大家分享更多相關內容。今天，我們要告訴大家的內容非常多。這是 Vera CPU 機架，包含 256 個 CPU，全部采用液冷散熱。稍后我再詳細介紹 Vera。

這是 Vera Bluefield 存儲處理系統以及安全系統。

當然，還有我們的 Mellanox 網絡技術，這是全球首款 CPU。這就是 Vera Rubin。令人難以置信的技術正在匯聚于此。

那么，我們在構建 Hopper 時，正如你們所知，我們構建 Hopper 是為了進行預訓練。

預訓練是當時我們所從事的最重要的應用，也是最重要的工作負載。后來當我們研發 Grace Blackwell 時，每個人都說，Jensen，NVIDIA 在預訓練方面真的很強。推理太簡單了。你還記得嗎？人們過去常說推理很簡單。我們也完全能做到。但正如你們所知，推理意味著金錢。而這些模型，也就是 MOE，非常復雜。要同時實現極高的響應速度、快速的交互性以及高吞吐量，是一件極其困難的事情。這就是我們創建 NVLink 72 的原因。

如今，Nvidia 的 Token 成本是全球最低的，不是降低了 10%，而是降低了數倍乃至數個數量級。這一切都歸功于我們極致的代碼優化。這一切都源于我們理解了計算模型以及推理的計算模式，從而能夠創造出 NVLink 72。現在，隨著 Vera Rubin 的推出，它已超越了推理。它現在是智能體系統中的推理。這就是 Vera Rubin。沒有電纜，沒有軟管，沒有風扇。

上次我向你們展示的時候，到處都是電纜。那些電纜看起來確實非常壯觀。但現在中間有一塊 PCB，它連接了雙側。過去需要兩小時的工作，現在只需五分鐘。Vera Rubin 的可靠性和穩健性將達到極高的水平。這是我們的 Vera CPU 托架。

這是有史以來建造的最先進的 CPU。

我馬上就向你們展示這一點。只需片刻。

這是我們的存儲托架。

兩個 Vera CPU，四個 CX9，以及海量的軟件。這是我們全新的 LPX，LPU 30，即 GB200 系統，專為超低延遲推理而設計。其吞吐量由 Vera Rubin 提供，并通過 NVLink 72 進行擴展。如果還要進一步擴展，還可以使用 GB200 LPU。這里展示的是 Vera Rubin、NVLink 以及交換機托盤。

這是位于中間的交換機，它們具有革命性意義。得益于 Vera Rubin、NVLink 72 以及我們自主研發和創造的 NVLink 交換機，還有我們用于橫向擴展的以太網交換機。令人驚嘆的是，我們推出了這兩款系統，它們專為 Grace Blackwell 而打造。如今，Nvidia 已成為全球最大的網絡公司。我為我們的網絡團隊感到無比自豪。這對我們所做的一切來說，都是極其重要的賦能者。

Vera CPU：專為智能體打造的“指揮家”

現在，我將與各位探討我們將要參與的下一個重大產業。謝謝。

Janine。謝謝。

我想后面有 2,000 人在為此努力。

好的，讓我們談談 CPU。Vera CPU。

專為 AI 時代打造的 CPU。迄今為止所有的 CPU 都是為人類而創造的。我們曾是用戶。我們曾是用戶。我們曾是租用者。我們使用 CPU 的方式，生活在一個以秒計算的世界里。我們在云端租用 CPU 的方式是：你擁有的 CPU 核心越多，能租用的就越多。舊時代的經濟模式、舊時代的用例、舊時代的 CPU，以及舊時代 CPU 的經濟性，與智能體有著根本上的不同。

智能體是不耐煩的。

它們所處的世界不是以秒為單位的。它們所處的世界是以納秒為單位的。

當它使用工具時，它希望響應時間盡可能快。

當它訪問數據庫時，它必須盡快得到返回結果。

智能體等待的每一刻，都會阻礙它進行下一步、下一步、下一步、下一步。

至關重要的是，我們要讓 CPU 盡可能降低延遲，盡可能提高交互性。

因此，我們為人工智能時代打造了 Vera CPU。現在，在我們的系統中，它有三種不同的用途。

第一種方式，當然是用 Vera Rubin 進行思考。在 Vera Rubin 機架內，已經配備了兩個 CPU。如你所知，我們正在制造并銷售數百萬臺 Vera Rubin。我們已經售出了數百萬臺 Grace Blackwell。Nvidia 現在已經是全球最大的 CPU 制造商之一。

在 Vera Rubin 機架中配備了兩個 CPU。其中一個用于協調和管理 GPU、管理 KV cache，并處理機架內運行的所有軟件。

我們還有用于安全和隔離的 Grace Bluefield。Vera 計算單元用于支持 AI 模型的調度與編排、工具使用以及數據庫訪問。

數據服務器就在這里，即 Vera Bluefield。這是世界上有史以來打造的最快存儲系統、最快的存儲服務器。之所以如此關鍵，是因為智能體（agents）訪問內存的速度快得驚人。這些系統，即存儲服務器和 CPU，現在已成為數據中心中最昂貴部分的必要路徑。

這一部分最昂貴是有充分理由的。AI 工廠的經濟學即 Token 的經濟學。而 Token 正是在這里被創建出來的。因此，你當然希望制造并生成盡可能多的 token。這就是你投入所有經濟考量的地方。而且這必須不能成為阻礙。

Vera CPU 對 CPU 架構施加了巨大的壓力，這就是我們從零開始構建全新架構的原因。一款世上前所未見的 CPU。前所未見。我們將其命名為 Vera。這是專為智能體打造的 CPU。過去所有的 CPU，我們都是為人類構建的。而這款 CPU 是為智能體構建的。

那么，有四件事需要牢記。四個要點。第一個要點是 Vera 的每時鐘周期指令數必須非常出色，因為我們需要縮短延遲。我們需要這個過程。時間。單線程性能。而非吞吐量。單線程性能必須達到世界級水平。絕對是最好的。單線程性能，這就是 Vera 的 IPC 即每時鐘周期指令數如此之高的原因。它是世界上最高的。每個時鐘周期獲取、解碼并執行 10 條指令。

第一點。第二點，CPU 數據輸入輸出所需的帶寬必須達到世界頂尖水平。第二件事是每個核心的帶寬。第三點就是帶寬，毫無疑問。我們正在推進——記住我之前所說的——代理系統從根本上是解耦且分布式的。解耦且分布式。當計算呈現解耦和分布式時，網絡就成了核心問題。因此，我們必須盡可能快地在 CPU 核心之間、以及 CPU 與存儲、CPU 與 GPU 之間傳輸數據。整個系統周圍以及 CPU 核心內部的帶寬必須達到世界頂尖水平。

這是長期以來首款真正達到極端極限的 CPU，其連接所有 CPU 核心的結構具備光速級的傳輸能力。每秒 3.6 太字節。沒有小芯片（chiplet）帶來的額外開銷，也不存在跨越芯片邊界的問題，因為我們需要整合所有部件，確保 CPU 核心之間能夠以極高的帶寬進行通信。它們并非以逐個核心租賃的方式運行，而是協同工作。

Vera 的橫截面帶寬水平超乎尋常。它是首款支持 PCI Express Gen 6 的產品。它也是首款搭載 LPDDR5 并達到每秒 1.2 太字節帶寬的產品，其帶寬是目前市面上最高性能 CPU 的 2 到 3 倍，內部帶寬、單核心帶寬以及整體帶寬均處于世界領先水平。請記住，我之前展示過，CPU 核心數量及 CPU 整體數量將會非常龐大。原因非常簡單。

過去我們是為了人類而創造 CPU。

而人類，我們總共只有 10 億之眾。未來將會有數十億個智能體。這些智能體將會使用 CPU，但由于它們旁邊的 GPU 成本過高，它們會顯得非常缺乏耐心。

因此，它們顯得過于昂貴。

過于珍貴。因此，這些 CPU 不僅需要高性能，還必須具備極高的能效，這樣我們才能在不占用用于 Token 生成的電力資源的前提下，在工廠中盡可能多地部署 CPU，畢竟我們知道 Token 生成才是盈利的來源。這四個特性，即每時鐘周期指令數（IPC）或單線程性能、單核心帶寬、芯片內外的總帶寬以及能效，定義了 Vera。它是絕對世界級的。

當將其與最高性能的 X-86 進行對比時，它的表現簡直超乎尋常。當在真實的單線程性能、真實的性能表現上進行比較時，它是頂尖的。CPU 能實現 5% 的性能提升是令人難以置信的。這簡直不可思議。能夠實現 10% 的提升更是令人難以置信。但這種性能提升速度簡直是聞所未聞。這就是 Nvidia Vera。你覺得怎么樣？

讓我們來看一下。

Agentic AI 改變了 CPU 的角色。CPU 現在是指揮，而 GPU 是管弦樂隊。

傳統的 CPU 是為不同的時代而構建的，旨在最大化每個插槽的核心數。將它們切分、虛擬化，并按小時租賃。在智能體時代，CPU 如今已成為 GPU 利用率的瓶頸，直接影響到 Token 吞吐量、延遲和用戶體驗。

Nvidia Vera 是專為智能體循環構建的 CPU，它將 NVIDIA 的定制化數據中心 CPU 核心與可擴展的一致性架構相結合，在性能核心與帶寬之間實現了恰當的平衡，從而最大化 AI 工廠的產出。Vera 的核心是為現代數據中心工作負載構建的 Nvidia Olympus 內核，能夠處理分支密集型的 Python 運行時、工具調用以及沙箱代碼執行。

每個核心都針對吞吐量進行了調優，并配備了一個神經分支預測器，每個周期可評估兩個跳轉分支。10 寬度的解碼引擎每個周期能處理更多任務。大型亂序執行引擎確保指令持續運行。具備新型圖引擎的先進預取器，可預測下一個數據路徑。但只有當數據準確且及時到達時，高速核心才有意義。

Vera 是首款使用 LPDDR5X 內存的 CPU，能夠在不犧牲帶寬的情況下同時糾正多個錯誤。

相比 X86，Vera 的峰值內存延遲降低了 40%，通過檢索、分析和沙箱執行，確保核心能及時獲得數據。

NVIDIA 的第二代可擴展一致性架構（scalable coherency fabric）將全部 88 個 Olympus 核心統一在單一網格上，并為內存和 I.O. 分離了裸片。核心不會跨小芯片拆分，從而實現了比傳統 CPU 快 50% 的核心間通信速度。此外，支持內存一致性的 NVLink 芯片間互連技術可將 GPU 直接連接至該架構。

除了 GPU 之外，NVLink 芯片間互連技術還能將 Vera 擴展至多個插槽，從而在 CPU 之間實現海量帶寬。Vera 的智能代理沙箱性能是 X86 CPU 的 1.8 倍。獨立的 Vera 機架可運行代理沙箱、工具、代碼和數據管道。Vera 與 Ruben GPU 緊密耦合，確保加速工作流程持續推進。Nvidia Vera Bluefield 4 STX。為上下文記憶和 AI 存儲提供動力。計算、網絡、存儲。Vera 是智能體時代的 CPU。

這將成為我們新的主要增長驅動力。

測評已經陸續發布，表現相當出色。

這是非常棒的產品。請記住，Grace 和 Vera 也是 AI 領域中認證度最高的 CPU，因為每一個數據中心、每一個云服務商、每一個企業，以及每一家與 Nvidia 在 AI 領域合作的公司都已經完成了對 Grace 的認證，整個軟件棧也已經針對 Grace 進行了優化。

每家公司都將對 Vera 進行認證。Vera 將成為全球最適合智能體運行的優化 CPU。僅僅因為我們將采用 Vera Rubin，僅僅因為我們完成了那次重大而艱難的轉型。事實上，在 Grace Blackwell 過渡期間，最大的風險在于從外部 CPU X86 轉向 Grace Blackwell。那次過渡極其、極其危險，但我們憑借卓越的執行力完成了它。現在 Grace 實際上已成為 Grace Blackwell 的代名詞。當人們提到 Blackwell 時，他們指的就是 Grace Blackwell。因為它現在完全普及了。

每家公司的軟件棧都已針對它進行了優化。每個人的安全棧都已針對它進行了優化。

而現在 Vera 來了。我對它感到無比興奮。

現在來看看一些性能數據。速度提升是一方面。這極其困難。提升 SQL 的速度非常困難。SQL 是有史以來最著名的領域特定語言，即 DSL。在 SQL 之前，在 CUDA 之前，就已經有了 SQL。在 OpenGL 之前，就已經有了 SQL。IBM 發明了 SQL。如今，它是全球通用的結構化數據庫引擎。

每個人都在使用 SQL。這就是 SQL。

運行速度提升了三倍，不是 10% 或 25%，而是 10 倍、三倍的提升。令人難以置信。這是實時處理，接下來是實時流處理。記住，你的 AI 不僅僅是讀取文檔。你的 AI 將會監測遙測數據，特別是在工廠內部或證券交易所內部。

你們將拭目以待。

持續監測遙測數據。涌入的數據突發流進入了 CPU。這就是正在為 New York Stock Exchange 運行實時流處理的 Vera CPU。New York Stock Exchange 總裁 Lynn Martin 非常慷慨地與我們達成了合作。該系統在全球范圍內運行實時流處理。Vera CPU 性能提升了 6 倍，這完全得益于帶寬、單線程指令執行能力、核心內部帶寬以及外部帶寬的優化。Vera 是徹底的革命性產品。

這就是 Vera。要知道，當人們談論 GPU 時，通常會提到 X-factors。

在涉及 CPU 的實際工作負載中談論 X-factors 是非常罕見的。所以我為團隊感到無比自豪。你們做得非常出色。我們有著非同尋常的路線圖。但真正令人振奮的是，幾乎每個人都在支持 Vera。他們和我們一樣興奮。這就是 Vera 的開放。它開啟了一個全新的市場。智能體，智能體是一種新的工作負載。

過去，我們為人類構建 CPU。我們需要為智能體構建 CPU。智能體系統，它們的特性各不相同。為什么舊的 CPU 會是一樣的呢？我們正在制造數以百萬計的錯誤，數以百萬計的錯誤。為了與我們共同進入市場，臺灣的 ODM 和電腦制造商，所有的 OEM，你們可以看到那些早期采用者。早期采用者是那些具有代理能力的智能體公司。這是一個新市場的開端。一個前所未有的市場。它不會取代舊有的市場，但這是一個全新的市場。面向智能體的 CPU。而這個市場注定會比上一個市場更加龐大。原因在于，未來智能體的數量將遠超人口數量，而且這些智能體非常缺乏耐心。

黃仁勛

所以，NVIDIA，Vera，CPU。謝謝。

企業級 AI 工具包與 Nemotron 模型

黃仁勛

這確實是最重要的一張幻燈片。這是核心要點。此處的核心要點在于，這就是應用模式。

這是未來十年的計算模式。Agents。Harnesses。編排 large language models。

每家公司都會運行它。每家公司都將成為 Agent 公司。每家公司都將擁有正在運行的 Agents。側面。每一家公司都會意識到，智能體將需要屬于自己的操作系統。每一家公司都在問我們：我們該如何安全地運行智能體？我們該如何為自己的工作負載構建智能體？

因此，我們推出了面向企業級 AI 的 NVIDIA agent toolkit。大家一直以來都在見證我公開構建這一技術。如你們所知，NVIDIA 幾乎所做的一切，如果你回顧我 5 年前或 10 年前的 GTC，你會在今天看到其實現的成果。關于這一點，我已經談論好幾年了，因為我們一直在為這一時刻進行構建。

企業若要構建“智能體即服務”或構建可運行的智能體，需要具備四個要素。

第一，你需要模型。

當然，指的就是大語言模型。

模型越智能越好，成本越低越好，速度越快越好，速度越快越好。更好。其次，你需要一個框架來編排整個流程。第三，這些模型需要使用工具。而這些工具自帶相應的技能。我向你們展示了 CUDA-X 庫。未來這些將成為智能體極為出色的工具。

最后，你需要一個運行時環境。

你需要一個將這一切整合在一起的操作系統。這就是 NVIDIA 推出的智能體工具包。它包含了一些你可以進行修改的 NVIDIA 世界級開放模型。我想向您展示更多內容。您可以運行來自任何人的智能體。您可以運行云端代碼、incredible agent、codex 以及 incredible agent。您可以將其運行在一個名為 OpenShell 的框架內，這對于企業內部而言將具備高度的安全性。

該 Shell 能夠保護智能體，并使其穩固地遵循安全策略。

隱私得到保護。賦予其相應的權利和特權。保護其身份信息。因此，這個 OpenShell 正在全球范圍內被廣泛采用。NVIDIA OpenShell 是開源的。你將會看到許多公司采用它。

Red Hat、Canonical、Microsoft。它將被無處不在地采用。

這是一個重要的部分，這就是運行時（runtime）。而這個運行時針對 NVIDIA AI platform 進行了全面優化，該平臺已普及至各個領域。因此，你可以在任何云端、本地服務器，甚至是終端設備上運行 OpenShell。現在，你們擁有了可以使用的工具和庫。你們擁有可以修改或直接使用的模型，或者你們擁有智能體（agents）。這就是 open-clothed。Hermes，另一個令人難以置信的工具框架（harness）。這些智能體框架現在可以在本地或任何地方為你運行。

好嗎？那么有四件事。這代表了現代企業的操作系統。那么，我們該如何使用它呢？我最喜歡的代理應用案例之一是芯片設計。這是 NVIDIA 所做的最重要的事情。因此，我們當然必須與 Cadence 合作，共同構建一個超級代理，即芯片設計超級代理。它由 Codex 或 Claude 云端代碼進行編排。它以 RTL、架構圖、原理圖或規格說明書作為輸入，并處理任何你需要修復的內容。我們共同創建了一些超級代理。

這些代理針對 NVIDIA 運行時環境和 Nemotron 進行了優化。讓我們來看一下。

這真是令人難以置信。Cadence 與 NVIDIA 正在合作構建芯片設計智能體。數十萬顆 NVIDIA 芯片匯聚在一起，構建起為全球前沿 AI 模型提供算力的 AI 工廠。設計這些芯片及其運行的系統是工程領域最艱巨的挑戰之一。數以萬億計的晶體管、三維電路、微觀尺度，每一個邏輯門、每一根導線，都要精確同步到皮秒級，必須在零誤差的情況下完美協作。

物理原型制作速度太慢，且成本過于高昂。因此，工程師們在數字領域進行工作。每一顆芯片最初都是一套架構規范，隨后被轉化為 RTL，即芯片設計的語言。RTL 必須在仿真環境中經過驗證。哪怕是一個小小的漏洞，都可能導致芯片交付延遲數月。在 NVIDIA，數以千計的工程師、每年數十億小時的計算時長、數百萬次測試，均經過編寫、運行與調試。這是一個耗費團隊數周時間才能完成的周期。

為壓縮這一周期，Cadence 與 NVIDIA 構建了一個設計驗證智能體。Codex 負責統籌整個流程。Cadence chip stack 啟動了由 Nemotron 驅動并由 NVIDIA OpenShell 保障安全的 RTL 驗證循環，調動了在 RTL 生成、測試平臺創建、回歸測試以及調試方面具備專家能力的子智能體。該系統實現了自我驅動。

這些 chip stack 智能體利用 Cadence Excellium 運行數百次模擬，通過 Jasper 進行形式驗證，揭示設計缺陷，修復代碼中的錯誤。曾經需要數周的時間，現在僅需數小時。驗證周期縮短了 40 倍以上。NVIDIA 與 Cadence 正攜手利用 AI 智能體重塑芯片設計。從幾周，從幾周到幾小時，從幾周到幾小時，從幾周到幾小時，從幾周到幾小時。

NVIDIA 擁有數以千計的芯片設計師。我們打算雇傭數十萬名 Cadence 超級智能體與我們協同工作，以便加速我們公司的發展，讓我們能夠更加雄心勃勃，創造出更加令人驚嘆的成果。讓事情運行得更快。

你們剛才看到了，工具包中包含了模型、工具框架（harness）以及工具；在此案例中，這些工具指的就是 Cadence 仿真器、驗證器以及形式化驗證系統。

這就是為什么我們如此努力地與 Cadence 合作，在 CUDA 上加速他們所有的工具，因為這些智能體非常迫切。智能體想要立即得到答案。因此，模型、模型、工具框架、經 CUDA 加速的庫與工具，以及運行環境，缺一不可。你們剛才所見，正是所有這一切的整合。

現在，這一切的起點是一個出色的模型，Cadence 可以對其進行修改和微調，使其成為 Cadence 員工隊伍和專業知識領域的專家，從而創建出專屬于 Cadence 的、擁有其專有知識的超級智能體。他們必須從一個出色的模型開始。

我們將其命名為 Nemotron。NVIDIA 致力于為全球構建開源模型，以便你們所有人，即我們所有人，都能創造屬于自己的智能體。

今天，我們要發布 Nemotron 3 Ultra。沒錯，這是我們的下一個開源模型。

而且它非常聰明。Nemotron 模型不僅提供模型本身，我們還提供用于訓練該模型的所有數據。得益于我們擁有由眾多卓越合作伙伴組成的聯盟——你們可以看到下方的所有合作伙伴——我們共同協作，互相貢獻數據。Nemotron 是基于全球最大的長序列推理模型、長序列任務解決、工具及任務解決工具套件之一進行訓練的。這得益于我們所有偉大的合作伙伴關系，從而能夠使用這些數據集。

所有這一切，從模型、訓練腳本到數據，都將完全向你們開放。這就是最優秀的開源模型。全球最佳的開源模型系統策略。其簡單的目標是讓你能夠獲取所有內容，并在此基礎上進行增補。使其變得更好。使其成為你自己的產品。

Nemotron 3 Ultra。速度提升了五倍。這是世界上首個基于 SSM 狀態空間模型與混合專家模型混合架構的模型。該架構速度極快。我們追求速度，是為了讓你能夠實現快速思考。當你能夠快速思考時，便能在同等成本下進行更長時間的思考。速度提升了五倍。

成本也降低了 30%。

降低了 30%。低了 30%。其在總浮點運算次數和總推理時間上的運行成本，甚至比全球最具成本效益的模型還要低。我們正在與全球最優秀的開源模型進行對比。前沿智能。速度提升了五倍。成本降低了 30%。完全開源。我們對此全心投入。

現在是 Nemotron 3。我們目前正在研發 Nemotron 4。因此，這一整套工具包，涵蓋了模型、工具、技能和運行時環境，正是全球每一家企業現在都有能力構建自有智能體的原因，就像 Cadence 利用其超級智能體所做的那樣。

我們正與眾多公司合作，包括 Cadence、Crowdstrike、DeSoe、Palantir、SAP 和 Service Now。人們總是說，Jensen，智能體將會顛覆這些市場。我說恰恰相反，現在你們已經可以看到了。智能體將為我的合作伙伴和朋友們創造有史以來最大的機遇。

我們擁有 NEMO，即 NVIDIA Agentic Toolkit for Enterprise AI，以幫助他們實現這一目標。就是這樣。

RTX Spark：重塑個人電腦產業

黃仁勛

首先，Vera Rubin 已全面投產。第二，Vera CPU。這是為新一代智能體打造的 CPU。第三，NVIDIA 的企業級 AI 工具包，旨在讓每一家企業和每一家企業軟件公司都能構建智能體。

我和你們的關系就是從這里開始的。你們當中許多人，我的許多朋友和合作伙伴在臺灣，你們的公司也是從這里起步的。

從很多方面來看，這就是現代計算機工業的開端，距今已有 40 年了。

NVIDIA 已經成立 33 年了。當時 PC 工業已經開始進入 Windows 1、Windows 2 以及 Apple 1 和 Apple 2 的時代。等到我們出現的時候，Windows 3.1 已經成為了 PC 的代名詞。如你們所知，Windows 95 讓 PC 真正實現了個人化。它將 PC 從企業和公司的辦公環境帶入了消費電子領域。每個人都應該擁有一臺，事實也的確如此。這僅僅是一個開始。

這個計算平臺在幾個方面做得極其聰明。Windows 不僅僅是一個……正如你所知，Windows 進行了恰當的抽象。它的架構設計恰到好處。系統 BIOS、開放的芯片組、帶有驅動程序的操作系統，以及能夠在運行時連接和安裝的驅動程序，還有帶有多媒體 API 的抽象層，這些將 PC 帶向了我們今天所熟知的樣子。每一個要素對于促成 PC 的普及都至關重要。

40 年后，Microsoft 和 NVIDIA 將重塑 PC。這就是全新的 PC。那么，明天晚上，我想按我們的時間是明天晚上，我將與 Satya 在一起。我們將更深入地探討雙方正在進行的合作。Microsoft 和 NVIDIA，在過去三年里。

我們花費了這么長的時間來徹底重塑 PC 的運作方式，以便為這一時刻做好準備。正如我之前提到的，那種被稱為 Agent 的計算模式。

它將在 AI clouds 中運行。它將在企業內部運行。它也將在你的 PC 上運行。當 PC 擁有了自主 Agent，一個能夠協助你、理解你的 Agent 時，將會發生什么呢？

你可以與它交談。它能夠觀察你。你可以讓它重新整理文件、為你提供協助、進行一些研究。它還能做更多事情，稍后我將為您演示。當然，新的操作系統本質上就是舊的操作系統加上大語言模型。大語言模型在許多方面都是現代版的 DirectX。它當然具備輸入和輸出功能，并能理解提示詞。它能夠理解計算機視覺。它能夠生成視頻。它能夠生成音頻。它是個人電腦、即計算機的現代擴展，也是其智能層面的擴展。

除此之外，正如我之前提到的，應用程序將被一種智能體運行時所取代。而這就是現代應用程序，即智能體。現在讓我們來看看他能做些什么。這始于一個靈感，一個設想，即在 AI 時代，40 年來首次重塑 PC。在一個智能體（agents）的世界里，我們的個人電腦將變成什么樣？

智能體在本地運行，連接至模型，無論是在本地還是云端；這是我們的個人 AI，為了安全而置于沙盒中，持續運行，處理工作。芯片、Earth 和 OS 必須進化。隆重推出 RTX Spark，我們將過去 33 年所學的一切，濃縮進這一枚芯片中。Blackwell RTX GPU 擁有 6,144 個 CUDA Cores，具備 1 petaflop 的 AI 算力，搭載與 MediaTech 合作定制的 20 核 Grace CPU，并由 NVLink 融合封裝。128 GB 統一內存。采用 TSM3 納米工藝，包含 700 億個晶體管。

此外，通過與 Microsoft 的緊密合作，我們打造了一個專為智能體設計的 Windows 平臺。

我們正在重塑個人電腦。

用于創作。用于游戲。用于智能體。

這是一場全新個人計算革命的黎明。而它始于 NVIDIA RTX Spark。

...我得向你們展示最精彩的部分，那就是電子游戲。這也是最精彩的部分，那就是電子游戲。

它同樣也是最貼近我們內心的事物。

這是 Forza。順便說一下，這是 007。

新款 007 游戲，我很期待玩它。我長得有點像他。

女士們、先生們，這是 NVIDIA 的 RTX Spark 筆記本電腦。好了，好了，謝謝你們。

我口袋里的東西太多了。這是世界上打造出的最令人驚嘆的芯片。

這是我們與 Media Tech 合作打造的 N1X。

我想我剛才看到 Rick 了。這是 N1X。這是一塊精美的芯片。這就是一個...一塊坦白說需要 33 年才能構建出來的芯片。其原因在于 NVIDIA 的軟件棧 100% 都在這里運行。如果你充當數字生物學研究，沒問題。如果你想進行地震處理，沒問題。你想進行天體物理學研究，沒問題。所有與 CUDA 相關的，所有的物理學、所有的生物學、所有的基因組學、所有的 AI，沒問題，所有的計算機圖形學，也沒問題。每一個 NVIDIA 曾經創造的應用程序，以及每一個 Windows 曾經運行過的應用程序。Microsoft 和 NVIDIA。它一絲不茍地優化了一切，使得這臺計算機實際上能夠運行這個世界所創造的一切。

此外，它現在可以運行智能體。

一臺不可思議的計算機。我為此感到非常自豪。好的。現在，我希望你在接下來我要展示的視頻中記住這一點。試想一下。這里的一切都將在你的個人電腦上運行。現在，那臺計算機可以運行本地的 Nemotron 3 Ultra 模型或 Nemotron 3 supermodel。或者它也可以通過云端、代碼、Codex，或是云端或網絡上的其他模型來實現。它將會運行并做出一些驚人的事情。讓我們播放它。

每一所房子都始于一個構想。從構思到設計需要無數的工具、專業知識和大量的時間。現在，一個在 RTX Spark 上本地運行的智能體可以利用我筆記本電腦上的工具，通過運行 Hermes harness 的開放式沙盒連接到云端的 Claude Sonnet，從而協助我進行房屋設計。我選定場地，分享我的概念草圖以及用于激發設計靈感的風格情緒板。以及提示詞，即對需求、要求和設計意圖的文本描述。

我的智能體開始工作。它利用我筆記本電腦上的工具，打開 Rhino 并開始對場地進行建模，塑造地形、退界線以及建筑體量。隨后，它提出建筑形式，并針對成本、舒適度和質量進行優化。在確定了建筑形式后，我的智能體生成了內部布局。

墻體、交通流線和房間開始顯現雛形。

我隨時可以介入，進行調整和修改。門、窗和結構元件會自動放置。我的智能體能檢測到自身的錯誤并進行修正。

當我批準后，智能體將模型從 Rhino 導出到 Blender。材質和對象屬性在保持設計上下文完整的前提下進行遷移。我發現了兩處不同。調整材質，以獲得理想的外觀。

然后，我選取鏡頭。Blender 對房屋進行渲染。我的智能體使用結合 Flux 2 模型的生成式 AI，使其呈現出照片級的真實效果。多視角。光照條件。曾經復雜的工作流程，現在通過我的 Agent 得到了引導和簡化。

與我共同開發 RTX Spark。以想象力的速度進行設計。

他正在 Agent 的世界中進行觀察。開發者們對此感到非常興奮。這是一臺不可思議的計算機。所有的加速性能，所有與之相關的軟件能力，都在與每一位開發者合作，使其為你們所有人帶來卓越體驗。下一個是 Adobe。當然，這是一個被全球數千萬人使用的不可思議的工具套件。他們已經重新設計了 Adobe 的核心架構。Adobe Photoshop 和 Premiere，他們將為其發布 RTX Spark 版本。速度提升了兩倍。它本身就已經很快了。現在它的速度將提升一倍。而且它在設計上也對智能體更加友好。憑借其 MCP server，它現在可以與你筆記本電腦上的智能體進行交互。有如此多的客戶和合作伙伴對將 RTX Spark 推向市場感到興奮，這簡直令人難以置信。要知道，這是 40 年來 PC 重塑全線產品中的首次創新。

我非常高興你們所有人以及全球生態系統能夠加入我們。

基本上所有人都在這里了。所有人都會支持 RTX Spark，并將與我們一起打造極其智能、強大且精美的筆記本電腦。非常感謝大家。但這還不是全部。但這還不是全部。

全部。

RTX Spark 是對筆記本電腦的重塑。但事實上，Microsoft 和 NVIDIA 正在重塑整個 PC 產業。今天我們宣布推出一個全新的系列。三款革命性的 Windows 機器，涵蓋臺式機、筆記本電腦和工作站。全部 100% 兼容 Windows，100% 支持 CUDA，100% 支持 NVIDIA AI TensorFlow 和 Tensor Core。你在世界各地不同平臺上看到的、運行的一切，在這里都能運行。這是 40 年來首次對 PC 進行徹底的重新設計和重塑。現在，真正令人驚嘆的是這一點。這就是 RTX Spark 筆記本電腦。

這是臺式機。這一臺來自 MSI。Joseph，這是你的。好的，看看它有多漂亮。

這個智能體可以 24 小時全天候運行，且無需計量收費。你可以下載你的智能體。你可以在這里飼養你的龍蝦。這是你的鉗子。它一直在運行。沒有計量焦慮。它就坐在這里，連接著你的整個房子、你的筆記本電腦、你的顯示器、所有的攝像頭、你的烘干機、你的飲水機、你的熱水器，以及你想要的任何一切。你的安全系統，所有一切都連接到這里，它就成為了你的個人人工智能，你的個人人工智能代理。而且它會隨著時間的推移變得越來越聰明，因為今天我們有 Nemotron 3 Ultra。明天我們會有 Nemotron 4，然后是 Nemotron 5、Nemotron 6，我們會不斷讓它變得越來越聰明。與此同時，它就放在家里幫你處理各種事務。如果你想預訂旅行，沒問題。如果你想要一個卓越的系統，這就是一款 Windows 版的 DGX station，它兼容 Windows，支持 Windows 中的所有功能，并且擁有 768 GB 的內存。所以你可以運行一個萬億參數的模型。這簡直難以置信。20 Petaflops 的算力。

每秒 8 TB 的內存帶寬，而且它就放在你的辦公桌旁。

基本上，如果你是一名大型語言模型開發者，或者是一名智能體開發者，將它放在你的辦公桌旁，就能為你提供所需的一切算力，當你需要部署時，再將其上傳到云端即可。現在，如果你觀察并思考這件事，你會發現有些事情正在發生。回想一下，15 到 20 年前，我們曾有一個被稱為“電話”的概念。如今，我們有一個被稱為“PC”的概念。現在當你想到你的手機時，你唯一不會做的事情就是打電話。你幾乎用它做其他所有事情。因此，這部手機對你而言，其意義與過去的電話大相徑庭。我敢肯定，未來會發生的情況是，10 年后的 PC，與你今天所認知的那個用來啟動應用程序、點擊和打字的工具完全不同。

這臺 PC 將徹底改變。

這是我的理論。我完全可以想象，就像今天每個家庭都有家庭影院——或者說許多家庭擁有家庭影院、大尺寸電視一樣。還有割草機、洗碗機。我完全可以想象，總有一天你的家里真的會有一臺 AI 超級計算機。它運行著你所有的智能體。它運行著你所有的智能助手。它們隨時隨地為你處理各種事務。你必須把它安放在家里，就像你在家里安裝家庭影院、音響設備或游戲主機一樣，你會擁有運行 AI 智能體的家用計算機。久而久之，它們對你來說會更像是 R2D2。

比起個人電腦，它會讓你感覺更像是 C3PO。

毫無疑問，這種對計算機的重塑，其意義不亞于手機向我們如今所熟知的智能手機的演變。因此，這僅僅是這段旅程的開始。這是一個全新產品系列的開端。因此，我們制定了相應的路線圖。這對我們來說是一個全新的產品系列。在每一代架構中，我們都將涵蓋臺式機、筆記本電腦、工作站，以及后續的臺式機、筆記本電腦和工作站。令我感到無比欣慰和榮幸的是，全球 100% 的 PC 產業界都已加入我們的行列，共同重塑 PC。

一條新產品線，一個新起點。謝謝大家。

物理 AI 與機器人：Cosmos 3 與 Isaac Groot

黃仁勛

如你們所知，Agentic AI 就是一種數字機器人。

它能夠理解、推理、規劃、采取行動并使用工具。Agentic AI 將運行在所有這些計算機上。過去一段時間里，你們已經看到我談論過其中的每一個產品。我們正在開發用于人類或機器人的計算機，以及各種類型的機器人計算機。我們正在開發自動駕駛汽車計算機。我們正在開發衛星。你擁有具備 Tensor Cores 的 G-Force。我剛剛談到了全新的個人電腦產品線。農業設備、制造設備、重工業設備都將具備智能體特性。你甚至會擁有屬于自己的小型智能體助手。即使是你的基站，即未來的無線電臺，也將具備智能體特性。通過理解流量并思考如何與其他基站協調，以實現盡可能低的能耗，從而提高利用率和頻譜效率。因此，一切都將運行智能體。

今天，NVIDIA 在很大程度上處于這一領域的核心地位。但我相當確定。隨著時間的推移，將會有數百億甚至數千億個智能體系統和智能計算機在全球范圍內運行。最大的問題是數據。就語言模型而言，我們訓練所用的互聯網上的所有英語及其他語言內容，都是基于人類的視角。這些內容是由我們撰寫的，也是由我們閱讀的。然而，為了給 AI 機器人創造數據，它必須處于機器人的感知與視角之中。而世界上絕大多數視頻數據都是第三人稱視角，而非第一人稱視角。

因此，對于智能體系統、機器人系統以及物理 AI 而言，數據是最棘手的問題。

你們已經看到我們在這一領域不斷進階。我們從遠程操作開始，這本質上就是人類演示。這與強化學習人類反饋帶來的重大突破別無二致。在此之后，我們使用仿真技術。這就是 Omniverse 發揮作用的地方。這與強化學習中可驗證的獎勵機制沒有區別。

明白嗎？我們正是利用這些系統來引導物理 AI 模型。

最終，我們能夠通過第三人稱視角進行學習，并將其重投影為第一人稱視角。現在，通過引導學習，我們最終擁有了一個世界模型基礎，能夠從你想要的任何視角理解物理世界。無論是第三人稱、第一人稱、外部視角還是內部視角，都沒有關系。這確實是一個巨大的突破。

今天，我們正式發布 Cosmos 3。

Cosmos 3 代表了物理人工智能的最前沿。在語言模型領域，我們也處于前沿陣地。有許多人正致力于此。然而，在物理人工智能領域，我們絕對是世界領先的。我為團隊能取得這一成就感到無比自豪。這是各位所有工作的基石模型。無論您是想制造機器人、工廠機器人，還是任何涉及物理世界的機器人，現在您都有了一個得力助手——Cosmos 3。它具備理解與推理能力，能夠進行生成，并能實現閉環仿真。它甚至可以直接作為決策策略本身。它在世界各地的排行榜上均名列前茅。我對 Cosmos 感到無比自豪，今天我們正式宣布推出 Cosmos 3。讓我們來看看。

現實世界是無限且不可預測的。

物理 AI 需要數據，但現實世界的數據無法擴展。對于物理 AI 而言，計算即數據。

這就是 Cosmos。一個用于物理 AI 的開放式前沿全能模型，構建于一種新型的 Transformers 架構混合體之上。像素、動作、聲音和語言匯入自回歸 Transformer 中，它負責推理、規劃并指導生成式 Transformer，從而生成下一時刻的內容。開發者們跨越不同的具體形態和應用場景對 Cosmos 進行訓練后微調。

作為 VLM，Cosmos 觀察物理世界，理解正在發生的事情，描述場景并標記出重要信息。作為世界模型，Cosmos 能從圖像、文本或視頻中生成符合物理規律的合成視頻。作為模擬器，Cosmos 為策略訓練和評估構建了閉環。作為 NVIDIA Omnodreams（一種動作條件世界模型）的基礎，Cosmos 能逐幀預測未來。經過后訓練，Cosmos 演變為世界動作模型。

感知、推理、規劃、生成動作。

適用于各類機器人。適用于一切事物。一種新型數據，一種由計算機生成的全新教師。Cosmos。物理 AI 時代的開發者基礎。

它結合數據與算力，為您提供 AI。如今既然有了 AI，算力即是數據。

因此，利用 Cosmos 3 訓練出眾多的 AI 模型。Cosmos 是一個如此出色的開源模型系統。這與 Nemotron 完全一致。我們公開了該模型。我們公開了數據。甚至公開了我們的訓練方法，這樣你們就可以自行對其進行增強，將 Cosmos 轉化為你們的專屬模型。我們擁有如此多優秀的合作伙伴，與我們在眾多不同行業中共同協作。

當然，模型本身是 AI 技術棧中最容易理解的部分，但 AI 技術棧非常復雜。

它包含生成器、模型、模擬器和運行時環境，正如其在其他領域的應用一樣。

對于智能體系統而言，這些汽車本質上是實體 AI，即作為自動駕駛車輛的智能機器人，同樣具備這種復雜的技術棧。

今天，我們宣布推出 Alpamayo 2，這是一款面向自動駕駛汽車的開源模型。我們正在與全球各地的汽車公司展開合作。

如果你關注那些已簽署 NVIDIA Hyperion 協議并正在制造 NVIDIA Hyperion 汽車的品牌，這代表了全球約 80% 的汽車份額。這些制造商代表了全球 80% 的汽車產量。我們將擁有大量的 NVIDIA Hyperion 系統，它們能夠運行 Alpamayo 或其他任何人的自動駕駛技術棧。我們也與移動出行服務建立了連接。全球約 97% 的移動出行服務正在與我們對接，因此當我們在搭載 HALOS 操作系統的 Hyperion 上部署 Alpamio 時，我們將能夠連接到全球所有的這些服務。讓我們來看看這個。

Hey Mercedes，帶我去我最喜歡的那個三明治店。

AI語音

正在為您規劃前往目的地的路線。車道暢通，正在駛出以開始行程。由于前方靜止的引導車輛阻擋了車道，正在向左微調避讓。減速并在控制路口的停車標志前停下。停車禮讓行人，因為該行人位于我們的車道上。禮讓切入車輛及來自左側的車輛。向左微調以避開右側停放且阻礙通行的車輛。與切入車輛保持距離，因為其正在匯入我們的車道。由于右側車道被停放的廂式貨車阻擋，需向左微調避讓。它們位于我們的車道上。停車以與前車（即本車道正前方的車輛）保持距離。與本車道正前方的車輛保持距離。在停車標志處停車，因為路口設有停車標志。停車以禮讓橫向交通。在橫向交通處停車。跟緊前方車輛。由于卡車擋住了車道右側，向右輕微移動。我們車道的左側。讓我們向左繞過那輛擋在車道右側的卡車。您的目的地在右側。

視頻旁白

Alpamayo，世界上首款具備推理能力的自動駕駛車輛。

黃仁勛

如果你讓它一直說個不停，它會讓你抓狂的。但我們很高興它能這樣。它一直在進行自我對話。這被稱為思考。因此Alpamayo 是一款具備推理能力的汽車。

我們所創造的技術同樣適用于人形機器人。

當然，還有許多新的突破亟待實現。NVIDIA Isaac Groot 是我們的人形機器人技術棧。包括模型、數據生成、仿真、運行時環境，以及操作系統。這就是 Groot 平臺，即 Isaac Groot 平臺。正如你所見，我們的每一個系統都遵循完全相同的模式，無論是云端智能體系統、個人電腦智能體系統、自動駕駛汽車機器人系統，還是人形機器人系統，全部如出一轍。

當然，在每一個案例中，我們都是從頭到尾完整構建。

我們是從頭到尾完整構建一切。縱向且完全地與代碼設計、極致代碼設計相集成，然后我們向所有人開放，供大家選擇使用任何喜歡的部分。無論你想使用什么，我們甚至能協助你進行修改。但目前還缺失的一點是，我們需要一個用于機器人系統的參考平臺。

這些機器人系統非常復雜，擁有太多的電機、太多的傳感器，而且極其脆弱，因此我們需要一種方式來交付這些參考平臺，就像我們在 PC、DGX、云平臺和自動駕駛汽車上所做的那樣，現在我們要為機器人實現這一點。

今天，我們發布 NVIDIA Isaac Groot，這是一個參考人形機器人，全部完全集成，每只手擁有 25 個自由度，由 Sharpa 制造，機器人本體擁有 31 個自由度，身高 6 英尺，體重 150 磅，和我一模一樣。第一個數字我稍微矮點，第二個數字我稍微重些。除此之外，相當接近。該平臺運行著全新的 Thor 以及我們全套的軟件棧。數據生成棧、數據仿真棧、運行時環境，所有這一切都集成在一個專為所有人使用而設計的機器人中。我們構建它是為了高等教育和大學研究人員使用，因為對他們來說，自行構建這樣的系統難度極大。那么，讓我們來看一下這一點。

AI 的下一個飛躍是通用機器人，即人形機器人，但制造它們非常困難。每個團隊都從零開始，需要拼湊模擬器、遠程操作系統、數據流水線和訓練基礎設施。在研究開始之前需要花費數月時間進行設置。NVIDIA Isaac Groot，一個用于人形機器人的開放開發平臺。提供開放模型、仿真與訓練庫以及數據生成器。

此外，還有機器人計算機。全流程貫通，數小時內即可投入使用。首先，在 Isaac Lab 中設置仿真環境。利用 Isaac Teleop 在真實或模擬機器人上捕捉演示數據。

使用 Omniverse 和 Cosmos 生成合成數據。實現單一演示的規模化擴展。將單次演示進行擴展。擴展至數千次。訓練策略。

在 Isaac Lab Arena 中進行評估。通過 Isaac Ross 進行部署。在 Jet 和 Thor 上運行。以及 Thor。

每一個要素。

模塊化。開放式。

使用現有資源或替換為您自己的資源。

Groot 正在為從研究實驗室到工廠車間的各個領域、每一門學科的機器人研究提供支持。

一個開放平臺。現在，迎來了一項新的補充。Isaac Groot 引用了設計機器人。基于 NVIDIA 的開放平臺構建。為前沿研究做好準備。適用于任何實驗室，任何地點。機器人時代從這里開啟。

NVIDIA Isaac Groot。如此多的機器人。如此多的機器人。

總結：邁向下一個飛躍

黃仁勛

我們正在與全球幾乎所有從事機器人或機器人系統工作的人員合作。讓我告訴你我之前告訴過你的內容。計算機行業已經徹底改變了。在過去的六個月里，一切都改變了。

一切的改變源于 Agent 的實現，并與最新的前沿模型實現了融合。

這使得 AI 現在能夠完成實際且有用的工作。這種計算范式將會反復地重演。這是一種計算范式，即作為一個模型的 Agent，配有一個利用技能調用工具并運行在運行時環境中的系統。該運行時環境取決于它是在云端、本地服務器、程序、個人電腦還是機器人上運行。對于所有這些場景，其計算范式完全一致。你會因為個人偏好而使用不同的配套系統。你會因為個人偏好而使用不同的模型。你會為了自身專有用途而對它們進行改進。你可以創建超級智能體，并將它們出租給其他人以協助他們完成工作。

這種智能體平臺、這種智能體模式，NVIDIA 擁有企業級 AI 工具包。

這對你們所有人來說，都是一種參與 AI 的絕佳方式。而對我們而言，這是一個極好的增長機會。Vera Rubin 已全面投產。Grace Blackwell 是為處理 AI，特別是推理任務而打造的。而Vera Rubin 是為運行智能體而打造的。它已全面投產。它遠不止是一個 GPU。它是一整套解耦的、分布式智能體處理系統。NVIDIA 已經真正成為了一家基礎設施公司。不僅僅是一家 GPU 公司，不僅僅是一家系統公司，而是一家致力于幫助您實現最大化營收和最大化利潤，并盡可能快地達成目標的基建公司。智能體時代，這是一種全新的計算方式，如今構建的 CPU 是為智能體而生，而非為了人類。面向智能體的 CPU 有著其獨特的要求，而我們的 NVIDIA Vera 極具革命性。我對它的產量爬坡感到非常高興。

訂單情況。

它已經注定將成為我們公司歷史上速度最快、最成功的產品發布。NVIDIA 與 Microsoft 共同打造了全新的 PC 產品線。這是一個嶄新的開始。當然，我剛才描述的那種完全相同的智能體模式、生成式處理模式和計算模式，也將運行在各類設備上。我提到了 PC。但在未來，它將應用于機器人、衛星、基站和工廠。在云端、本地數據中心以及邊緣側。這種模式，即智能體 AI 系統，這種智能體計算模式，將在世界各地的計算機中被復制。我們對個人電腦的認知很可能會發生改變。我要感謝你們所有人的合作與友誼，沒有我們共同完成的一切，我們無法走到今天。我為你們在過去一年中所取得的巨大成功感到自豪。

明年將會更加精彩。

我還有一件事要告訴大家。

讓我們來看一下。

視頻原聲

在 Computex 上完成的展示。Jensen 向世界展示了未來趨勢。實用的 AI 已經到來。智能體將協助你左右。但為了防止你錯過了我們今天所說的內容，臺北，我們將為你詳細拆解。Agent 過去常被誤解。

過去只有好萊塢的電影明星才擁有他們。現在我們都有了能讓夢想成真的團隊，在客廳里建立公司，但他們需要大量的計算資源，我們聽到了你們的需求。這就是我們創建 Vera 的原因。Rubens。所以演示是真實的。最便宜的 Token 即將到來。十倍速的推理天堂。比 007 還要多的特殊 Agent。Bluefield 保持 Agent 記憶的準確性。現在，讓我們談談它的 CPU。速度提升 50%。這太離譜了。這對 Vera 來說并非如此。它是為智能體構建的。NVLink fusion 巧妙地融合了 A6。歡迎所有人加入 NVLink 的派對。如果你喜歡那段介紹，Vera Rubin 已經全面投產了。Nemotron Ultra 推出了運行。工作效率提升了 5 倍。Nemotron 確保了防護欄的穩固。OpenShell 保持了沙盒的嚴密。你的代碼已完成遷移并經過審查。在這首歌結束之前的一切。

AI 就像一個五層蛋糕。計算收益。毋庸置疑。

全球 AI 云構建了海量的吉瓦電力。DGX 通過連接各節點保持精簡的電力運行。

每一瓦電力都為您優化。

這樣您就可以擁有您的蛋糕。也能享用它。RTX，分叉的一年真有趣。40 年來 PC 領域最重要的時刻。代理（Agents）賦能所有工作流。在 Windows 支持的任何地方運行。任務在 CPU 上運行，模型在 GPU 上疾馳。Cosmos 構建機器人所需的世界。將轉向和計算轉化為合成足部動力。Alpamayo 觀察并進行推理分析。像人類一樣理解道路。它們是如何學習移動的？學習技能并尋找成長。這棵樹由思想驅動。

未來是光明的。來看看接下來會發生什么。

黃仁勛

謝謝你，Taiwan。歡迎來到 Computex。謝謝。

謝謝。謝謝。感謝這精彩的一年。感謝你們所有的友誼與支持。謝謝。保重。祝你度過一個愉快的 Computex。

風險提示及免責條款：市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資責任自負。

點個在看支持一下??

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.