爭鋒CPU，角逐PC！黃仁勛臺北炸場，英特爾、AMD該慌了

2026-06-01 15:16:58　來源: 半導體產(chǎn)業(yè)縱橫

北京舉報

分享至

英偉達發(fā)布個人電腦超級芯片RTX Spark，狠狠沖擊PC市場。

剛剛，英偉達GTC Taipei 2026大會上，黃仁勛身穿標志性的皮衣再次登場。

開場第一句就定調(diào)：“兩年前我來這里的時候，開始和你談?wù)揂I的下一波浪潮。今天我可以告訴你，代理式AI已經(jīng)到來，實用性AI已經(jīng)到來（Agentic AI has arrived. That useful AI has arrived.）。”

本次英偉達GTC Taipei 2026大會上，黃仁勛說了六大重點：

第一，Token經(jīng)濟學，Token現(xiàn)在是盈利的單位。芯片便宜不代表你賺了，芯片貴不代表你虧了

第二，Agent架構(gòu)五大核心組件：模型（Model）、線束（Harness）、工具（Tools）、技能（Skills）、運行時組件（Runtime）。

第三，Vera Rubin現(xiàn)在正在全面生產(chǎn)中，秋季開始發(fā)貨。

第四，發(fā)布智能體時代的CPU Vera；與x86 CPU相比，任務(wù)完成速度提高了1.8倍。

第五，發(fā)布個人電腦超級芯片RTX Spark，黃仁勛表示“30年來我們所學的一切精華，都凝聚在這一塊芯片中。

第六，芯片設(shè)計進入Agent時代，和Cadence、西門子、Synopsys等構(gòu)建自主AI工程師。

Token經(jīng)濟學：多買多賺

Token如今成了硅谷、中國臺灣、深圳所有科技從業(yè)者嘴里最熱的詞。黃仁勛說：“Token現(xiàn)在是盈利的單位。每個Token都是收入。AI公司想建更多Token，建更多AI工廠。”

一個1吉瓦的AI工廠項目，起步價200-300億美元。很快會到600億，800億。每吉瓦一百億美元。全球科技巨頭正在瘋狂建設(shè)AI基礎(chǔ)設(shè)施，中國臺灣的計算機廠商最近忙得飛起。黃仁勛在現(xiàn)場對著產(chǎn)業(yè)鏈說：“你們都如此忙碌，（中國臺灣）企業(yè)們做得很好。”這句話背后是整個半導體供應(yīng)鏈的狂歡。

這就是Token經(jīng)濟學。傳統(tǒng)IT時代，買服務(wù)器是成本，計算是消耗。AI時代，買GPU是投資，計算是收入。黃仁勛直接畫了一條線：芯片便宜不代表你賺了，芯片貴不代表你虧了。選錯架構(gòu)的代價，從未如此高昂。如果你的AI工廠每瓦吞吐量不夠高，你買得越多虧得越多。如果每瓦吞吐量足夠高，你買得越多賺得越多。

兩年前黃仁勛說下一波是Agent AI。今天他說：“自主性AI已經(jīng)到來，實用性AI已經(jīng)到來”。

黃仁勛給出了一組數(shù)據(jù)：GitHub提交次數(shù)從2023年的3億次飆升至2026年的5億次。兩年翻將近兩倍。全球3000萬軟件開發(fā)者，用3萬億美元薪資，創(chuàng)造了9萬億美元生產(chǎn)力。

黃仁勛反駁了AI會導致失業(yè)的說法：“有人說AI會讓程序員失業(yè)。純屬無稽之談。工程師數(shù)量在增加。因為每個工程師能創(chuàng)造三倍產(chǎn)出，企業(yè)當然想招更多。”AI的價值不在于替代，在于放大。它讓每個開發(fā)者、每個企業(yè)的產(chǎn)出能力呈指數(shù)級增長。當每個軟件工程師能創(chuàng)造三倍價值時，企業(yè)沒有理由減少招聘，反而會擴招。這就是黃仁勛看到的未來：生產(chǎn)力革命正在發(fā)生，而且這個革命的速度比任何人預期的都快。

Agent架構(gòu)：五大核心組件

過去四十年，計算機的工作模式從未改變：啟動應(yīng)用程序，點擊輸入，等待結(jié)果。Agent時代完全不一樣。用戶只需要描述意圖，AI自動生成代碼或使用工具，產(chǎn)生必要輸出。

在傳統(tǒng)計算中，軟件是一個二進制包，運行在操作系統(tǒng)內(nèi)部，受限于操作系統(tǒng)的調(diào)度和約束。Agent的計算模式是異構(gòu)分布的——模型、線束、工具、技能、運行時分布在數(shù)據(jù)中心的不同位置，由CPU統(tǒng)一協(xié)調(diào)。

黃仁勛詳細拆解了Agent的五大核心組件：

黃仁勛明確指出："This agent consists of model, harness, tools and skills, and a runtime."

模型（Model）：充當“大腦”，負責理解、觀察、推理、規(guī)劃。大型語言模型融合了同步轉(zhuǎn)換能力，如今已能出色完成思考任務(wù)。

線束（Harness）：連接一切的“操作系統(tǒng)”。每次上下文處理時，精確路由信息，理解正在發(fā)生的事情，協(xié)調(diào)各組件協(xié)同工作。工作記憶和長期記憶的區(qū)分在這里變得至關(guān)重要。

工具（Tools）：可以是電子表格、網(wǎng)絡(luò)瀏覽器、數(shù)據(jù)處理引擎、數(shù)據(jù)庫引擎、C編譯器、Python解釋器、JavaScript引擎，甚至加速計算庫。每當Agent使用工具時，CPU被調(diào)用處理這些請求。

技能（Skills）：這是黃仁勛特別強調(diào)的突破。技能本質(zhì)上是工具的使用手冊，AI讀取后說“這就是它的使用方法”。英偉達的所有CUDA X庫現(xiàn)在都將配備AI可學習的技能。Agent使用這些庫的能力將遠超人類程序員。

運行時（Runtime）：協(xié)調(diào)所有組件的執(zhí)行環(huán)境。安全控制裝置在CPU和DPU安全處理器上運行，對整個過程進行監(jiān)控。記憶管理是其中最困難的部分——工作記憶類似KV緩存，需要處理壓縮、檢索、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。

Agent的計算是分布式異構(gòu)的。這帶來巨大的技術(shù)挑戰(zhàn)：當計算被分解后，CPU核心之間、CPU與存儲設(shè)備之間、CPU與GPU之間的帶寬成為瓶頸。數(shù)據(jù)在芯片內(nèi)外流動時，不能有三重態(tài)損耗，不能穿越芯片邊界。跨芯片通信延遲必須極低。

Agent的新應(yīng)用程序與過去應(yīng)用程序的運行方式有著本質(zhì)區(qū)別。過去應(yīng)用程序的約束來自操作系統(tǒng)，而Agent的約束來自架構(gòu)本身——分布式計算的特性決定了它必須在異構(gòu)環(huán)境中高效運行。

正是這個異構(gòu)計算問題，促使英偉達開發(fā)了Vera Rubin。

Vera Rubin全面投產(chǎn)，秋季開始發(fā)貨

今天，黃仁勛宣布Vera Rubin 正在加速全面投產(chǎn)，產(chǎn)品將于今年秋季開始發(fā)貨。

Vera Rubin是 NVIDIA 迄今為止規(guī)模最大的 POD 級平臺——五個專用機架組成一個龐大的 AI 超級計算機，專為代理工作負載而設(shè)計。該平臺將Vera Rubin NVL72 系統(tǒng)、 Vera CPU、Groq 3 LPX、 Vera BlueField-4 STX 存儲和 Spectrum-6 SPX 以太網(wǎng)機架整合到一個完全集成的系統(tǒng)中。與上一代 NVIDIA Grace Blackwell 平臺相比，Vera Rubin 的大規(guī)模代理吞吐量提高了 10 倍。

黃仁勛說：“Vera Rubin正是為這一時刻而生——它是一個人工智能工廠引擎，能夠大規(guī)模地提供智能，并具備推動下一輪工業(yè)革命所需的性能、效率和安全性。”

過去組裝一個Grace Blackwell機架需要兩小時，現(xiàn)在只需5分鐘。沒有電纜，沒有軟管，沒有風扇，中間只有一塊PCB連接兩側(cè)。黃仁勛展示這段對比時，語氣里藏不住的得意：“上次我給你看這個的時候花了多少時間，我們到處都是電纜。但現(xiàn)在中間有一塊PCB，連接兩側(cè)的部分。過去需要兩小時完成的事情，現(xiàn)在只需五分鐘。”

不僅是更高的產(chǎn)能，更是AI工廠部署速度的質(zhì)變。更重要的是可靠性提升，沒有線纜就沒有線纜故障的風險。黃仁勛說：“Rubin的可靠性和韌性，將會高得離譜。

頂級系統(tǒng)集成商、基礎(chǔ)設(shè)施軟件和存儲合作伙伴正在全面生產(chǎn)Vera Rubin產(chǎn)品，其中包括戴爾科技、HPE、聯(lián)想和超微，以及AIC、仁寶、富士康、技嘉、英業(yè)達、和碩、廣達云科技（QCT）、緯創(chuàng)資通和Wiwynn等中國臺灣代工巨頭。

Vera Rubin平臺引入了NVIDIA Spectrum-X以太網(wǎng)光子技術(shù)，這是世界上首款基于共封裝光器件（CPO）的交換機，具有200Gb/s SerDes，現(xiàn)已投入生產(chǎn)。

同時，Vera Rubin平臺采用全棧式NVIDIA機密計算技術(shù)，旨在打造機架級可信執(zhí)行環(huán)境。Vera Rubin NVL72將Vera CPU、Rubin GPU、NVIDIA NVLink網(wǎng)絡(luò)和安全功能集成于統(tǒng)一平臺，并通過高速互連加密數(shù)據(jù)。這提供了硬件級認證，確保系統(tǒng)防篡改。

NVIDIA DSX平臺為Vera Rubin人工智能工廠提供了完整的設(shè)計和運營基礎(chǔ)——統(tǒng)一了參考設(shè)計、仿真、基礎(chǔ)設(shè)施軟件、設(shè)施和生態(tài)系統(tǒng)技術(shù)，以幫助構(gòu)建和運營節(jié)能型人工智能工廠，從而實現(xiàn)最低的Token成本。

黃仁勛專門花時間感謝了微軟、戴爾、CoreWeave，因為它們已經(jīng)搭建了Vera Rubin的工程機架。這意味著代工伙伴不再只是生產(chǎn)零部件，它們在幫英偉達驗證整個系統(tǒng)。芯片、散熱、網(wǎng)絡(luò)、存儲全部打通。這才是真正的一站式交付。

Vera CPU：首款為Agent打造的處理器

本次演講中另一個發(fā)布，是英偉達首款專為AI Agent時代打造的處理器：Vera CPU。

黃仁勛提出了一個深刻的問題：過去所有CPU都是為人類設(shè)計的，人類使用CPU的方式是在一個以秒計數(shù)的世界里生活。人類可以等待，可以點擊關(guān)閉彈窗，可以適應(yīng)各種不便。但Agent不一樣。Agent缺乏耐心。它們并非生活在分秒必爭的世界里，它們生活在一個以納秒為單位的世界里。當Agent使用工具時，希望響應(yīng)時間盡可能快。當它訪問數(shù)據(jù)庫時，必須盡快回來。Agent等待的每一刻都會使其無法進入下一步。

這就是為什么需要全新的CPU架構(gòu)。傳統(tǒng)CPU的設(shè)計假設(shè)用戶可以容忍一定的延遲，但Agent的要求完全不同。

在Vera Rubin機架中，Vera CPU承擔著三種關(guān)鍵職責：第一，編排與管理。Vera CPU用于協(xié)調(diào)和管理GPU的工具，管理KV緩存，處理機架中運行的所有軟件。在復雜的Agent工作流程中，這些CPU是整個系統(tǒng)的指揮中心。第二，安全與隔離。通過Vera BlueField，CPU負責安全和隔離功能，確保不同工作負載之間不會相互干擾。第三，線束與入口。Vera CPU用于AI模型的工具使用編排，訪問數(shù)據(jù)庫。

黃仁勛指出了Vera CPU的架構(gòu)設(shè)計圍繞四個關(guān)鍵特性展開：一是單線程性能必須極致；二是每核帶寬必須極致；三是芯片內(nèi)外總帶寬必須極致；四是能效必須極致。

與x86 CPU 相比，Vera任務(wù)完成速度提高了 1.8 倍，可驅(qū)動各行各業(yè)的各種工作負載，包括智能體AI、強化學習和數(shù)據(jù)處理，從而產(chǎn)生更多的數(shù)據(jù)中心代幣收入。黃仁勛還提到了幾個關(guān)鍵數(shù)據(jù)：芯片內(nèi)帶寬達3.6TB/s，無三重態(tài)損耗，無芯片邊界穿越；首款支持PCIe 6.0首款搭載LPDDR5X且?guī)掃_1.2TB/s；88個Olympus內(nèi)核。

黃仁勛說：“這是很長時間以來首款真正達到極限的CPU。”目前，云服務(wù)提供商方面，字節(jié)跳動、CoreWeave、Lambda、Nebius、Nscale和Oracle云基礎(chǔ)設(shè)施（OCI）都已計劃部署Vera CPU。Vera 系統(tǒng)將于今年秋季開始通過系統(tǒng)構(gòu)建商和云合作伙伴提供。

黃仁勛指出了一個根本性的趨勢：“過去我們?yōu)槿祟愔圃炝薈PU。這是一個新市場的開端，一個前所未有的市場。這不會對舊市場造成沖擊，這是一個新市場——智能體的CPU。這個市場肯定會比上一個更大。其原因在于，Agent的數(shù)量將遠遠超過人口數(shù)量。”

AI PC芯片RTX Spark，40年來PC的首次全面革新

本次最重磅的發(fā)布，也是最具消費電子屬性的產(chǎn)品——RTX Spark。

黃仁勛的開場白充滿歷史感：“四十年前Windows開啟了PC時代。四十年后，微軟和英偉達將重塑PC。”

過去四十年，PC的工作方式從未改變——用戶啟動應(yīng)用程序，點擊鼠標，輸入文字。而現(xiàn)在，一個能夠理解你、為你提供幫助的Agent將直接接管你的電腦。你可以和它說話，它可以看著你，你可以讓它幫你重新提交文件，幫你做研究。新的操作系統(tǒng)是舊操作系統(tǒng)加上大型語言模型。在很多方面，這就是現(xiàn)代版的DirectX。它具備輸入輸出能力，理解提示，具備計算機視覺理解能力。

黃仁勛說：“30年來我們所學的一切精華，都凝聚在這一塊芯片中。”

具體看RTX Spark核心規(guī)格：6144 個 CUDA 核心；具備 1 petaflop 的 AI 性能；并通過NVLink-C2C芯片間互連技術(shù)連接到高性能的 20 核Grace CPU；128GB統(tǒng)一內(nèi)存；臺積電3nm工藝；700億晶體管。英偉達與聯(lián)發(fā)科合作開發(fā)了定制CPU設(shè)計，實現(xiàn)了同類最佳的能效、性能和連接性。

RTX Spark筆記本電腦采用全尺寸高端設(shè)計，厚度僅為14毫米，重量僅為3磅，提供14至16英寸多種尺寸選擇。精密加工的鋁合金機身兼具耐用性和簡潔現(xiàn)代的設(shè)計感。配備色彩精準的雙OLED顯示屏，并搭載NVIDIA G-SYNC技術(shù)，可為創(chuàng)意工作和沉浸式游戲帶來驚艷的視覺體驗。

目前，各大硬件廠商紛紛加入RTX Spark陣營，包括華碩、戴爾、惠普、聯(lián)想、微軟Surface和微星在內(nèi)的領(lǐng)先制造商將在今年秋季推出產(chǎn)品，宏碁和技嘉的機型隨后也將推出。黃仁勛激動地宣布：“這是40年來PC產(chǎn)品系列的首次全面革新。我感到無比榮幸，全球100%的PC行業(yè)都已加入我們，共同重塑PC。”

黃仁勛展示了新的路線圖。每一代架構(gòu)，英偉達都將提供一臺臺式電腦、一臺筆記本電腦和一臺工作站。黃仁勛說：“我們有一個路線圖，這對我們來說是一個全新的產(chǎn)品系列。”

芯片設(shè)計進入Agent時代

黃仁勛宣布Cadence和英偉達正合作開發(fā)芯片設(shè)計Agent。

但這次不只是合作，而是真實的生產(chǎn)系統(tǒng)。Cadence使用NVIDIA OpenShell來保護其ChipStack AI超級代理——這是一個完全自主的AI工程師，能夠執(zhí)行芯片設(shè)計和驗證。而英偉達是首個使用ChipStack自主驗證其芯片設(shè)計的客戶。

每塊芯片都始于一系列架構(gòu)規(guī)范，然后翻譯成RTL（芯片設(shè)計的語言）。RTL必須在仿真中進行驗證，一個漏洞可能導致芯片延遲數(shù)月。在英偉達，數(shù)千名工程師每年數(shù)十億計算小時、數(shù)百萬次測試已編寫、運行并調(diào)試，一個周期需要團隊數(shù)周時間來壓縮其節(jié)奏。

現(xiàn)在，這個流程正在被Agent顛覆。Cadence、Dassault Systèmes、Siemens、Synopsys、Flexcompute、Luminary、Neural Concept、nTop、P-1 AI、PhysicsX和Synera等公司率先利用NVIDIA NemoClaw構(gòu)建自主AI工程師。通過將這些任務(wù)委托給始終在線的自主AI工程師，企業(yè)可以將原本需要數(shù)周才能完成的工程周期壓縮到數(shù)小時。

西門子正在將NVIDIA NemoClaw和OpenShell集成到Fuse EDA AI Agent中，這是一個專門構(gòu)建的自主代理，用于規(guī)劃和協(xié)調(diào)半導體、3D集成電路和印刷電路板系統(tǒng)設(shè)計中的多工具工作流程。Synopsys正在與NVIDIA合作，為芯片設(shè)計構(gòu)建始終在線的自主AI工程師，重點是實現(xiàn)完全的工作流程自主性。

Nematron 3 Ultra：重新定義開放模型

在模型層面，黃仁勛發(fā)布了Nematron 3 Ultra，英偉達最新的開放模型系列。

這是一款擁有5500億參數(shù)的混合專家模型，可為編碼、研究和企業(yè)工作流程中的長時間運行Agent提供前沿智能。與同類開放式前沿模型相比，Ultra的推理速度提升高達5倍，成本降低高達30%，使Agent能夠以更低的成本更快地完成任務(wù)。

這是世界上首個基于SSM狀態(tài)空間模型與混合專家系統(tǒng)混合架構(gòu)的模型。這種架構(gòu)意味著什么？黃仁勛說：“我們快速行動，是為了讓你在快速思考時能夠敏捷思考。同樣的成本，更深入的思考。”

更重要的是，英偉達提供的不只是模型，還有完整訓練數(shù)據(jù)、訓練腳本、長時間運行工具。這才是真正的開放模型——不只是給你一個黑盒，而是給你整個訓練流程，讓你能夠復現(xiàn)和微調(diào)。

Nemotron 3 Ultra經(jīng)過后訓練，可用于領(lǐng)先的Agent平臺和工具，包括Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands和OpenCode。CrowdStrike正在使用NVIDIA Nemotron模型為其專用Agent持續(xù)識別、確定優(yōu)先級并修復漏洞和策略配置錯誤。Palantir將NVIDIA Nemotron模型集成到其AI FDE（前沿部署工程師）平臺中，以自主執(zhí)行復雜任務(wù)。

黃仁勛宣布完全致力于Nematron 3的生產(chǎn)，并已經(jīng)在開發(fā)Nematron 4。

英特爾、AMD該慌了嗎？

有人說，英偉達現(xiàn)在就是AI時代的“賣鏟人”。只要AI還在發(fā)展，就離不開英偉達的芯片。這話對了一半。英偉達確實在賣鏟子，但黃仁勛顯然不滿足于此。他要賣的不只是鏟子，而是整套的礦場——從GPU到CPU，從網(wǎng)絡(luò)到存儲，從軟件棧到AI模型。他想把整個AI時代都裝進自己的盒子里。

回顧整個發(fā)布會，今天的CPU和RTX Spark將狠狠沖擊PC市場。

Vera CPU這款芯片的定位非常精準，它不是用來替代你臺式機上的x86處理器，而是為AI工廠場景量身打造。英偉達很清楚自己的邊界在哪里：他們不會去搶消費級CPU市場，因為那沒有意義。Vera CPU的價值在于，它是Vera Rubin整個系統(tǒng)里不可或缺的一環(huán)。所以黃仁勛其實今天一直在強調(diào)，這是“全新的市場”。

再說RTX Spark。這是一個完全不同量級的產(chǎn)品，因為它直接殺進了消費級市場。40年來，PC的核心架構(gòu)沒有本質(zhì)變化：x86處理器加Windows操作系統(tǒng)。但RTX Spark 的筆記本電腦改變了這個公式：英偉達RTX Spark加Windows加Agent。英偉達第一次用自家芯片完整定義了PC的架構(gòu)，而且是從底層到應(yīng)用層的垂直整合。

這對市場的沖擊不只是“又多了一個芯片選擇”那么簡單。它意味著PC的評判標準被重新定義了。過去你看PC看的是主頻、核心數(shù)、內(nèi)存大小；現(xiàn)在你看的是AI算力、統(tǒng)一內(nèi)存容量、本地Agent運行能力。

也就是說，是英偉達正在做的事：用自己開發(fā)的芯片，替代傳統(tǒng)芯片廠商在PC市場的位置。

這種自我顛覆的可怕之處在于，英偉達在GPU市場已經(jīng)是絕對王者，他有能力承擔轉(zhuǎn)型的成本。當他決定進軍CPU市場時，他帶過來的不只是芯片，還有CUDA生態(tài)、開發(fā)者社區(qū)、整套的軟件優(yōu)化。這是任何新進入者都不具備的優(yōu)勢。

*聲明：本文系原作者創(chuàng)作。文章內(nèi)容系其個人觀點，我方轉(zhuǎn)載僅為分享與討論，不代表我方贊成或認同，如有異議，請聯(lián)系后臺。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.