![]()
英偉達發(fā)布個人電腦超級芯片RTX Spark,狠狠沖擊PC市場。
剛剛,英偉達GTC Taipei 2026大會上,黃仁勛身穿標志性的皮衣再次登場。
開場第一句就定調(diào):“兩年前我來這里的時候,開始和你談?wù)揂I的下一波浪潮。今天我可以告訴你,代理式AI已經(jīng)到來,實用性AI已經(jīng)到來(Agentic AI has arrived. That useful AI has arrived.)。”
本次英偉達GTC Taipei 2026大會上,黃仁勛說了六大重點:
第一,Token經(jīng)濟學,Token現(xiàn)在是盈利的單位。芯片便宜不代表你賺了,芯片貴不代表你虧了
第二,Agent架構(gòu)五大核心組件:模型(Model)、線束(Harness)、工具(Tools)、技能(Skills)、運行時組件(Runtime)。
第三,Vera Rubin現(xiàn)在正在全面生產(chǎn)中,秋季開始發(fā)貨。
第四,發(fā)布智能體時代的CPU Vera;與x86 CPU相比,任務(wù)完成速度提高了1.8倍。
第五,發(fā)布個人電腦超級芯片RTX Spark,黃仁勛表示“30年來我們所學的一切精華,都凝聚在這一塊芯片中。
第六,芯片設(shè)計進入Agent時代,和Cadence、西門子、Synopsys等構(gòu)建自主AI工程師。
Token經(jīng)濟學:多買多賺
Token如今成了硅谷、中國臺灣、深圳所有科技從業(yè)者嘴里最熱的詞。黃仁勛說:“Token現(xiàn)在是盈利的單位。每個Token都是收入。AI公司想建更多Token,建更多AI工廠。”
一個1吉瓦的AI工廠項目,起步價200-300億美元。很快會到600億,800億。每吉瓦一百億美元。全球科技巨頭正在瘋狂建設(shè)AI基礎(chǔ)設(shè)施,中國臺灣的計算機廠商最近忙得飛起。黃仁勛在現(xiàn)場對著產(chǎn)業(yè)鏈說:“你們都如此忙碌,(中國臺灣)企業(yè)們做得很好。”這句話背后是整個半導體供應(yīng)鏈的狂歡。
![]()
這就是Token經(jīng)濟學。傳統(tǒng)IT時代,買服務(wù)器是成本,計算是消耗。AI時代,買GPU是投資,計算是收入。黃仁勛直接畫了一條線:芯片便宜不代表你賺了,芯片貴不代表你虧了。選錯架構(gòu)的代價,從未如此高昂。如果你的AI工廠每瓦吞吐量不夠高,你買得越多虧得越多。如果每瓦吞吐量足夠高,你買得越多賺得越多。
![]()
兩年前黃仁勛說下一波是Agent AI。今天他說:“自主性AI已經(jīng)到來,實用性AI已經(jīng)到來”。
黃仁勛給出了一組數(shù)據(jù):GitHub提交次數(shù)從2023年的3億次飆升至2026年的5億次。兩年翻將近兩倍。全球3000萬軟件開發(fā)者,用3萬億美元薪資,創(chuàng)造了9萬億美元生產(chǎn)力。
黃仁勛反駁了AI會導致失業(yè)的說法:“有人說AI會讓程序員失業(yè)。純屬無稽之談。工程師數(shù)量在增加。因為每個工程師能創(chuàng)造三倍產(chǎn)出,企業(yè)當然想招更多。”AI的價值不在于替代,在于放大。它讓每個開發(fā)者、每個企業(yè)的產(chǎn)出能力呈指數(shù)級增長。當每個軟件工程師能創(chuàng)造三倍價值時,企業(yè)沒有理由減少招聘,反而會擴招。這就是黃仁勛看到的未來:生產(chǎn)力革命正在發(fā)生,而且這個革命的速度比任何人預期的都快。
Agent架構(gòu):五大核心組件
過去四十年,計算機的工作模式從未改變:啟動應(yīng)用程序,點擊輸入,等待結(jié)果。Agent時代完全不一樣。用戶只需要描述意圖,AI自動生成代碼或使用工具,產(chǎn)生必要輸出。
在傳統(tǒng)計算中,軟件是一個二進制包,運行在操作系統(tǒng)內(nèi)部,受限于操作系統(tǒng)的調(diào)度和約束。Agent的計算模式是異構(gòu)分布的——模型、線束、工具、技能、運行時分布在數(shù)據(jù)中心的不同位置,由CPU統(tǒng)一協(xié)調(diào)。
![]()
黃仁勛詳細拆解了Agent的五大核心組件:
黃仁勛明確指出:"This agent consists of model, harness, tools and skills, and a runtime."
模型(Model):充當“大腦”,負責理解、觀察、推理、規(guī)劃。大型語言模型融合了同步轉(zhuǎn)換能力,如今已能出色完成思考任務(wù)。
線束(Harness):連接一切的“操作系統(tǒng)”。每次上下文處理時,精確路由信息,理解正在發(fā)生的事情,協(xié)調(diào)各組件協(xié)同工作。工作記憶和長期記憶的區(qū)分在這里變得至關(guān)重要。
工具(Tools):可以是電子表格、網(wǎng)絡(luò)瀏覽器、數(shù)據(jù)處理引擎、數(shù)據(jù)庫引擎、C編譯器、Python解釋器、JavaScript引擎,甚至加速計算庫。每當Agent使用工具時,CPU被調(diào)用處理這些請求。
技能(Skills):這是黃仁勛特別強調(diào)的突破。技能本質(zhì)上是工具的使用手冊,AI讀取后說“這就是它的使用方法”。英偉達的所有CUDA X庫現(xiàn)在都將配備AI可學習的技能。Agent使用這些庫的能力將遠超人類程序員。
運行時(Runtime):協(xié)調(diào)所有組件的執(zhí)行環(huán)境。安全控制裝置在CPU和DPU安全處理器上運行,對整個過程進行監(jiān)控。記憶管理是其中最困難的部分——工作記憶類似KV緩存,需要處理壓縮、檢索、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
Agent的計算是分布式異構(gòu)的。這帶來巨大的技術(shù)挑戰(zhàn):當計算被分解后,CPU核心之間、CPU與存儲設(shè)備之間、CPU與GPU之間的帶寬成為瓶頸。數(shù)據(jù)在芯片內(nèi)外流動時,不能有三重態(tài)損耗,不能穿越芯片邊界。跨芯片通信延遲必須極低。
Agent的新應(yīng)用程序與過去應(yīng)用程序的運行方式有著本質(zhì)區(qū)別。過去應(yīng)用程序的約束來自操作系統(tǒng),而Agent的約束來自架構(gòu)本身——分布式計算的特性決定了它必須在異構(gòu)環(huán)境中高效運行。
正是這個異構(gòu)計算問題,促使英偉達開發(fā)了Vera Rubin。
![]()
Vera Rubin全面投產(chǎn),秋季開始發(fā)貨
今天,黃仁勛宣布Vera Rubin 正在加速全面投產(chǎn),產(chǎn)品將于今年秋季開始發(fā)貨。
Vera Rubin是 NVIDIA 迄今為止規(guī)模最大的 POD 級平臺——五個專用機架組成一個龐大的 AI 超級計算機,專為代理工作負載而設(shè)計。該平臺將Vera Rubin NVL72 系統(tǒng)、 Vera CPU、Groq 3 LPX、 Vera BlueField-4 STX 存儲和 Spectrum-6 SPX 以太網(wǎng)機架整合到一個完全集成的系統(tǒng)中。與上一代 NVIDIA Grace Blackwell 平臺相比,Vera Rubin 的大規(guī)模代理吞吐量提高了 10 倍。
![]()
黃仁勛說:“Vera Rubin正是為這一時刻而生——它是一個人工智能工廠引擎,能夠大規(guī)模地提供智能,并具備推動下一輪工業(yè)革命所需的性能、效率和安全性。”
過去組裝一個Grace Blackwell機架需要兩小時,現(xiàn)在只需5分鐘。沒有電纜,沒有軟管,沒有風扇,中間只有一塊PCB連接兩側(cè)。黃仁勛展示這段對比時,語氣里藏不住的得意:“上次我給你看這個的時候花了多少時間,我們到處都是電纜。但現(xiàn)在中間有一塊PCB,連接兩側(cè)的部分。過去需要兩小時完成的事情,現(xiàn)在只需五分鐘。”
![]()
不僅是更高的產(chǎn)能,更是AI工廠部署速度的質(zhì)變。更重要的是可靠性提升,沒有線纜就沒有線纜故障的風險。黃仁勛說:“Rubin的可靠性和韌性,將會高得離譜。
頂級系統(tǒng)集成商、基礎(chǔ)設(shè)施軟件和存儲合作伙伴正在全面生產(chǎn)Vera Rubin產(chǎn)品,其中包括戴爾科技、HPE、聯(lián)想和超微,以及AIC、仁寶、富士康、技嘉、英業(yè)達、和碩、廣達云科技(QCT)、緯創(chuàng)資通和Wiwynn等中國臺灣代工巨頭。
Vera Rubin平臺引入了NVIDIA Spectrum-X以太網(wǎng)光子技術(shù),這是世界上首款基于共封裝光器件(CPO)的交換機,具有200Gb/s SerDes,現(xiàn)已投入生產(chǎn)。
同時,Vera Rubin平臺采用全棧式NVIDIA機密計算技術(shù),旨在打造機架級可信執(zhí)行環(huán)境。Vera Rubin NVL72將Vera CPU、Rubin GPU、NVIDIA NVLink網(wǎng)絡(luò)和安全功能集成于統(tǒng)一平臺,并通過高速互連加密數(shù)據(jù)。這提供了硬件級認證,確保系統(tǒng)防篡改。
NVIDIA DSX平臺為Vera Rubin人工智能工廠提供了完整的設(shè)計和運營基礎(chǔ)——統(tǒng)一了參考設(shè)計、仿真、基礎(chǔ)設(shè)施軟件、設(shè)施和生態(tài)系統(tǒng)技術(shù),以幫助構(gòu)建和運營節(jié)能型人工智能工廠,從而實現(xiàn)最低的Token成本。
![]()
黃仁勛專門花時間感謝了微軟、戴爾、CoreWeave,因為它們已經(jīng)搭建了Vera Rubin的工程機架。這意味著代工伙伴不再只是生產(chǎn)零部件,它們在幫英偉達驗證整個系統(tǒng)。芯片、散熱、網(wǎng)絡(luò)、存儲全部打通。這才是真正的一站式交付。
Vera CPU:首款為Agent打造的處理器
本次演講中另一個發(fā)布,是英偉達首款專為AI Agent時代打造的處理器:Vera CPU。
黃仁勛提出了一個深刻的問題:過去所有CPU都是為人類設(shè)計的,人類使用CPU的方式是在一個以秒計數(shù)的世界里生活。人類可以等待,可以點擊關(guān)閉彈窗,可以適應(yīng)各種不便。但Agent不一樣。Agent缺乏耐心。它們并非生活在分秒必爭的世界里,它們生活在一個以納秒為單位的世界里。當Agent使用工具時,希望響應(yīng)時間盡可能快。當它訪問數(shù)據(jù)庫時,必須盡快回來。Agent等待的每一刻都會使其無法進入下一步。
這就是為什么需要全新的CPU架構(gòu)。傳統(tǒng)CPU的設(shè)計假設(shè)用戶可以容忍一定的延遲,但Agent的要求完全不同。
![]()
在Vera Rubin機架中,Vera CPU承擔著三種關(guān)鍵職責:第一,編排與管理。Vera CPU用于協(xié)調(diào)和管理GPU的工具,管理KV緩存,處理機架中運行的所有軟件。在復雜的Agent工作流程中,這些CPU是整個系統(tǒng)的指揮中心。第二,安全與隔離。通過Vera BlueField,CPU負責安全和隔離功能,確保不同工作負載之間不會相互干擾。第三,線束與入口。Vera CPU用于AI模型的工具使用編排,訪問數(shù)據(jù)庫。
黃仁勛指出了Vera CPU的架構(gòu)設(shè)計圍繞四個關(guān)鍵特性展開:一是單線程性能必須極致;二是每核帶寬必須極致;三是芯片內(nèi)外總帶寬必須極致;四是能效必須極致。
![]()
與x86 CPU 相比,Vera任務(wù)完成速度提高了 1.8 倍,可驅(qū)動各行各業(yè)的各種工作負載,包括智能體AI、強化學習和數(shù)據(jù)處理,從而產(chǎn)生更多的數(shù)據(jù)中心代幣收入。黃仁勛還提到了幾個關(guān)鍵數(shù)據(jù):芯片內(nèi)帶寬達3.6TB/s,無三重態(tài)損耗,無芯片邊界穿越;首款支持PCIe 6.0首款搭載LPDDR5X且?guī)掃_1.2TB/s;88個Olympus內(nèi)核。
![]()
黃仁勛說:“這是很長時間以來首款真正達到極限的CPU。”目前,云服務(wù)提供商方面,字節(jié)跳動、CoreWeave、Lambda、Nebius、Nscale和Oracle云基礎(chǔ)設(shè)施(OCI)都已計劃部署Vera CPU。Vera 系統(tǒng)將于今年秋季開始通過系統(tǒng)構(gòu)建商和云合作伙伴提供。
黃仁勛指出了一個根本性的趨勢:“過去我們?yōu)槿祟愔圃炝薈PU。這是一個新市場的開端,一個前所未有的市場。這不會對舊市場造成沖擊,這是一個新市場——智能體的CPU。這個市場肯定會比上一個更大。其原因在于,Agent的數(shù)量將遠遠超過人口數(shù)量。”
AI PC芯片RTX Spark,40年來PC的首次全面革新
本次最重磅的發(fā)布,也是最具消費電子屬性的產(chǎn)品——RTX Spark。
黃仁勛的開場白充滿歷史感:“四十年前Windows開啟了PC時代。四十年后,微軟和英偉達將重塑PC。”
![]()
![]()
過去四十年,PC的工作方式從未改變——用戶啟動應(yīng)用程序,點擊鼠標,輸入文字。而現(xiàn)在,一個能夠理解你、為你提供幫助的Agent將直接接管你的電腦。你可以和它說話,它可以看著你,你可以讓它幫你重新提交文件,幫你做研究。新的操作系統(tǒng)是舊操作系統(tǒng)加上大型語言模型。在很多方面,這就是現(xiàn)代版的DirectX。它具備輸入輸出能力,理解提示,具備計算機視覺理解能力。
![]()
黃仁勛說:“30年來我們所學的一切精華,都凝聚在這一塊芯片中。”
具體看RTX Spark核心規(guī)格:6144 個 CUDA 核心;具備 1 petaflop 的 AI 性能;并通過NVLink-C2C芯片間互連技術(shù)連接到高性能的 20 核Grace CPU;128GB統(tǒng)一內(nèi)存;臺積電3nm工藝;700億晶體管。英偉達與聯(lián)發(fā)科合作開發(fā)了定制CPU設(shè)計,實現(xiàn)了同類最佳的能效、性能和連接性。
RTX Spark筆記本電腦采用全尺寸高端設(shè)計,厚度僅為14毫米,重量僅為3磅,提供14至16英寸多種尺寸選擇。精密加工的鋁合金機身兼具耐用性和簡潔現(xiàn)代的設(shè)計感。配備色彩精準的雙OLED顯示屏,并搭載NVIDIA G-SYNC技術(shù),可為創(chuàng)意工作和沉浸式游戲帶來驚艷的視覺體驗。
![]()
目前,各大硬件廠商紛紛加入RTX Spark陣營,包括華碩、戴爾、惠普、聯(lián)想、微軟Surface和微星在內(nèi)的領(lǐng)先制造商將在今年秋季推出產(chǎn)品,宏碁和技嘉的機型隨后也將推出。黃仁勛激動地宣布:“這是40年來PC產(chǎn)品系列的首次全面革新。我感到無比榮幸,全球100%的PC行業(yè)都已加入我們,共同重塑PC。”
![]()
黃仁勛展示了新的路線圖。每一代架構(gòu),英偉達都將提供一臺臺式電腦、一臺筆記本電腦和一臺工作站。黃仁勛說:“我們有一個路線圖,這對我們來說是一個全新的產(chǎn)品系列。”
芯片設(shè)計進入Agent時代
黃仁勛宣布Cadence和英偉達正合作開發(fā)芯片設(shè)計Agent。
但這次不只是合作,而是真實的生產(chǎn)系統(tǒng)。Cadence使用NVIDIA OpenShell來保護其ChipStack AI超級代理——這是一個完全自主的AI工程師,能夠執(zhí)行芯片設(shè)計和驗證。而英偉達是首個使用ChipStack自主驗證其芯片設(shè)計的客戶。
每塊芯片都始于一系列架構(gòu)規(guī)范,然后翻譯成RTL(芯片設(shè)計的語言)。RTL必須在仿真中進行驗證,一個漏洞可能導致芯片延遲數(shù)月。在英偉達,數(shù)千名工程師每年數(shù)十億計算小時、數(shù)百萬次測試已編寫、運行并調(diào)試,一個周期需要團隊數(shù)周時間來壓縮其節(jié)奏。
![]()
現(xiàn)在,這個流程正在被Agent顛覆。Cadence、Dassault Systèmes、Siemens、Synopsys、Flexcompute、Luminary、Neural Concept、nTop、P-1 AI、PhysicsX和Synera等公司率先利用NVIDIA NemoClaw構(gòu)建自主AI工程師。通過將這些任務(wù)委托給始終在線的自主AI工程師,企業(yè)可以將原本需要數(shù)周才能完成的工程周期壓縮到數(shù)小時。
西門子正在將NVIDIA NemoClaw和OpenShell集成到Fuse EDA AI Agent中,這是一個專門構(gòu)建的自主代理,用于規(guī)劃和協(xié)調(diào)半導體、3D集成電路和印刷電路板系統(tǒng)設(shè)計中的多工具工作流程。Synopsys正在與NVIDIA合作,為芯片設(shè)計構(gòu)建始終在線的自主AI工程師,重點是實現(xiàn)完全的工作流程自主性。
Nematron 3 Ultra:重新定義開放模型
在模型層面,黃仁勛發(fā)布了Nematron 3 Ultra,英偉達最新的開放模型系列。
這是一款擁有5500億參數(shù)的混合專家模型,可為編碼、研究和企業(yè)工作流程中的長時間運行Agent提供前沿智能。與同類開放式前沿模型相比,Ultra的推理速度提升高達5倍,成本降低高達30%,使Agent能夠以更低的成本更快地完成任務(wù)。
這是世界上首個基于SSM狀態(tài)空間模型與混合專家系統(tǒng)混合架構(gòu)的模型。這種架構(gòu)意味著什么?黃仁勛說:“我們快速行動,是為了讓你在快速思考時能夠敏捷思考。同樣的成本,更深入的思考。”
更重要的是,英偉達提供的不只是模型,還有完整訓練數(shù)據(jù)、訓練腳本、長時間運行工具。這才是真正的開放模型——不只是給你一個黑盒,而是給你整個訓練流程,讓你能夠復現(xiàn)和微調(diào)。
Nemotron 3 Ultra經(jīng)過后訓練,可用于領(lǐng)先的Agent平臺和工具,包括Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands和OpenCode。CrowdStrike正在使用NVIDIA Nemotron模型為其專用Agent持續(xù)識別、確定優(yōu)先級并修復漏洞和策略配置錯誤。Palantir將NVIDIA Nemotron模型集成到其AI FDE(前沿部署工程師)平臺中,以自主執(zhí)行復雜任務(wù)。
黃仁勛宣布完全致力于Nematron 3的生產(chǎn),并已經(jīng)在開發(fā)Nematron 4。
英特爾、AMD該慌了嗎?
有人說,英偉達現(xiàn)在就是AI時代的“賣鏟人”。只要AI還在發(fā)展,就離不開英偉達的芯片。這話對了一半。英偉達確實在賣鏟子,但黃仁勛顯然不滿足于此。他要賣的不只是鏟子,而是整套的礦場——從GPU到CPU,從網(wǎng)絡(luò)到存儲,從軟件棧到AI模型。他想把整個AI時代都裝進自己的盒子里。
回顧整個發(fā)布會,今天的CPU和RTX Spark將狠狠沖擊PC市場。
Vera CPU這款芯片的定位非常精準,它不是用來替代你臺式機上的x86處理器,而是為AI工廠場景量身打造。英偉達很清楚自己的邊界在哪里:他們不會去搶消費級CPU市場,因為那沒有意義。Vera CPU的價值在于,它是Vera Rubin整個系統(tǒng)里不可或缺的一環(huán)。所以黃仁勛其實今天一直在強調(diào),這是“全新的市場”。
再說RTX Spark。這是一個完全不同量級的產(chǎn)品,因為它直接殺進了消費級市場。40年來,PC的核心架構(gòu)沒有本質(zhì)變化:x86處理器加Windows操作系統(tǒng)。但RTX Spark 的筆記本電腦改變了這個公式:英偉達RTX Spark加Windows加Agent。英偉達第一次用自家芯片完整定義了PC的架構(gòu),而且是從底層到應(yīng)用層的垂直整合。
這對市場的沖擊不只是“又多了一個芯片選擇”那么簡單。它意味著PC的評判標準被重新定義了。過去你看PC看的是主頻、核心數(shù)、內(nèi)存大小;現(xiàn)在你看的是AI算力、統(tǒng)一內(nèi)存容量、本地Agent運行能力。
也就是說,是英偉達正在做的事:用自己開發(fā)的芯片,替代傳統(tǒng)芯片廠商在PC市場的位置。
這種自我顛覆的可怕之處在于,英偉達在GPU市場已經(jīng)是絕對王者,他有能力承擔轉(zhuǎn)型的成本。當他決定進軍CPU市場時,他帶過來的不只是芯片,還有CUDA生態(tài)、開發(fā)者社區(qū)、整套的軟件優(yōu)化。這是任何新進入者都不具備的優(yōu)勢。
*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個人觀點,我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯(lián)系后臺。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.