亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

2.5小時(shí)的GTC 2026 Keynote,黃仁勛說(shuō)了什么?

0
分享至

圣何塞McEnery會(huì)議中心的GTC 2026開(kāi)幕式上,已經(jīng)進(jìn)行了2小時(shí)直播的黃仁勛依然經(jīng)歷旺盛,快步走向被受矚目的GTC 2026 Keynote主舞臺(tái),開(kāi)啟了長(zhǎng)達(dá)2個(gè)半小時(shí)的開(kāi)幕演講。此刻N(yùn)VIDIA關(guān)于AI的訂單量,已經(jīng)從2025年的5000億美元,來(lái)到了現(xiàn)在的萬(wàn)億級(jí)美元,近乎翻倍的增長(zhǎng)也預(yù)示了未來(lái)一段時(shí)間,這家專注生產(chǎn)AI工具的公司,將如何構(gòu)建未來(lái)AI市場(chǎng)的走向。



現(xiàn)在不妨讓我們花點(diǎn)篇幅,一起聊聊在將近2個(gè)半小時(shí)的GTC 2026開(kāi)場(chǎng)Keynote中,黃仁勛說(shuō)了什么。



Token就是一切

當(dāng)“I AM AI”主題變成Token,行業(yè)對(duì)AI的最終需求變得簡(jiǎn)單直接。黃仁勛表示,在過(guò)去2年中,AI經(jīng)歷了三次范式轉(zhuǎn)移,導(dǎo)致計(jì)算需求呈指數(shù)級(jí)爆發(fā)。即:

2023年前后的ChatGPT時(shí)刻。AI從"感知理解"升級(jí)到"翻譯生成",能夠創(chuàng)造獨(dú)特內(nèi)容;

2023年到2024年的OpenAI o1時(shí)刻。推理AI誕生,AI學(xué)會(huì)"反思、思考、自我對(duì)話、規(guī)劃",將問(wèn)題分解為可理解的步驟,基于研究事實(shí)進(jìn)行 grounded truth 推理;

最后是當(dāng)下的Claude Code時(shí)刻。AI Agent智能體出現(xiàn),AI能夠閱讀文件、編寫(xiě)代碼、編譯測(cè)試、評(píng)估迭代,完成實(shí)際的工程任務(wù)。



三個(gè)關(guān)鍵范式轉(zhuǎn)移,導(dǎo)致所有的算力數(shù)字井噴爆發(fā)。推理和代理任務(wù)使單任務(wù)計(jì)算需求增加約 1萬(wàn)倍,AI應(yīng)用增長(zhǎng)超過(guò)100倍,過(guò)去兩年總計(jì)算需求增加約100萬(wàn)倍。數(shù)據(jù)中心也因此由傳統(tǒng)的數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù),變成AI工廠。

黃仁勛將AI工廠稱為T(mén)oken工廠(Token Factory),未來(lái)每一家企業(yè)實(shí)際上運(yùn)營(yíng)的一個(gè)由Token驅(qū)動(dòng)的數(shù)據(jù)工廠。每個(gè)AI工廠由于受限于物理電力,會(huì)把Token打包成不同的商品,按照質(zhì)量、速度分層進(jìn)行定價(jià)。例如免費(fèi)的Token用低速提供基礎(chǔ)問(wèn)答,高階的Token服務(wù)可以完成極速推理和復(fù)雜研究。



這時(shí)候AI工廠收入將會(huì)從兩個(gè)緯度進(jìn)行平衡,即使吞吐量(Throughput),每瓦特電力產(chǎn)生的Token數(shù)量;智能度(Intelligence),指Token生成速度。這里黃仁勛引用Grace Blackwell作為參考,相比Hopper架構(gòu),Blackwell在免費(fèi)層提升吞吐量35倍,對(duì)于高價(jià)值的編碼、工程推理,性能則可以提升35倍以上。

NVIDIA將2025年稱為推理之年,推理是AI計(jì)算的終極難點(diǎn),它將直接決定公司的收入。而推理與訓(xùn)練是由本質(zhì)區(qū)別的。訓(xùn)練是一次性大規(guī)模計(jì)算,追求峰值算力。推理是持續(xù)性、低延遲、高并發(fā)服務(wù),追求每美元Token成本和每瓦特Token產(chǎn)出。

為實(shí)現(xiàn)極致推理效率,NVIDIA開(kāi)發(fā)了Dynamo AI工廠操作系統(tǒng),能夠輕松在Vera Rubin和Groq之間智能調(diào)度任務(wù),支持萬(wàn)億參數(shù)模型的KV Cache管理和多層級(jí)服務(wù)品質(zhì)(QoS)的混合部署。



有意思的是,Token也延伸出新的經(jīng)濟(jì)學(xué)和企業(yè)預(yù)算科目,未來(lái)每家企業(yè)都同時(shí)是Token消費(fèi)者和Token制造商,這意味著企業(yè)即自己消耗Token,同時(shí)也通過(guò)Token對(duì)外提供服務(wù)。

Token也帶來(lái)了計(jì)算范式的根本轉(zhuǎn)變,舊范式的檢索式計(jì)算本質(zhì)上是存儲(chǔ)已有信息,按需調(diào)用,通過(guò)數(shù)據(jù)庫(kù)查詢、文件系統(tǒng)、網(wǎng)頁(yè)瀏覽來(lái)實(shí)現(xiàn)。AI新范式則是直接生成答案而非檢索,每次查詢都涉及實(shí)時(shí)推理、合成、創(chuàng)造,這解釋了為何計(jì)算需求呈百萬(wàn)倍增長(zhǎng),AI不是在查找信息,而是在思考答案。

面對(duì)萬(wàn)億美元級(jí)別的AI基礎(chǔ)設(shè)施投資,黃仁勛強(qiáng)調(diào)NVIDIA架構(gòu)的核心優(yōu)勢(shì)在于,NVIDIA是唯一支持AI全生命周期(訓(xùn)練、后訓(xùn)練、推理)的平臺(tái),同時(shí)NVIDIA也是唯一同時(shí)支持語(yǔ)言、生物學(xué)、計(jì)算機(jī)圖形、物理仿真、機(jī)器人等多模態(tài)AI的架構(gòu)的公司。



Vera Rubin架構(gòu):下一代AI基礎(chǔ)設(shè)施

接下來(lái)就是黃仁勛的帶貨環(huán)節(jié)。Vera Rubin并非簡(jiǎn)單的芯片升級(jí),而是針對(duì)Agentic AI工作負(fù)載的端到端系統(tǒng)重構(gòu)。黃仁勛強(qiáng)調(diào),傳統(tǒng)數(shù)據(jù)中心架構(gòu)已無(wú)法滿足AI代理的需求,Agentic AI的三大系統(tǒng)壓力,包括思考計(jì)算(Thinking)、內(nèi)存墻(Memory Wall)和工具(Tool)的使用問(wèn)題。



新生的AI應(yīng)用帶來(lái)了大語(yǔ)言模型規(guī)模持續(xù)膨脹,進(jìn)而需要生成更多Token,這對(duì)算力有很高的要求。KV Cache、結(jié)構(gòu)化數(shù)據(jù)(cuDF)、非結(jié)構(gòu)化數(shù)據(jù)(cuVS)對(duì)存儲(chǔ)系統(tǒng)則是對(duì)內(nèi)存墻產(chǎn)生了絕大的壓力。與此同時(shí),AI需要以極快速度訪問(wèn)工具,包括瀏覽器、虛擬PC、數(shù)據(jù)庫(kù)等等,合適的工具也同等重要。

Vera Rubin厲害的地方在于,將計(jì)算、內(nèi)存、網(wǎng)絡(luò)、冷卻、供電整合為單一巨型系統(tǒng),通過(guò)端到端協(xié)同優(yōu)化實(shí)現(xiàn)物理極限性能,以解決傳統(tǒng)數(shù)據(jù)中心架構(gòu)無(wú)法滿足Agentic AI系統(tǒng)范式所帶來(lái)的壓力。

目前Agentic AI的系統(tǒng)壓力可以分成三個(gè):

思考計(jì)算(Thinking):大語(yǔ)言模型規(guī)模持續(xù)膨脹,需要生成更多Token且速度更快;

內(nèi)存墻(Memory Wall):KV Cache、結(jié)構(gòu)化數(shù)據(jù)cuDF、非結(jié)構(gòu)化數(shù)據(jù)cuVS對(duì)存儲(chǔ)系統(tǒng)造成了成噸的壓力;

工具使用(Tool Use):AI需要以極快速度訪問(wèn)工具,包括瀏覽器、虛擬PC、數(shù)據(jù)庫(kù)等場(chǎng)景。AI應(yīng)用場(chǎng)景中,工具越快的被調(diào)用,體驗(yàn)就越好。



順帶一提,Agentic AI雖然也可以翻譯成智能體AI或者代理式AI,但與PC端的AI智能體小龍蝦不同,前者為AI系統(tǒng)架構(gòu),后者為具體的落地應(yīng)用。

Vera Rubin單一巨型系統(tǒng),即第六代NVLink 72使用了100%的45℃溫水液冷設(shè)計(jì),通過(guò)冷卻液直接將熱量帶走,無(wú)需復(fù)雜的空調(diào)系統(tǒng)設(shè)計(jì)。同時(shí)由于省略的銅纜設(shè)計(jì),通過(guò)預(yù)配置連接,服務(wù)器的安裝時(shí)間從2天壓縮到了2小時(shí)。



與之前Grace Hopper一樣,Vera為專用CPU的代號(hào),這是NVIDIA首次推出專為AI優(yōu)化的數(shù)據(jù)中心CPU,也是全球唯一使用LPDDR5內(nèi)存的數(shù)據(jù)中心CPU,在低功耗表現(xiàn)上會(huì)亮眼很多。通過(guò)提升CPU單線程性能,AI工具也能獲得更快的響應(yīng)速度,配合超高I/O帶寬,處理AI Agent智能體的頻繁數(shù)據(jù)訪問(wèn)請(qǐng)求也更為輕松。



當(dāng)然搭配72個(gè) Vera Rubin,并非NVLink 72的極限。通過(guò)Spectrum-X共封裝光學(xué)(CPO)交換機(jī)設(shè)計(jì),將光學(xué)器件直接封裝在交換機(jī)芯片上,電子信號(hào)直接轉(zhuǎn)換成光信號(hào),無(wú)需外部光模塊,同時(shí)也可以將NVLink擴(kuò)展至576個(gè)GPU,即NVLink 576。

一旦涉及海量GPU部署,一套合適的機(jī)架就顯得相當(dāng)重要了。相對(duì)于標(biāo)準(zhǔn)的Vera Rubin只需要傳統(tǒng)的水平劃入式機(jī)架,雙GPU組合的Vera Rubin Ultra需要Kyber機(jī)架支持,GPU會(huì)垂直插入,最多支持144個(gè)GPU,從而實(shí)現(xiàn)單域NVLink 144。



再多的Rubin GPU,這套AI超算還是有物理極限的。特別是當(dāng)AI服務(wù)需要超高頻Token生成完成實(shí)時(shí)編碼、高頻交易或者交互式AI的時(shí)候,GPU架構(gòu)本身并不能完成低延遲解碼,這是大規(guī)模并行架構(gòu)本身缺陷決定的。這時(shí)候就需要專門(mén)優(yōu)化單線程Token生成速度作為確定性數(shù)據(jù)流架構(gòu)彌補(bǔ)空缺,Groq應(yīng)運(yùn)而生。

Groq團(tuán)隊(duì)屬于谷歌TPU團(tuán)隊(duì)離職后的二次創(chuàng)業(yè),雖然名義上是獨(dú)立運(yùn)作公司,但目前通過(guò)NVIDIA資產(chǎn)收購(gòu)和人才收購(gòu),在2025年末實(shí)現(xiàn)了與NVIDIA深度綁定。



Vera Rubin成為了首個(gè)融入Groq并實(shí)現(xiàn)任務(wù)解耦的平臺(tái)。Rubin負(fù)責(zé)預(yù)處理、Attention計(jì)算和KV Cache存儲(chǔ)任務(wù),適合高吞吐矩陣計(jì)算和大容量HBM內(nèi)存環(huán)境使用。Groq負(fù)責(zé)Decode Token生成、低延遲推理,在確定性數(shù)據(jù)流、超大SRAM和靜態(tài)編譯調(diào)度中使用。NVIDIA會(huì)通過(guò)Dynamo操作系統(tǒng)對(duì)兩者進(jìn)行調(diào)度。

Groq的靜態(tài)編譯調(diào)度消除了GPU的動(dòng)態(tài)開(kāi)銷,也很好的突破了內(nèi)存墻,突破萬(wàn)億參數(shù)模型的物理限制,通過(guò)Groq的存儲(chǔ)模型權(quán)重,用SRAM完成權(quán)重的快速訪問(wèn)。這樣的收益是非常明顯的,相比純Rubin GPU計(jì)算,Groq加入之后可以獲得35倍的性能提升。通過(guò)專用的以太網(wǎng)絡(luò),兩者的協(xié)同延遲可以降低50%。

在部署策略上,黃仁勛建議AI工廠可以考慮75%為Vera Rubin用來(lái)處理高吞吐工作負(fù)載,剩下的25%為Groq,用來(lái)處理高價(jià)值、低延遲任務(wù)。Groq加入是NVIDIA從訓(xùn)練、吞吐轉(zhuǎn)向全Spectrum推理的關(guān)鍵一步,無(wú)論是經(jīng)濟(jì)、技術(shù)還是系統(tǒng)層面,都是非常重要的。目前Groq LP30由三星代工打造,在2026Q3就會(huì)大規(guī)模出貨。與此同時(shí),Groq LP40也已經(jīng)在NVIDIA參與下開(kāi)發(fā),下一代Feynman架構(gòu)將由GPU、Groq LP40、Rosa CPU、Blue Field DPU和CX10存儲(chǔ)平臺(tái)實(shí)現(xiàn),并同時(shí)支持銅纜擴(kuò)展和共封裝光學(xué)擴(kuò)展,從而實(shí)現(xiàn)NVLink 144和NVLink 576大規(guī)模GPU集群擴(kuò)展。



黃仁勛表示,目前NVIDIA已經(jīng)能夠支持萬(wàn)億美元級(jí)基礎(chǔ)設(shè)施的供應(yīng)鏈,每周可生產(chǎn)數(shù)千個(gè)機(jī)架系統(tǒng),相當(dāng)于每月可以生產(chǎn)出數(shù)個(gè)GigaWatts級(jí)別功耗的AI工廠,GB300機(jī)架還能與Vera Rubin機(jī)架并行生產(chǎn),可根據(jù)供需調(diào)整,相互之間不會(huì)因此影響產(chǎn)能。

從數(shù)字到物理世界

黃仁勛明確講AI智能體(AI Agent)分成了兩種形態(tài),一種是數(shù)字智能體(Digital Agents),在數(shù)字世界中感知、推理和行動(dòng),比如編寫(xiě)代碼、處理數(shù)據(jù);另一種是物理智能體(Physical Agents),也就是機(jī)器人在物理世界中感知、推理和行動(dòng)。

后者的物理AI(Physical AI)需要理解物理定律,比如重力、摩擦力、材料特性等等。因此物理AI需要處理真實(shí)世界的海量多樣性、不可預(yù)測(cè)性和邊緣情況,這是在虛擬世界不存在的不確定因素。海量的物理特性不可能僅依靠真實(shí)數(shù)據(jù)訓(xùn)練,必須依賴合成數(shù)據(jù)生成和高保真仿真,這也是物理AI的核心。



目前NVIDIA已經(jīng)為機(jī)器人產(chǎn)業(yè)構(gòu)建了完整的端到端基礎(chǔ)設(shè)施,包括負(fù)責(zé)訓(xùn)練計(jì)算的NVIDIA DGX、Cosmos世界模型;負(fù)責(zé)合成數(shù)據(jù)生成與仿真的Isaac Lab、Omniverse;以及機(jī)器人嵌入式Jetson Thor,實(shí)現(xiàn)機(jī)器人內(nèi)部的實(shí)時(shí)推理。

這時(shí)候自動(dòng)駕駛成為了物理AI的首個(gè)大規(guī)模落地場(chǎng)景。NVIDIA與Robotaxi-Ready平臺(tái)合作,在比亞迪、日產(chǎn)、捷豹路虎、本次、豐田、通用幫助下,現(xiàn)在已經(jīng)具備每年生產(chǎn)1800萬(wàn)輛Robotaxi的能力,通過(guò)與Uber合作,可以將多個(gè)城市的出租車網(wǎng)絡(luò)接入其中,快速構(gòu)建一套適合自動(dòng)駕駛物理AI的應(yīng)用場(chǎng)景。



在現(xiàn)場(chǎng),黃仁勛展示了通過(guò)NVIDIA Alvin解釋車輛自動(dòng)駕駛過(guò)程中的決策過(guò)程,讓自動(dòng)駕駛變得更有邏輯可言。在CES2026上,這套運(yùn)作方式已經(jīng)成功讓奔馳測(cè)試車型輕松穿梭在舊金山的都市街道中。

自動(dòng)駕駛僅是其中之一。在工業(yè)機(jī)器人和制造業(yè)領(lǐng)域,物理AI能夠涵蓋ABB、卡特彼勒這樣的種公羊,在富士康這樣的電子制造行業(yè)中,通過(guò)Isaac Lab微調(diào)GROOT模型用于產(chǎn)線,或者使用Isaac Lab進(jìn)行訓(xùn)練和數(shù)據(jù)生成,亦或者使用Isaac Lab和Cosmos生成手術(shù)室輔助機(jī)器人訓(xùn)練數(shù)據(jù),讓醫(yī)療機(jī)器人成為可能。

物理AI甚至可以通過(guò)仿真平臺(tái)解決數(shù)據(jù)難題,因?yàn)檎鎸?shí)世界數(shù)據(jù)永遠(yuǎn)無(wú)法覆蓋所有場(chǎng)景,AI生成數(shù)據(jù)+物理仿真到時(shí)有機(jī)會(huì)解決這一點(diǎn)。

因此NVIDIA構(gòu)建了三項(xiàng)技術(shù)給物理AI提供支持,即Isaac Lab、Cosmos 世界模型和GR00T 開(kāi)放機(jī)器人基礎(chǔ)模型。



Isaac Lab是一套開(kāi)源、可擴(kuò)展、GPU加速的可微分物理仿真平臺(tái),開(kāi)發(fā)者可預(yù)訓(xùn)練世界基礎(chǔ)模型,使用互聯(lián)網(wǎng)規(guī)模視頻和人類演示,Isaac Lab本身也支持經(jīng)典仿真和神經(jīng)仿真混合使用,能夠與Cosmos世界模型和很好的融合,最終生成大規(guī)模合成數(shù)據(jù)和訓(xùn)練策略。

Cosmos 世界模型則用于神經(jīng)仿真(Neural Simulation),生成符合物理規(guī)律的虛擬環(huán)境,用于替代傳統(tǒng)基于規(guī)則的物理引擎,AI學(xué)習(xí)物理世界的內(nèi)在規(guī)律。

GR00T則是開(kāi)放的機(jī)器人推理與動(dòng)作生成模型,類似LLM的功能,負(fù)責(zé)理解指令、規(guī)劃動(dòng)作、控制執(zhí)行。這是NVIDIA推出的全球首個(gè)開(kāi)放式人形機(jī)器人基礎(chǔ)模型(Foundation Model),旨在為通用人形機(jī)器人提供推理和控制能力,被黃仁勛稱為"機(jī)器人領(lǐng)域的ChatGPT時(shí)刻"。



本質(zhì)上,GR00T是一個(gè)視覺(jué)-語(yǔ)言-動(dòng)作(VLA)模型,能夠理解自然語(yǔ)言指令、感知視覺(jué)環(huán)境,并生成精確的機(jī)器人動(dòng)作。其架構(gòu)設(shè)計(jì)靈感源自人類認(rèn)知的雙系統(tǒng)理論,系統(tǒng)一為快速動(dòng)作模型,負(fù)責(zé)直覺(jué)式的反應(yīng)和實(shí)時(shí)控制,系統(tǒng)二為慢速推理模型,基于視覺(jué)語(yǔ)言模型(VLM)進(jìn)行深思熟慮的決策。模型通過(guò)擴(kuò)散變換器(Diffusion Transformer)頭部對(duì)連續(xù)動(dòng)作進(jìn)行降噪處理,將高層指令轉(zhuǎn)化為低層機(jī)械控制信號(hào)。



在2025年3月份,NVIDIA發(fā)布了首個(gè)版本GR00T N1,目前版本是GR00T N1.7,并計(jì)劃在今年底升級(jí)到GR00T N2。GR00T通過(guò)結(jié)合多種數(shù)據(jù)來(lái)源以解決真實(shí)機(jī)器人數(shù)據(jù)稀缺的問(wèn)題,同時(shí)能夠加入陣營(yíng)中的機(jī)器人數(shù)量越多自然越好。在GTC 2026現(xiàn)場(chǎng)展示了110款對(duì)應(yīng)的機(jī)器人,涵蓋了全球范圍內(nèi)的所有主要機(jī)器人制造商。同時(shí)也包括了人形機(jī)器人、工業(yè)機(jī)器人臂、自主移動(dòng)機(jī)器人和迪士尼娛樂(lè)機(jī)器人。

迪士尼娛樂(lè)機(jī)器人自然是最令人深刻的,與之前展示R2D2不同,這一次NVIDIA展示了與與迪士尼合作的Olaf雪寶。這是一套完全在NVIDIA Omniverse中使用Newton物理求解器訓(xùn)練出來(lái)的機(jī)器人,機(jī)器人通過(guò)物理仿真學(xué)習(xí)行走,然后零樣本遷移到真實(shí)世界。同時(shí)由于基于物理的仿真,Olaf能適應(yīng)真實(shí)世界的物理特性。NVIDIA Omniverse雖然銷量不及預(yù)期,但從目前來(lái)看,依然是NVIDIA希望推動(dòng)的重點(diǎn)產(chǎn)品之一。







構(gòu)建開(kāi)放模型

黃仁勛在現(xiàn)場(chǎng)闡述了NVIDIA一套獨(dú)特的雙軌制AI策略,在在垂直整合硬件基礎(chǔ)設(shè)施的同時(shí),AI模型是水平開(kāi)放的,各行各業(yè)都可以基于開(kāi)放模型微調(diào),構(gòu)建符合本地?cái)?shù)據(jù)隱私和文化背景的專屬AI,NVIDIA目標(biāo)仍然是賣出更多的硬件,而非在AI模型上構(gòu)建壁壘。

為此,NVIDIA發(fā)布了一系列特定的開(kāi)放模型,包括通用推理與語(yǔ)言模型Nemotron 3,物理世界仿真Cosmos 2,生物化學(xué)與分子設(shè)計(jì)BioNIMO,以及用于氣候與天氣預(yù)測(cè)的Earth 2。



目前Nemotron 3已經(jīng)在關(guān)鍵基準(zhǔn)測(cè)試中達(dá)到世界頂尖水平,擅長(zhǎng)的領(lǐng)域包括研究推理、語(yǔ)音模型、世界模型以及通用機(jī)器人和自動(dòng)駕駛推理。同時(shí)Nemotron 3分成三個(gè)版本,包括基礎(chǔ)版的Nemotron 3,面向超大規(guī)模應(yīng)用的Nemotron 3 Ultra,以及與AI Agent框架真整合的Nemotron 3 OpenClaw版。





這里黃仁勛盛贊了OpenClaw龍蝦對(duì)計(jì)算機(jī)史帶來(lái)的里程碑的轉(zhuǎn)變,僅發(fā)布的幾周內(nèi)就達(dá)到了Linux 30年才能獲得成就,并且已經(jīng)比肩HTML和Linux開(kāi)源軟件成為同等重要的基礎(chǔ)設(shè)施級(jí)軟件。通過(guò)簡(jiǎn)單命令行即可下載、構(gòu)建、部署AI智能體,并且可靈活添加工具、數(shù)據(jù)源和自定義能力,也可以與NVIDIA硬件和軟件棧深度優(yōu)化。



針對(duì)AI工廠,NVIDIA還推出了名為NVIDIA NeMo云框架,這是一套融合了硬件層、庫(kù)與工具層以及生態(tài)集成層的架構(gòu),包含了Vera Rubin架構(gòu)的優(yōu)化部署,cuDF、cuVS加速庫(kù),以及Dynamo推理操作系統(tǒng)。通過(guò)對(duì)Vera Rubin的優(yōu)化,這套方式可以更好的確保Token生成效率,并支持機(jī)密計(jì)算,確保模型與數(shù)據(jù)安全。



黃仁勛認(rèn)為,Token已成為硅谷人才競(jìng)爭(zhēng)的核心籌碼,并且企業(yè)也將扮演Token消費(fèi)者和制造者,不僅為員工購(gòu)買AI算力提升生產(chǎn)力,同時(shí)也產(chǎn)生Token對(duì)外提供服務(wù)。AI智能體將扮演企業(yè)級(jí)IT轉(zhuǎn)型,原本供人使用的工具將被特定領(lǐng)域的專業(yè)化智能體替代。AI智能體像云服務(wù)API那般被租賃。



企業(yè)計(jì)算與數(shù)據(jù)平臺(tái)重構(gòu)

數(shù)據(jù)類型可以分成結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。黃仁勛認(rèn)為這兩類企業(yè)數(shù)據(jù)資產(chǎn)在AI時(shí)代都將被重構(gòu)。結(jié)構(gòu)化數(shù)據(jù)是業(yè)務(wù)運(yùn)營(yíng)的基礎(chǔ),傳統(tǒng)CPU數(shù)據(jù)處理系統(tǒng)已無(wú)法跟上AI智能體的訪問(wèn)速度,NVIDIA cuDF(CUDA Data Frames)無(wú)疑是利用GPU加速結(jié)構(gòu)化數(shù)據(jù)庫(kù)處理的理想解決方案。



同樣,非結(jié)構(gòu)化數(shù)據(jù)現(xiàn)在已經(jīng)占據(jù)全球年生成數(shù)據(jù)的90%,但幾乎無(wú)法被有效利用,原因是缺乏索引機(jī)制,必須理解含義和目的才能查詢。NVIDIA給出的解決方案是利用NVIDIA cuVS(CUDA Vector Search)GPU加速的語(yǔ)義向量搜索庫(kù),從而完成對(duì)非結(jié)構(gòu)化數(shù)據(jù)的處理。簡(jiǎn)單的說(shuō),cuDF與cuVS構(gòu)建了NVIDIA對(duì)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)兩套GPU加速的組合拳。



其中cuDF進(jìn)行的結(jié)構(gòu)化數(shù)據(jù)AI加速擅長(zhǎng)企業(yè)ERP、供應(yīng)鏈、財(cái)務(wù)數(shù)據(jù)的實(shí)時(shí)分析,與IBM合作案例顯示5倍速度提升,83%成本降低。cuVS非結(jié)構(gòu)化數(shù)據(jù)檢索用于PDF文檔理解、視頻內(nèi)容檢索、語(yǔ)音轉(zhuǎn)文本分析,將非結(jié)構(gòu)化數(shù)據(jù)嵌入為高維向量,支持快速語(yǔ)義相似性搜索。

cuDF與cuVS目前已經(jīng)在IBM、DELL、Google Cloud、亞馬遜云、Microsoft Azure、Oracle、CoreWeave、Telstra + Dell等企業(yè)中展開(kāi)應(yīng)用。AI時(shí)代下,傳統(tǒng)的檢索式將被生成式替代,數(shù)據(jù)訪問(wèn)本身是新內(nèi)容的生產(chǎn),并由AI智能體與人類進(jìn)行交互,圍繞GPU加速構(gòu)建的計(jì)算框架,成本不會(huì)收到摩爾定律影響,而是隨著加速計(jì)算得到不斷優(yōu)化。



金融服務(wù)、醫(yī)療保健、零售業(yè)與安全計(jì)算很快就會(huì)率先受到影響,通過(guò)cuDF和cuVS兩大基礎(chǔ)庫(kù),NVIDIA正在將傳統(tǒng)上由CPU主導(dǎo)的數(shù)據(jù)處理(占企業(yè)IT支出的核心部分)遷移到GPU加速架構(gòu),實(shí)現(xiàn)結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一AI化訪問(wèn),標(biāo)志著企業(yè)IT從檢索式工具使用向生成式智能體的范式轉(zhuǎn)移,這不僅是技術(shù)升級(jí),更是涉及萬(wàn)億美元IT支出的產(chǎn)業(yè)重構(gòu)。

寫(xiě)在最后:構(gòu)建全新的生態(tài)與行業(yè)

黃仁勛表示,目前NVIDIA業(yè)務(wù)已經(jīng)呈現(xiàn)出了雙金字塔結(jié)構(gòu),其中60%來(lái)自超大規(guī)模云服務(wù)商,推薦系統(tǒng)從傳統(tǒng)表格和協(xié)同過(guò)濾開(kāi)始轉(zhuǎn)向深度學(xué)習(xí)大模型,傳統(tǒng)搜索則開(kāi)始轉(zhuǎn)向深度學(xué)習(xí)大模型,同時(shí)基于NVIDIA生態(tài)構(gòu)建出來(lái)的原生AI公司也越來(lái)越多。

另外40%來(lái)自多樣化的長(zhǎng)尾市場(chǎng),應(yīng)用場(chǎng)景遍布工業(yè)機(jī)器人、邊緣計(jì)算、超算、小型服務(wù)器。AI不是單一應(yīng)用的技術(shù),而是跨行業(yè)的基礎(chǔ)設(shè)施。



同時(shí)黃仁勛也強(qiáng)調(diào)了CUDA的二十年生態(tài)帶來(lái)的飛輪效應(yīng),從便于部署到算法突破,加速了整個(gè)生態(tài)系統(tǒng)的正向循環(huán)。基于CUDA生態(tài)的硬件幾乎應(yīng)用于每個(gè)云平臺(tái)、每個(gè)計(jì)算機(jī)公司、每個(gè)行業(yè),軟件資產(chǎn)包含數(shù)十萬(wàn)公開(kāi)項(xiàng)目,數(shù)千工具、編譯器、框架和庫(kù)。從臺(tái)積電芯片制造商,到服務(wù)器OEM、再到云服務(wù)商和AI應(yīng)用公司,哪怕是擁有150年歷史的公司,在全新的AI浪潮中也創(chuàng)造了全新的營(yíng)收紀(jì)錄,足以見(jiàn)得AI對(duì)行業(yè)的重要性。



隨著行業(yè)的垂直程度加深,數(shù)萬(wàn)億美元的產(chǎn)業(yè)將會(huì)迎來(lái)重構(gòu)。比如金融服務(wù)的量化交易從人工特征工程、經(jīng)典機(jī)器學(xué)習(xí)轉(zhuǎn)向超算自動(dòng)發(fā)現(xiàn)數(shù)據(jù)模式;醫(yī)療保健通過(guò)AI完成新藥物發(fā)現(xiàn)、診斷代理、客戶服務(wù),藥物分子模擬變得輕而易舉。

NVIDIA深耕十年的制造業(yè)與機(jī)器人行業(yè),現(xiàn)在也正在邁向訓(xùn)練、仿真、邊緣計(jì)算的體系,NVIDIA已經(jīng)與幾乎全球機(jī)器人展開(kāi)了合作,GTC2026現(xiàn)場(chǎng)的110個(gè)機(jī)器人就是很好的例子。在零售端,AI可以很好的完成供應(yīng)鏈優(yōu)化、購(gòu)物系統(tǒng)、客服支持,NVIDIA構(gòu)建了一套完整的端到端智能零售技術(shù)棧。





在電信領(lǐng)域,基站從單一信號(hào)傳輸轉(zhuǎn)向AI基礎(chǔ)設(shè)施平臺(tái),基站將成為機(jī)器人化無(wú)線電塔,將具備推理和自適應(yīng)能力,目前NVIDIA合作伙伴諾基亞、T-Mobile已經(jīng)率先展開(kāi)部署。最后是媒體、娛樂(lè)和游戲,AI已經(jīng)被應(yīng)用于直播翻譯、廣播支持、實(shí)時(shí)游戲增強(qiáng)。RTX、Holoscan用于實(shí)時(shí)視頻處理。





基于AI的原生企業(yè)開(kāi)始迎來(lái)自己的高光時(shí)刻,AI初創(chuàng)公司的風(fēng)險(xiǎn)投資歷史性爆發(fā),現(xiàn)在已經(jīng)出現(xiàn)了從百萬(wàn)到十億級(jí)美元的投資跨度,每家公司都需要海量計(jì)算和Token,要么自建Token工廠,要么在現(xiàn)有Token上增值,類似于Google、Amazon、Meta級(jí)別的公司很可能在原生AI初創(chuàng)公司中誕生。

這樣的結(jié)論并非一拍腦袋得出的,黃仁勛將GTC 2025和GTC 2026訂單規(guī)模進(jìn)行了對(duì)比。GTC 2026期間,NVIDIA獲得了5000億美元的訂單規(guī)模,而在當(dāng)下,GTC 2026將帶來(lái)上萬(wàn)億美元的訂單,增長(zhǎng)速度翻倍。在未來(lái),AI從訓(xùn)練轉(zhuǎn)向推理,每家企業(yè)都需要AI工廠,Agentic AI將會(huì)提供7x24小時(shí)不間斷的推理服務(wù),自動(dòng)駕駛、機(jī)器人等物理世界AI均需要AI邊緣計(jì)算作為基礎(chǔ)設(shè)施。



在長(zhǎng)達(dá)兩個(gè)半小時(shí)的GTC 2026演講中,黃仁勛展示了一套萬(wàn)億美元級(jí)AI經(jīng)濟(jì)閉環(huán)的AI生態(tài)系統(tǒng),從上游芯片供應(yīng)鏈到下游行業(yè)應(yīng)用,從超大規(guī)模云到主權(quán)邊緣部署,從20年歷史的CUDA開(kāi)發(fā)者社區(qū)到新興的AI原生獨(dú)角獸。NVIDIA不僅成為AI基礎(chǔ)設(shè)施的提供者,更是全球AI產(chǎn)業(yè)生態(tài)的樞紐節(jié)點(diǎn),其影響已超越單純的技術(shù)供應(yīng)商,正在重塑全球計(jì)算產(chǎn)業(yè)的經(jīng)濟(jì)結(jié)構(gòu)和權(quán)力分布。







聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國(guó)死盯伊朗,金正恩突然亮出核武牌,短短數(shù)小時(shí)連出兩記重拳!

美國(guó)死盯伊朗,金正恩突然亮出核武牌,短短數(shù)小時(shí)連出兩記重拳!

阿纂看事
2026-04-19 18:44:39
大姐堅(jiān)持不吃藥治療高血壓3年后收縮壓正常,醫(yī)生:她有3個(gè)好習(xí)慣

大姐堅(jiān)持不吃藥治療高血壓3年后收縮壓正常,醫(yī)生:她有3個(gè)好習(xí)慣

健身狂人
2026-04-19 01:57:00
天津最好吃的,不是煎餅馃子和嘎巴菜,而是這10樣,外地不多見(jiàn)

天津最好吃的,不是煎餅馃子和嘎巴菜,而是這10樣,外地不多見(jiàn)

馬蹄燙嘴說(shuō)美食
2026-04-18 14:31:19
沃爾沃找胡錫進(jìn),腦子被車門(mén)夾了?

沃爾沃找胡錫進(jìn),腦子被車門(mén)夾了?

不正確
2026-04-17 12:59:02
廣東慘遭18分逆轉(zhuǎn)疑似放水!專家暗示打假球:杜鋒為季后賽挑對(duì)手

廣東慘遭18分逆轉(zhuǎn)疑似放水!專家暗示打假球:杜鋒為季后賽挑對(duì)手

籃球快餐車
2026-04-19 06:11:53
馬科斯萬(wàn)萬(wàn)想不到!在仁愛(ài)礁坐灘27年的破船,卻意外助力了中國(guó)

馬科斯萬(wàn)萬(wàn)想不到!在仁愛(ài)礁坐灘27年的破船,卻意外助力了中國(guó)

你是我心中最美星空
2026-04-17 10:09:48
馬英九攤牌:兩岸開(kāi)戰(zhàn)在所難免,臺(tái)成不了烏克蘭,只因有致命死穴

馬英九攤牌:兩岸開(kāi)戰(zhàn)在所難免,臺(tái)成不了烏克蘭,只因有致命死穴

混沌錄
2026-04-16 17:31:13
劉青山死后30年,三個(gè)兒子找到當(dāng)年舉報(bào)者李克才:請(qǐng)為我父親平反

劉青山死后30年,三個(gè)兒子找到當(dāng)年舉報(bào)者李克才:請(qǐng)為我父親平反

微野談寫(xiě)作
2026-04-17 10:55:11
如何更理性客觀看待“雷軍北京到上海1313Km續(xù)航測(cè)試?”

如何更理性客觀看待“雷軍北京到上海1313Km續(xù)航測(cè)試?”

新浪財(cái)經(jīng)
2026-04-18 19:09:53
阿爾特塔對(duì)他與瓜迪奧拉的關(guān)系發(fā)表了耐人尋味的評(píng)論!

阿爾特塔對(duì)他與瓜迪奧拉的關(guān)系發(fā)表了耐人尋味的評(píng)論!

夜白侃球
2026-04-19 19:04:58
價(jià)格狂飆6倍!日本連夜求購(gòu)遭中方一劍封喉,高端制造全線崩盤(pán)?

價(jià)格狂飆6倍!日本連夜求購(gòu)遭中方一劍封喉,高端制造全線崩盤(pán)?

烈史
2026-04-17 15:51:01
小米 YU9 要來(lái)了,外觀真的猛!

小米 YU9 要來(lái)了,外觀真的猛!

花果科技
2026-04-17 13:44:41
50歲曾黎生圖曝光,嘴歪臉僵腫醫(yī)美明顯,顏值暴跌一臉兇相太嚇人

50歲曾黎生圖曝光,嘴歪臉僵腫醫(yī)美明顯,顏值暴跌一臉兇相太嚇人

談史論天地
2026-04-19 06:18:25
未來(lái)3小時(shí)北京全市有陣雨、大風(fēng)和沙塵,請(qǐng)注意防范

未來(lái)3小時(shí)北京全市有陣雨、大風(fēng)和沙塵,請(qǐng)注意防范

新京報(bào)
2026-04-19 15:57:04
張志新的兒女今何在?背后的真相令人淚目

張志新的兒女今何在?背后的真相令人淚目

深度報(bào)
2026-03-01 23:48:59
韋東奕終于升了!七年講師熬出頭,評(píng)審會(huì)開(kāi)到院長(zhǎng)臉通紅

韋東奕終于升了!七年講師熬出頭,評(píng)審會(huì)開(kāi)到院長(zhǎng)臉通紅

娛小余
2026-04-03 22:52:32
被年輕人的“極簡(jiǎn)養(yǎng)娃”驚到了,不花啥錢,孩子該有的都有!

被年輕人的“極簡(jiǎn)養(yǎng)娃”驚到了,不花啥錢,孩子該有的都有!

一口娛樂(lè)
2026-04-16 11:17:35
希拉里:我聽(tīng)說(shuō)中美俄將劃分勢(shì)力范圍,美國(guó)管西半球,中國(guó)管東亞

希拉里:我聽(tīng)說(shuō)中美俄將劃分勢(shì)力范圍,美國(guó)管西半球,中國(guó)管東亞

沙溪解說(shuō)
2026-04-19 13:31:42
古斯塔沃傷病疑云!兩次稱病缺席,媒體人:降薪后欠薪落差太大

古斯塔沃傷病疑云!兩次稱病缺席,媒體人:降薪后欠薪落差太大

奧拜爾
2026-04-19 13:40:33
鄭愷一家外出聚餐,鄭爸出鏡走路要攙扶,苗苗冒雨送公公很孝順

鄭愷一家外出聚餐,鄭爸出鏡走路要攙扶,苗苗冒雨送公公很孝順

庭小娛
2026-04-19 16:59:39
2026-04-19 20:00:49
愛(ài)極物 incentive-icons
愛(ài)極物
關(guān)注數(shù)碼新科技~!
354文章數(shù) 38關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

特朗普1個(gè)月罵了4次"紙老虎" 北約秘書(shū)長(zhǎng):他不會(huì)退群

頭條要聞

特朗普1個(gè)月罵了4次"紙老虎" 北約秘書(shū)長(zhǎng):他不會(huì)退群

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂(lè)要聞

張?zhí)鞇?ài)評(píng)論區(qū)淪陷!被曝卷入小三風(fēng)波

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬(wàn) 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

家居
時(shí)尚
親子
藝術(shù)
健康

家居要聞

法式線條 時(shí)光靜淌

這些才是最適合普通人的造型!不用穿大牌、不老套,真實(shí)自然

親子要聞

吹多少拿多少

藝術(shù)要聞

俄羅斯畫(huà)家季莫申科 小幅風(fēng)景油畫(huà)寫(xiě)生(二)

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版