![]()
周一,黃仁勛穿著標(biāo)志性的皮衣開啟了英偉達(dá)2026年的GTC大會。
![]()
今年的GTC,和往年有所不同。盡管全世界都在期待更快的GPU,但黃仁勛帶來的不是產(chǎn)品發(fā)布會,而是一場關(guān)于AI時代工業(yè)革命的敘述。
英偉達(dá)全新的宏大敘事,定義了這場革命的生產(chǎn)資料、生產(chǎn)方式、經(jīng)濟模型,以及驅(qū)動一切的硬件基石和操作系統(tǒng)。
短短兩個小時,黃仁勛清晰地描述了英偉達(dá)的未來和整個AI行業(yè)未來的藍(lán)圖。
01
“AI工廠”的誕生和“推理拐點”的來臨
黃仁勛在這場演講中提出了兩個核心判斷,作為英偉達(dá)的戰(zhàn)略基礎(chǔ):
①推理拐點:AI從學(xué)習(xí)走向工作。
過去的兩年中,AI的算力消耗主要集中在訓(xùn)練階段,各大AI企業(yè)都在費盡心思研究如何設(shè)計出功能更強大的模型,規(guī)模化法則(Scaling Law)也正是在這個階段生效:模型越大、數(shù)據(jù)越多,性能就越好。
如今,行業(yè)已經(jīng)結(jié)束這個階段,進(jìn)入了推理階段的爆發(fā)期,OpenClaw等產(chǎn)品的爆發(fā)讓AI模型被大規(guī)模地實際應(yīng)用。
按照黃仁勛的說法,推理所需的計算量可能達(dá)到訓(xùn)練所需的數(shù)萬倍甚至數(shù)十萬倍。
無論是ChatGPT、Gemini還是DeepSeek、豆包,每一次日常交流、每一次代碼生成都是一次復(fù)雜的推理。
因此,即使前沿大模型推陳出新的周期開始放緩,GPU需求仍然在持續(xù)暴漲。
而OpenClaw作為一款有極大安全風(fēng)險的開源產(chǎn)品在全世界爆火,更是說明我們現(xiàn)在看到的增長,必然只是冰山一角。
②AI工廠經(jīng)濟學(xué):定義新世界KPI
推理的拐點到來之際,黃仁勛也給出了數(shù)據(jù)中心的新經(jīng)濟模型:
Token將會成為新產(chǎn)品,數(shù)據(jù)中心不再是用于存儲數(shù)據(jù)的成本中心,而是生產(chǎn)智能的利潤中心,也就是所謂的“AI工廠”。
算力會成為新的貨幣,與token正向關(guān)聯(lián)。
而新的KPI指標(biāo),則是每瓦特電力能夠產(chǎn)生的token數(shù)量。
在美國,電力仍然是所有數(shù)據(jù)中心的最終物理瓶頸。最大化每瓦電力的token產(chǎn)出就等同于最大化收入。
通俗而準(zhǔn)確的解釋,不僅使AI行業(yè)抽象的專業(yè)詞匯更加具象化,還將從CEO到開發(fā)者的思維都牢牢吸引到了英偉達(dá)最具優(yōu)勢的賽道上。
在這套新的經(jīng)濟范式下,英偉達(dá)的野心已經(jīng)顯露:它掌握著大量的貨幣,不愿意只給淘金的人賣鏟子,而是要打造整套“工廠藍(lán)圖”和“生產(chǎn)線”。
02
“AI工廠”的核動力:硬件基石
英偉達(dá)最大的優(yōu)勢就是算力,除了Google靠著自研TPU硬是打出了一片天地,世界上絕大部分企業(yè)仍然受制于英偉達(dá)的GPU供給。
推理需求的爆發(fā),就意味著“AI工廠”需要消耗前所未有的能源。
值此之際,英偉達(dá)推出了宣傳已久的Vera Rubin。
![]()
相比以前GTC展示的單塊GPU,Vera Rubin是一臺機架級的超級計算機。
本質(zhì)上,它是一個極致垂直整合的產(chǎn)物,集成了新一代GPU、專為AI代理任務(wù)設(shè)計的CPU、新一代網(wǎng)絡(luò)、新一代存儲等七顆關(guān)鍵芯片,并結(jié)合液冷技術(shù)和精密協(xié)同設(shè)計,共同封裝在一個機架之中。
自此,英偉達(dá)的交付單位,已經(jīng)從芯片躍升到即插即用的計算系統(tǒng)。
除此之外,這次GTC大會還有另一項技術(shù)驚喜,也就是Groq LPU技術(shù)整合。
英偉達(dá)已經(jīng)注意到現(xiàn)階段的AI計算需求開始呈現(xiàn)極端化的趨勢:
一是高吞吐量,Vera Rubin擅長進(jìn)行海量并行計算,適合處理批量任務(wù);
二是超低延遲,Groq LPU有極快的單次響應(yīng)速度,這是交互式應(yīng)用的關(guān)鍵。
英偉達(dá)的解法,是在軟件層面上將所需的兩種能力“分而治之”,高強度的數(shù)學(xué)運算放在Vera Rubin上,對延遲極度敏感的token生成環(huán)節(jié)則交給Groq,這一解決方案將高價值交互應(yīng)用的性能足足提升了35倍。
AI工廠的產(chǎn)出,遠(yuǎn)不止數(shù)字世界的token。
在黃仁勛看來,具身智能(Embodied AI)這個更廣闊的物理世界大有可為。
但僅憑現(xiàn)實世界中的數(shù)據(jù),想訓(xùn)練機器人應(yīng)對所有突發(fā)的陌生情況,恐怕永遠(yuǎn)都不夠。
解決方案就藏在他提出的新經(jīng)濟模型中:算力就是貨幣,貨幣就能帶來數(shù)據(jù)。
通過仿真平臺生成海量高質(zhì)量的合成數(shù)據(jù),在虛擬世界中訓(xùn)練AI,再部署到現(xiàn)實世界中的機器人中。這套Sim-to-Real的路徑,或許就是解決機器人智能化的關(guān)鍵。
當(dāng)然,盲目的技術(shù)樂觀主義不可取,目前的AI模型基礎(chǔ)能力尚不足以支撐具身智能商業(yè)化落地。
不過,無論是通用的機器人基礎(chǔ)模型GR00T,還是具備思考和推理能力的自動駕駛模型Alpamayo,都證明了英偉達(dá)正在將“AI工廠”提供的生產(chǎn)力投入到了價值50萬億美元的制造業(yè)和汽車業(yè)。
03
“AI工廠”的大腦:Dynamo 1.0
強大的“核反應(yīng)堆”Vera Rubin已經(jīng)誕生,接下來的問題就是如何讓它像小龍蝦一樣7×24小時高效運轉(zhuǎn)。
這個問題的答案,同樣藏在軟件層面。英偉達(dá)在GTC大會同期發(fā)布的Dynamo 1.0技術(shù)博客,正式將驅(qū)動“AI工廠”的大腦公開于眾。
![]()
Dynamo是一個專門為大規(guī)模、多節(jié)點、企業(yè)級AI推理而設(shè)計的軟件框架。如果Vera Rubin是token的硬件生產(chǎn)線,那Dynamo就是生產(chǎn)線的控制器。它雖然不直接生產(chǎn)token,但卻保證了生產(chǎn)流程的效率、速度和穩(wěn)定性。
具體來說,Dynamo在以下四個方面實現(xiàn)了不同程度的技術(shù)突破:
1.在Vera Rubin平臺上,Dynamo可以通過解耦服務(wù)等技術(shù)將模型的推理請求處理能力提升約7倍,直接提升了核心的“KPI指標(biāo)”;
2.AI從Chatbot進(jìn)化到Agent后,智能體的工作流運作需要經(jīng)過多輪對話、后臺思考、調(diào)用工具等復(fù)雜流程。而Dynamo具備“智能體感知”能力,能夠通過智能體提示(Agent Hints)理解任務(wù)的優(yōu)先級,優(yōu)先處理關(guān)鍵任務(wù),將智能體應(yīng)用的首次響應(yīng)時間降低4倍;
3.現(xiàn)代AI應(yīng)用普遍需要頻繁啟動新模型實例,但傳統(tǒng)方式下加載、編譯和優(yōu)化模型耗時費力。Dynamo的ModelExpress技術(shù)通過檢查點恢復(fù)和模型權(quán)重流式傳輸?shù)确椒ǎ?strong>將新實例的啟動時間加快7倍,“AI工廠”的生產(chǎn)將會更加靈活;
4.部署大模型對大部分人來說門檻仍然太高,Dynamo的DGDR功能允許開發(fā)者只提供模型、硬件和流量等目標(biāo),系統(tǒng)即可自動完成性能分析、配置和部署。
Dynamo的推出,完美印證了英偉達(dá)的領(lǐng)先已經(jīng)不再局限于硬件層面,還有深不可測的軟件和系統(tǒng)工程能力。
04
英偉達(dá)的生態(tài)戰(zhàn)略
綜上所述,英偉達(dá)通過GPU構(gòu)建起來的護城河,如今已經(jīng)延伸到了生態(tài)戰(zhàn)略。
在演講中,黃仁勛將OpenClaw這個開源智能體框架比作AI時代的Linux,并判斷它會成為下一代的操作系統(tǒng),且必將開啟一個全新的“智能體即服務(wù)”的時代。
此前的文章中我們曾提到過一個名為NemoClaw的平臺產(chǎn)品,如今已經(jīng)正式發(fā)布。英偉達(dá)的目標(biāo)只有一個:讓自己成為這場技術(shù)革命的標(biāo)準(zhǔn)制定者和安全守護者,讓所有企業(yè)都能放心加入這場養(yǎng)蝦浪潮。
同樣的策略也放在了智能體底層的基礎(chǔ)模型上。通過成立Nemotron聯(lián)盟,英偉達(dá)聯(lián)合了Mistral、Perplexity等知名AI公司,試圖共同打造下一代基礎(chǔ)模型。如此一來,AI生態(tài)的軟件將與英偉達(dá)的硬件實現(xiàn)更深層的綁定。
這也正是黃仁勛的高明之處:
從芯片(Rubin)、系統(tǒng)(機架)、網(wǎng)絡(luò)(NVLink)、軟件(Dynamo)、操作系統(tǒng)(NemoClaw)到AI模型(Nemotron),英偉達(dá)在每一個環(huán)節(jié)都實現(xiàn)了深度自研和極致協(xié)同設(shè)計。
這種垂直整合的模式帶來的,是競爭對手難以比擬的性能和效率。
與此同時,英偉達(dá)也并未試圖獨吞市場。
與各大云廠商和AI初創(chuàng)公司合作,表面上是“賦能所有人”,“給云廠商帶來客戶”,實則是將自己的技術(shù)棧嵌入全球的計算平臺,使整個生態(tài)系統(tǒng)都建立在英偉達(dá)的底層技術(shù)之上。
未來如果回顧2026年的GTC,或許它就是一個時代的轉(zhuǎn)折點。
英偉達(dá)構(gòu)建了一個以token為商品、以算力為貨幣、以“AI工廠”為核心生產(chǎn)單位的全新經(jīng)濟循環(huán)。
在這個循環(huán)中,英偉達(dá)有最高效的生產(chǎn)工具、最智能的生產(chǎn)管理系統(tǒng),甚至定義了生產(chǎn)標(biāo)準(zhǔn)。
它不再是一家GPU供應(yīng)商,而是AI基礎(chǔ)設(shè)施與經(jīng)濟體構(gòu)建者。
未來的“卡脖子”,只會更緊。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.