3月19日,當全球半導體產業仍在5nm向3nm制程的過渡期掙扎時,英偉達在GTC 2025 大會上通過Blackwell Ultra發起一場“降維打擊”;尤其性能躍升并非依賴工藝微縮,而是通過架構革命將AI算力的“不可能三角”(性能、能效、成本)徹底擊穿。
與往年一樣,英偉達如期發布全新的計算芯片,基于Blackwell Ultra架構的GB300 AI加速芯片,以及下一代AI超級芯片“Rubin”。
作為Blackwell架構的終極形態,GB300 AI芯片(Blackwell Ultra)的發布,也讓英偉達在AI芯片領域完成從“性能迭代”到“架構代差”的戰略跨越。
圖源:英偉達GTC 大會
特別的是,相較于去年的B200,GB300性能提升1.5倍,新的注意力機制提升2倍,擁有20TB HBM高帶寬存儲提升1.5倍。并且,GB300的突破也重新定義“全球最強AI芯片”。
高帶寬內存(HBM3e)的堆疊式升級:Blackwell Ultra首次采用12層堆疊的HBM3e內存,顯存容量提升至288GB,帶寬達14.4 TB/s,較前代Hopper H100的3.35 TB/s提升4.3倍。
多芯片模塊(MCM)的原子化封裝:Blackwell Ultra通過臺積電CoWoS-L 3D封裝技術,將72個GPU Tile與36個Grace CPU Tile集成于單個基板,形成“超異構計算集群”。每個Tile間通過硅中介層互聯,帶寬達14.4 TB/s,跨芯片延遲降至12ns,逼近單Die內通信水平。
動態稀疏計算引擎(DSCE):Blackwell Ultra在Tensor Core中集成硬件級稀疏加速單元,支持非結構化稀疏模式的實時檢測與跳過無效計算,稀疏加速效率達98%。在FP4精度下,其有效算力較稠密模式提升7倍,內存占用減少83%。
圖源:英偉達GTC 大會
液冷技術與能效優化:為應對高達1400W的TDP功耗8,Blackwell Ultra引入嵌入式微流道液冷系統,散熱效率較傳統風冷提升8倍,單機架(72 GPU)峰值功耗僅42kW,較同規模H100集群降低57%。結合動態電壓頻率調節(DVFS),部分負載場景下能效比可達H100的40倍。
AI工廠操作系統Dynamo:英偉達推出的分布式推理服務庫Dynamo,通過動態任務調度與資源分配,將開源模型推理速度提升30倍。在Blackwell Ultra平臺上,Dynamo可同時管理30萬并發推理任務(H100為4.5萬),且服務等級協議(SLA)違規率下降92%。
與此同時,AI或將不再獨鐘于英偉達顯卡,但市面需要更多的是算力;然而按下這場算力競賽加速鍵的企業,或許正是DeepSeek。
圖源:英偉達GTC 大會
在本次演講中,DeepSeek的出場率極其高,甚至接棒了去年熱議的ChatGPT,黃仁勛用DeepSeek來詮釋AI算力需求不僅沒有下降,反而在增長。作為范例與DeepSeek對比的是LLama 3,一個傳統的AI大模型,在回答同個問題時,LLama只用了不到500 Token就輸出了回答,而DeepSeek則是用了高達8559 Token來輸出答案。
結果顯而易見,LLama給出錯誤答案,而DeepSeek則答對了,為避免大家覺得DeepSeek-R1用671B的參數量“欺負”只有70B參數量的LLama,演示視頻還貼心地備注“活躍參數37B”的字樣。這也是DeepSeek-R1這類稀疏型AI大模型的特點,雖參數量龐大,但每次實際調用的參數量并不算多,似乎比傳統AI大模型更少。
眾所周知,Scaling Law之于AI,正如摩爾定律之于芯片。簡而言之就是“大力出奇跡”定律:數據越多、算力越強、模型越大,因此“DeepSeek的出現反而證明市場仍需更多AI芯片”。
目前,從生成式AI發展到Agentic AI,并不代表Scaling Law法則失效。
相反的是,由于將應用范圍從訓練進一步擴展到推理,不只在預訓練環節,模型的后訓練(Post-Training,指預訓練得到模型后,根據特定任務或需求,使用更小規模、更專注的數據集對模型進行進一步優化訓練或微調的過程)和日常推理的長期思考(Long-Thinking)都要繼續消耗算力資源,Scaling Law法則對規模的要求非但會變小,相反會進一步擴大。
圖源:英偉達GTC 大會
綜上所述,Blackwell Ultra的發布,或許會被歷史視為AI算力從“量變”到“質變”的轉折點。
這場革命的意義,不亞于當年晶體管取代真空管。而隨著Blackwell Ultra與Rubin架構的路線圖曝光,英偉達已明確將技術迭代周期壓縮至一年,這意味著:未來的AI競爭,不再是“誰能造出最大芯片”,而是“誰能最快將算力轉化為生產力”。
由于篇幅受限,本次的英偉達AI芯片就先介紹這么多......
想了解更多半導體行業動態,請您持續關注我們。
奇普樂將在每周,不定時更新~
最后的最后,借由陽明的一句名言:
種子的黑土期,是光明誕生的必修課。
愿每一位半導體從業者可以——
破土凌云、深根見月!
奇普樂 · 往期文章
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.