網易首頁 > 網易號 > 正文 申請入駐

全新 NVIDIA Nemotron 3 Super 將代理式 AI 吞吐量提升 5 倍

0
分享至

一款全新的開放 1,200 億參數混合式 MoE (mixture?of?experts) 模型,專為 NVIDIA Blackwell 進行了優化,可解決拖慢自主智能體工作流的長時推理和上下文爆炸的成本難題。

NVIDIA Nemotron 3 Super 于近日發布,其為一款 1,200 億參數開放模型,擁有 120 億個活躍參數,旨在大規模運行復雜的代理式 AI 系統。

Nemotron 3 Super 樹立了新標準,在 Artificial Analysis 的效率和開放性排名中位居榜首,并在同等規模的模型中展現出領先的準確性。

該模型還助力 NVIDIA AI-Q 研究智能體在 DeepResearch Bench 和 DeepResearch Bench II 排行榜上取得第一名。這些基準測試旨在衡量 AI 系統在海量文檔中開展全面多步驟研究,并保持推理連貫性的能力。



  • 混合架構:Nemotron 3 Super 采用了混合 MoE 架構,結合了三項主要創新,與之前的 Nemotron Super 模型相比,實現了高達 5 倍的吞吐量提升和高達 2 倍的準確率提升。

  1. 混合架構:Mamba 層實現 4 倍顯存與計算效率提升,Transformer 層則提供高級推理能力。
  2. 混合專家 (MoE):在其 1,200 億參數中,推理時僅激活 120 億參數。
  3. 潛在混合專家架構:這是一種新的推理技術,它以單個專家的成本來激活四個專家,從而顯著提升 token 生成的準確率。
  4. 多 token 預測:能夠同時預測多個未來的詞語,從而使推理速度提高 3 倍。

  • 開放權重、數據和方案:NVIDIA 將 Nemotron 3 Super 的權重完全開放,并配以寬松許可協議。開發者可在工作站、數據中心或云端來進行部署和定制。

Nemotron 3 Super 基于前沿推理模型生成的合成數據訓練而成。NVIDIA 將公布完整的訓練方法,其中包括超過 10 萬億個 token 的預訓練和后訓練數據集,15 個用于強化學習的訓練環境以及評估方案。研究人員還可借助 NVIDIA NeMo 平臺對模型進行微調或構建專屬模型。

  • 在代理式系統中的應用:Nemotron 3 Super 旨在處理多智能體系統中的復雜子任務。

一個軟件開發智能體可以一次性將整個代碼庫加載到上下文中,從而實現端到端的代碼生成和調試,且無需進行文檔分割。

在金融分析中,它能夠將數千頁的報告加載到顯存中,避免在長對話中重復推理,從而提高效率。

以上為摘要內容,點擊鏈接閱讀完整內容:全新 NVIDIA Nemotron 3 Super 將代理式 AI 吞吐量提升 5 倍 | NVIDIA 英偉達博客

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
5-4狂飆:巴黎與拜仁的“進球大戰”,揭示了頂級足球的秩序之亂

5-4狂飆:巴黎與拜仁的“進球大戰”,揭示了頂級足球的秩序之亂

星耀國際足壇
2026-04-30 03:25:18
遼籃凱旋!數千球迷接機,傳統強隊絕不會給山東隊任何喘息的機會

遼籃凱旋!數千球迷接機,傳統強隊絕不會給山東隊任何喘息的機會

君馬體育
2026-04-30 00:03:40
曾與乘客機場對罵:“你回到南昌,有你好瞧的”,副部級洪禮和被判20年

曾與乘客機場對罵:“你回到南昌,有你好瞧的”,副部級洪禮和被判20年

大風新聞
2026-04-29 12:35:10
退休后,永遠不要在熟人面前,說以下6句話,切記切記

退休后,永遠不要在熟人面前,說以下6句話,切記切記

東林夕亭
2026-04-02 16:44:39
互聯網是有記憶的,她的黑歷史一大堆??!

BenSir本色說
2026-04-15 22:38:07

沒想到4月還沒結束,任嘉倫就以這種方式徹底翻車

沒想到4月還沒結束,任嘉倫就以這種方式徹底翻車

東方不敗然多多
2026-04-30 02:01:00
重返4100點!不出意外,周四會重演歷史了

重返4100點!不出意外,周四會重演歷史了

郭小凡財經
2026-04-29 21:33:28
地鐵互毆乘客已社死,官方出手,拘留只是開始,更嚴重的還在后面

地鐵互毆乘客已社死,官方出手,拘留只是開始,更嚴重的還在后面

攬星河的筆記
2026-04-29 14:07:30
俄羅斯領導人譴責烏克蘭使用“恐怖主義手段”襲擊俄煉油廠

俄羅斯領導人譴責烏克蘭使用“恐怖主義手段”襲擊俄煉油廠

山河路口
2026-04-29 19:57:41
古利特丨入選米蘭名人堂,去年范巴斯滕還不愿意出席是因為……

古利特丨入選米蘭名人堂,去年范巴斯滕還不愿意出席是因為……

米蘭圈
2026-04-29 09:29:33
日本確認一艘日本籍超級油輪已通過霍爾木茲海峽

日本確認一艘日本籍超級油輪已通過霍爾木茲海峽

財聯社
2026-04-29 14:52:10
張雪:中國摩托未來必將取代日本品牌

張雪:中國摩托未來必將取代日本品牌

第一財經資訊
2026-04-28 00:20:45
斯諾克世錦賽最新戰報:趙心童吳宜澤大爆發,8-8,4-4丁俊暉開心

斯諾克世錦賽最新戰報:趙心童吳宜澤大爆發,8-8,4-4丁俊暉開心

曹說體育
2026-04-29 09:31:40
韓國兼職麻醉師為“趕場”提前離開手術室,主刀醫生完成手術后也離開,患者被獨自留下,心臟驟?;杳?個月;兼職麻醉師一天收入或超9千元

韓國兼職麻醉師為“趕場”提前離開手術室,主刀醫生完成手術后也離開,患者被獨自留下,心臟驟停昏迷3個月;兼職麻醉師一天收入或超9千元

大風新聞
2026-04-29 20:14:06
季麟連開除韓國瑜,黃復興退將斥挾黨自重辭副主席

季麟連開除韓國瑜,黃復興退將斥挾黨自重辭副主席

真的好愛你
2026-04-30 02:18:21
扎哈羅娃拳打澤連斯基腳踢歐盟,烏克蘭軍力躍居全球排行榜第12位

扎哈羅娃拳打澤連斯基腳踢歐盟,烏克蘭軍力躍居全球排行榜第12位

史政先鋒
2026-04-28 12:47:48
究竟是哪些躺平網紅接受境外組織資助了?建議嚴查嚴懲!

究竟是哪些躺平網紅接受境外組織資助了?建議嚴查嚴懲!

番外行
2026-04-29 21:25:46
24歲《好聲音》選手車禍身亡,他留下的不只是一首歌

24歲《好聲音》選手車禍身亡,他留下的不只是一首歌

娛圈觀察員
2026-04-27 22:42:51
CBA消息!國產主帥附加賽全敗,山西助教公開說5打8 趙睿歸隊合練

CBA消息!國產主帥附加賽全敗,山西助教公開說5打8 趙睿歸隊合練

中國籃壇快訊
2026-04-30 00:02:10
英國王查爾斯調侃特朗普:如果不是因為我們,你們現在還在說法語

英國王查爾斯調侃特朗普:如果不是因為我們,你們現在還在說法語

極目新聞
2026-04-29 22:55:33
2026-04-30 03:56:49
NVIDIA英偉達中國 incentive-icons
NVIDIA英偉達中國
英偉達(中國)官方賬號
3507文章數 1445關注度
往期回顧 全部

數碼要聞

蘋果或已放棄“iPad Ultra”折疊機型開發計劃

頭條要聞

伊朗提出先解除封鎖 特朗普回應

頭條要聞

伊朗提出先解除封鎖 特朗普回應

體育要聞

一場九球狂歡,各路神仙批量下凡

娛樂要聞

馬頔一句話,孫楊媽媽怒罵節目組2小時

財經要聞

蘇州,率先進入牛市

科技要聞

今晨庭審紀實|馬斯克當庭講述OpenAI被偷走

汽車要聞

技術天花板再摸高 全能型的奕境X9首秀

態度原創

游戲
家居
本地
房產
公開課

平等曹飛所有老玩家的危機合約,為何是二游高難玩法最高的山?

家居要聞

寂然無界 簡潔風格

本地新聞

用青花瓷的方式,打開西溪濕地

房產要聞

80億投資!浙商總部基地+??诒闭?,金沙灣這是要起飛??!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版