无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

訓練從數周壓到數小時:他們把通用原子勢訓練帶入Exascale時代

0
分享至



作者 | 論文團隊

編輯丨ScienceAI

在材料發現、催化設計、能源體系模擬、藥物研發等方向,原子尺度模擬一直都是底層工具,但傳統 DFT 計算成本極高,很難支撐大規模篩選。過去幾年,機器學習原子間勢雖然發展很快,但要真正做到「一個模型覆蓋材料、分子、催化、MOF 等多個領域」,并不容易。

原因很直接:這類模型訓練不僅要預測能量,還要通過自動微分嚴格求出原子力和應力,訓練中需要二階導數;同時,為了保證分子動力學的穩定性,又往往必須堅持 FP32 精度。二階訓練、高精度要求、超大原子圖,這三重約束疊加在一起,讓十億級通用原子勢的訓練長期停留在「理論上可擴、工程上難訓」的狀態。

最近,來自中國科學院計算技術研究所的研究團隊把通用機器學習原子間勢(uMLIP)的訓練規模推到了一個新量級,提出了十億級通用原子勢模型 MatRIS-MoE,以及配套的分布式訓練框架 Janus,在兩臺 Exascale 超算上實現了 1.2/1.0 EFLOPS 的單精度峰值性能,并把原本需要數周的訓練過程壓縮到數小時。



研究論文:Breaking the Training Barrier of Billion-Parameter Universal Machine Learning Interatomic Potentials

論文地址:https://arxiv.org/pdf/2604.15821v1

兼顧物理先驗與擴展性的模型架構

MatRIS-MoE 建立在 MatRIS 的不變架構之上,將原子體系表示為圖結構,模型對原子、成對距離和三體角度進行嵌入外,還加入任務嵌入、charge/spin 嵌入和全局特征嵌入,將不同數據集、DFT 泛函和體系類型對齊到統一表示空間中。相比原始 MatRIS,它不再只是單任務勢函數,而是面向多域統一建模的 universal MLIP。



更關鍵的是,作者沒有簡單堆大參數,而是引入了 MoE。在 MatRIS-MoE 中,MoE 層被插入到注意力前后,分別處理消息構造和特征更新。其一個重要設計是:路由不依賴瞬時坐標,而是按元素類型進行 Top-K 專家激活。這樣既能讓不同專家學習不同元素和化學環境下的規律,提升跨域表達能力,也能保持專家激活穩定,從而有助于維持連續、平滑的勢能面。

訓練上,這項工作依然堅持「保守式」路線:模型先預測總能量,再通過自動微分得到力和應力,而不是單獨開力頭直接擬合,這對保證物理一致性很重要。同時,作者還設計了 multi-task robust loss,在每個任務內部統計 batch loss 的均值和方差,并對離群樣本做平滑降權,以減輕異構任務之間的干擾。

兼顧 MoE 稀疏執行與二階反傳的訓練框架

如果說模型解決的是「怎么表達」,那么 Janus 解決的就是「怎么訓練」。

Janus 的核心是一個叫 FS-3D 的統一執行單元,把 FSDP、FSGP 和 FSEP 三種并行機制揉到了一起。簡單說,FSDP 負責切參數,降低模型參數、梯度和優化器狀態的靜態顯存占用;FSGP 負責切圖,把一個大原子圖劃分到多張卡上,降低激活開銷;FSEP (以 LAER-MoE 為基礎) 則專門面向 MoE,把專家參數分布到不同設備上,只在需要時恢復活躍專家。對于既有超大圖、又有 MoE、還要做 double backward 的 uMLIP 來說,這種三維統一分片的設計,是這篇工作的關鍵工程創新之一。

為了進一步解決 MoE 的低效問題,作者還提出了 JIT planning。傳統 MoE 訓練往往會保留很多當前 step 根本用不到的專家;作者利用體系靜態屬性決定專家激活的特點,在每個訓練 step 開始前,先對所有 MoE 層做批量路由,統計各專家 token 負載,再基于負載做局部規劃和全局合并,只恢復當前真正活躍的專家,并按負載盡量均衡地放到不同 rank 上。

更難的是,uMLIP 訓練不是普通的一次前向一次反向,而是包含 前向、一次反向、二次反向三個階段。Janus 為此專門實現了一個「二階訓練大模型」的運行時系統:參數按需恢復,前向階段記錄執行順序,后續階段復用順序做 prefetch 和 overlap,梯度同步則延遲到最終反向再進行。



結果與展望

結果也確實夠亮眼。論文使用了覆蓋分子、材料、催化表面、分子晶體和 MOF 的 4.73 億個原子構型,對應約 3.6 萬億條邊;最大模型規模達到 11.5B 參數,2.89B active parameters,支持處理多個領域的科學任務。最終,在兩臺 Exascale 平臺上,系統實現了超過 90% 的弱擴展并行效率,峰值達到 1.2 EFLOPS,把十億級通用原子勢訓練第一次真正推到了超算級可用的階段。



從這個角度看,這篇工作真正重要的地方,不只是「把一個模型訓到了 11.5B」,也不只是「跑到了 1.2 EFLOPS」,而是它證明了一件事:通用原子勢也可以像大模型一樣,被系統化地擴展、訓練和部署。

對 AI for Science 來說,這可能比單點精度提升更重要。因為從這里開始,通用原子勢不再只是論文里的 benchmark 選手,而是在向真正的科學基礎設施靠近。



作者介紹

中國科學院計算技術研究所及中國科學院大學周遠昌、王宏宇、杜奕明、汪焱、李明真、胡思宇為本文共同第一作者;中國科學院計算技術研究所賈偉樂研究員為本文通訊作者。賈偉樂 2020 年獲國際高性能計算應用領域最高獎戈登貝爾獎,2022 年再次入圍該獎項;相關成果入選兩院院士評選國內十大科技進展新聞,并獲得中國超算年度最佳應用獎及中國計算機學會高性能計算青年科技人才獎等多項榮譽。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“你找媒體,我們就不幫你了”:30多萬買的問界,12天增程器壞了

“你找媒體,我們就不幫你了”:30多萬買的問界,12天增程器壞了

漢史趣聞
2026-05-21 11:05:32
女子在高鐵靜音車廂連打20分鐘電話 乘客:乘務員一直舉牌勸阻卻被忽視

女子在高鐵靜音車廂連打20分鐘電話 乘客:乘務員一直舉牌勸阻卻被忽視

封面新聞
2026-05-21 12:12:47
繼蘿卜崗后,又出來“祖墳”崗?網友:誰能考上,一輩子有的吹了

繼蘿卜崗后,又出來“祖墳”崗?網友:誰能考上,一輩子有的吹了

社會日日鮮
2026-05-21 09:22:29
胡歌被正式確診為早F晚E,粉絲們都痛心不已

胡歌被正式確診為早F晚E,粉絲們都痛心不已

LULU生活家
2026-05-21 08:43:17
19歲男生凌晨2點多騎摩托被殺害,家屬稱兇手已被判處死刑!兇手:長期被噪音影響,想報復;死者父親:他遇害前一個月未騎摩托

19歲男生凌晨2點多騎摩托被殺害,家屬稱兇手已被判處死刑!兇手:長期被噪音影響,想報復;死者父親:他遇害前一個月未騎摩托

都市快報橙柿互動
2026-05-20 17:07:55
普京回去了,給人一種莫名的傷感!

普京回去了,給人一種莫名的傷感!

達文西看世界
2026-05-21 09:48:14
網戀10天奔現4天領證!安徽離異女子攜子與新婚丈夫露營走紅網絡

網戀10天奔現4天領證!安徽離異女子攜子與新婚丈夫露營走紅網絡

火山詩話
2026-05-21 06:43:02
被判賠三家車企共226萬元,知名汽車博主回應:正籌錢賠償,沒收任何黑心錢!律師:批評性言論須有可信證據支撐

被判賠三家車企共226萬元,知名汽車博主回應:正籌錢賠償,沒收任何黑心錢!律師:批評性言論須有可信證據支撐

每日經濟新聞
2026-05-21 00:51:17
楊梅才剛撲街,荔枝又被曝用藥!添加劑包裝曝光,評論區人心惶惶

楊梅才剛撲街,荔枝又被曝用藥!添加劑包裝曝光,評論區人心惶惶

譚談社會
2026-05-21 11:24:12
我定居日本20年,娶過3個妻子,發現日本的女人都有一個共同特點

我定居日本20年,娶過3個妻子,發現日本的女人都有一個共同特點

千秋文化
2026-05-20 20:33:05
職業運動員究竟有多厲害?網友:在天賦面前,努力一文不值!

職業運動員究竟有多厲害?網友:在天賦面前,努力一文不值!

另子維愛讀史
2026-05-21 08:03:05
A股:今天沖到4198后突然跳水,種種跡象表明,A股反彈浪已接近尾聲?

A股:今天沖到4198后突然跳水,種種跡象表明,A股反彈浪已接近尾聲?

趨勢清風俠
2026-05-21 11:13:14
越扒瓜越大!交大女學生吞獎金再添猛料,不止想進體制內這么簡單

越扒瓜越大!交大女學生吞獎金再添猛料,不止想進體制內這么簡單

觀史搜尋著
2026-05-21 05:41:15
恐怖!深圳深中通道雨水倒灌、大面積積水,有網友發帖一針見血

恐怖!深圳深中通道雨水倒灌、大面積積水,有網友發帖一針見血

火山詩話
2026-05-21 16:07:16
爭議!國際足聯重大錯誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊

爭議!國際足聯重大錯誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊

念洲
2026-05-21 08:02:07
光速失業!禁足名單內10人目前仍為現役球員或在足球行業從事

光速失業!禁足名單內10人目前仍為現役球員或在足球行業從事

懂球帝
2026-05-21 15:41:08
三大元兇引發跳水 后期策略

三大元兇引發跳水 后期策略

趨勢巡航
2026-05-21 14:55:48
上海工大男生課堂喊殺后續:大四重修生,老師道歉,學校回應來了

上海工大男生課堂喊殺后續:大四重修生,老師道歉,學校回應來了

奇思妙想草葉君
2026-05-21 02:23:55
今天直接跌成股災了

今天直接跌成股災了

曹多魚的財經世界
2026-05-21 15:35:37
為了給中國人留下好印象,一生出訪無數的普京,這次終于破了例

為了給中國人留下好印象,一生出訪無數的普京,這次終于破了例

福建睿平
2026-05-20 14:09:24
2026-05-21 18:11:00
ScienceAI incentive-icons
ScienceAI
關注人工智能與其他前沿技術
1307文章數 227關注度
往期回顧 全部

科技要聞

好到離譜也不夠!英偉達交出816億美元營收

頭條要聞

中紀委連打三"虎":一人被指違規核發機動車號牌

頭條要聞

中紀委連打三"虎":一人被指違規核發機動車號牌

體育要聞

常住人口7000的小鎮,擁有了一支德甲球隊

娛樂要聞

反轉!金秀賢與金賽綸未成年時交往不實

財經要聞

英偉達業績超預!指引再新高仍不夠亮眼

汽車要聞

小鵬正在研發"高達" 融合機器人技術的主動懸架

態度原創

手機
本地
數碼
公開課
軍事航空

手機要聞

蘋果史詩級大改!20周年iPhone測試四曲面屏:告別直屏時代

本地新聞

用云錦的方式,打開江蘇南京

數碼要聞

AMD攜手多家中國臺灣地區OSAT企業推進新一代EFB技術研發

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗警告:任何新襲擊將促使戰場擴大到中東以外

無障礙瀏覽 進入關懷版