无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

DeepSpeed v0.18.8 發布:穩定性、Evoformer、多架構構建與ZeRO優化全面升級詳解

0
分享至




DeepSpeed v0.18.8 于2026 年 3 月 13 日正式發布,這是一次以“修復問題 + 提升穩定性 + 改善開發與構建體驗”為核心目標的補丁版本。
該版本共包含9 次提交、16 個文件變更、260 行新增代碼、84 行刪除代碼,覆蓋訓練穩定性、日志控制、Evoformer 多架構支持、ZeRO Stage1/2/3、FP16 精度配置、NPU 構建、Async IO、測試與文檔等多個關鍵模塊。

本文將完全基于官方更新內容,對 DeepSpeed v0.18.8 的所有變更進行逐條拆解與系統化解讀,幫助你快速理解本次版本升級帶來的實際價值。

一、版本概覽與更新重點 1. 基本信息

  • ?版本號:v0.18.8

  • ?發布時間:2026 年 3 月 13 日

  • ?版本類型:Patch Release(補丁版本)

2. 核心更新方向總結

本次 v0.18.8 主要聚焦以下幾個方面:

  • ?日志與內存監控優化:減少無意義的日志噪音

  • ?Evoformer Attention 多架構構建修復:解決編譯與調度根因

  • ?FP16 loss_scale 校驗增強:避免隱性訓練錯誤

  • ?ZeRO Stage1/2/3 穩定性改進:CUDA stream 與日志行為修復

  • ?Bloom 模型推理測試修復

  • ?華為 Ascend NPU Async IO 構建問題修復

  • ?AI 編碼代理項目規范新增

  • ?測試覆蓋增強

  • ?版本號更新

二、日志與內存使用輸出優化 Suppress see_memory_usage logs

多個 ZeRO 相關模塊中,see_memory_usage的日志調用被統一優化:

  • ? 同一位置同時調用force=Trueforce=False

  • ? 在 rank0 或非必要場景下避免重復打印

涉及模塊包括:

  • ? ZeRO Offload

  • ? ZeRO Stage3

  • ? ZeRO Stage1 & Stage2

  • ? 參數分區與卸載流程

優化效果
  • ?顯著減少控制臺日志噪音

  • ?在大規模分布式訓練中提升可讀性

  • ? 不影響原有內存調試能力

三、Bloom 推理測試卡死問題修復 Fix hangs of bloom test

Bloom 推理容器在特定 Transformers 版本檢測邏輯中存在異常行為。

修復點

  • ? 原邏輯在檢測到 Transformers 版本超過 4.43.4 時,使用了sys.exit

  • ? 修復為直接拋出 RuntimeError

影響
  • ? 測試環境不再直接退出 Python 進程

  • ? 錯誤提示更加友好、可捕獲

  • ? CI 與自動化測試穩定性提升

四、FP16 loss_scale 校驗全面增強 Validate fp16.loss_scale is finite and non-negative

DeepSpeedFP16Config中,新增了對loss_scale的嚴格校驗邏輯。

新增校驗規則

  • ? 不允許為bool

  • ? 必須可轉換為數值

  • ? 必須是有限值(禁止 inf / -inf / nan)

  • ? 必須≥ 0

    • ?0表示啟用動態 loss scaling

對應測試用例新增
  • ? 覆蓋非法值:-1inf、nan、True

  • ? 覆蓋合法值:0、12.0、字符串數值

  • ? 錯誤類型時,錯誤信息清晰明確

實際價值
  • ? 避免訓練過程中出現難以排查的數值異常

  • ? 在配置階段即阻斷錯誤輸入

  • ? 提升 FP16 訓練的安全性與可維護性

五、Evoformer Attention:多架構構建與調度根因修復

這是v0.18.8 中技術含量最高、影響最深遠的更新之一。

1. 多架構 dispatch 根因修復 核心變化

  • ? 移除CheckArch中對__CUDA_ARCH__的依賴

  • ? 修復多架構構建時的邏輯沖突

  • ? 明確不同架構對 fp16 / bf16 的支持范圍

架構支持矩陣

架構

fp16

bf16

Sm70

支持

不支持

Sm75

支持

不支持

Sm80+

支持

支持


2. DISPATCH_ARCHTAG 宏邏輯重構

  • ? 不再依賴編譯期 GPU_ARCH 條件嵌套

  • ? 運行期根據 CC 直接選擇 Sm70 / Sm75 / Sm80

  • ? 不滿足 Tensor Core 條件直接報錯

好處
  • ? 多架構 CUDA slice 行為更一致

  • ? 解決 Evoformer 在混合 GPU 環境下的異常構建問題

3. DS_EVOFORMER_GPU_ARCH 正式廢棄 變化說明
  • ? 構建邏輯中不再讀取該環境變量

  • ? 設置該變量時僅發出警告

  • ?真正生效的構建控制方式為TORCH_CUDA_ARCH_LIST

新推薦方式

TORCH_CUDA_ARCH_LIST='7.0;8.0'
4. Evoformer 構建文檔全面更新

文檔明確說明:

  • ? Evoformer 僅支持 SM ≥ 70

  • ? Tensor Core 為必要條件

  • ? 多架構構建完全依賴TORCH_CUDA_ARCH_LIST

  • ? 低于 SM70 的目標會被自動裁剪

5. Evoformer Builder 測試新增

新增單元測試覆蓋:

  • ? 低于 7.0 的 CC 被過濾

  • ? +PTX 后綴正確保留

  • ? 不再生成-DGPU_ARCH編譯參數

  • ?CheckArch中不再包含__CUDA_ARCH__

六、Async IO:華為 Ascend NPU 構建問題修復 Fix async_io ops building error on Huawei Ascend NPU 修復內容
  • ? 修正源文件列表中缺失的逗號

  • ? 修復 CPU op 中對 NPU 判斷邏輯

  • ? 避免 torch_npu 未聲明導致的構建失敗

影響
  • ? Ascend NPU 環境下 Async IO 可正常編譯

  • ? 提升 DeepSpeed 在非 CUDA 平臺的可用性

七、ZeRO 系列模塊關鍵修復 1. ZeRO-3 CUDA stream 修復 修復點
  • ? 使用current_stream()替代default_stream()

  • ? 避免梯度歸約時的數據依賴問題

效果
  • ? CUDA Stream 同步更安全

  • ? 減少潛在死鎖與性能異常

2. ZeRO 參數卸載與分區日志修正
  • ? 多處print_rank_0重復 force 參數修復

  • ? see_memory_usage 行為統一

  • ? 提升多卡訓練日志一致性

3. ZeRO Stage1 & Stage2 穩定性增強
  • ? 優化 optimizer state 初始化前后的內存日志

  • ? 保持與 Stage3 行為一致

八、AI 編碼代理項目規則正式加入 新增 AGENTS.md 與 CLAUDE.md

兩份文件內容完全一致,作為DeepSpeed 工作區級 AI 編碼規范。

核心規則包括:

  • ? 提交必須帶 Signed-off-by

  • ? 強制 yapf + flake8

  • ? 禁止無意義格式化提交

  • ? 新文件必須包含 Apache-2.0 License Header

  • ? 不允許直接 import torch.distributed

  • ? 刪除無運行時價值的死代碼

  • ? 注釋強調“為什么”,而非“做什么”

意義
  • ? 明確 AI 編碼參與項目的行為邊界

  • ? 降低 Review 成本

  • ? 提升長期代碼質量與一致性

九、版本號更新
  • ?version.txt0.18.7 → 0.18.8

  • ? 正式標志該補丁版本發布完成

十、總結:為什么推薦升級到 v0.18.8

代碼地址:github.com/deepspeedai/DeepSpeed

DeepSpeed v0.18.8 雖然是一個 Patch 級別更新,但從實際改動內容來看,v0.18.8 已經遠遠超出了“簡單修 Bug”的范疇,而是一次針對穩定性、可維護性與未來演進方向的系統性修正版本

我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
吃他汀一顆南瓜子不能碰?提醒:不止南瓜子,這4樣食物也要小心

吃他汀一顆南瓜子不能碰?提醒:不止南瓜子,這4樣食物也要小心

芹姐說生活
2026-05-12 16:25:54
女子結婚不到一周,卻因摩洛哥新娘視頻導致離婚

女子結婚不到一周,卻因摩洛哥新娘視頻導致離婚

映射生活的身影
2026-05-12 12:13:28
浙大鄭強教授:我不承認中國大學生就業難,是舒服的工作難找,建議少點抱怨少點索取

浙大鄭強教授:我不承認中國大學生就業難,是舒服的工作難找,建議少點抱怨少點索取

TOP大學來了
2026-05-11 16:39:00
內塔尼亞胡稱“不喜歡中國向伊朗導彈制造提供的支持” 中方回應

內塔尼亞胡稱“不喜歡中國向伊朗導彈制造提供的支持” 中方回應

財聯社
2026-05-12 15:27:18
公然拒掛國旗,訂單全給日韓,長榮如今的結局早已注定

公然拒掛國旗,訂單全給日韓,長榮如今的結局早已注定

瀲滟晴方DAY
2026-05-11 06:31:37
揚眉吐氣史無前例!第一次把在任美國國務卿永久攔在中國國門外

揚眉吐氣史無前例!第一次把在任美國國務卿永久攔在中國國門外

雪中風車
2026-05-12 13:10:31
忍無可忍,烏克蘭與川普徹底攤牌,20國爭相與烏展開合作

忍無可忍,烏克蘭與川普徹底攤牌,20國爭相與烏展開合作

史政先鋒
2026-05-12 14:44:10
上海大學通報“院長蘇某某論文被舉報數據造假”:已成立調查組,啟動調查程序 ,將根據調查情況嚴肅認真處理

上海大學通報“院長蘇某某論文被舉報數據造假”:已成立調查組,啟動調查程序 ,將根據調查情況嚴肅認真處理

魯中晨報
2026-05-12 16:54:06
普京已經開始絕望:戰爭發生轉折了

普京已經開始絕望:戰爭發生轉折了

黔有虎
2026-05-11 20:02:09
15萬  !比亞迪又一款新車正式上市!

15萬 !比亞迪又一款新車正式上市!

科技堡壘
2026-05-12 13:03:17
女子推搡哨兵后續:官媒發聲,知情人爆料,恐不止坐牢這么簡單

女子推搡哨兵后續:官媒發聲,知情人爆料,恐不止坐牢這么簡單

千言娛樂記
2026-05-12 15:10:56
特朗普即將訪華,英媒:美已意識到中國比美國想象中更強大

特朗普即將訪華,英媒:美已意識到中國比美國想象中更強大

混沌錄
2026-05-11 18:07:10
大霧黃色預警繼續:山東江蘇等地局地有濃霧或強濃霧

大霧黃色預警繼續:山東江蘇等地局地有濃霧或強濃霧

界面新聞
2026-05-12 18:11:19
穿禮服后退款后續:女子身份曝光社死,工作遭牽連,商家準備起訴

穿禮服后退款后續:女子身份曝光社死,工作遭牽連,商家準備起訴

八斗小先生
2026-05-12 17:23:09
林浩:汶川地震9歲小英雄,被姚明抱上奧運,發誓考清華,現狀如何

林浩:汶川地震9歲小英雄,被姚明抱上奧運,發誓考清華,現狀如何

阿傖說事
2026-05-12 12:24:10
北京G3半場逆轉廣東!聯防+雙小外立功,周琦統治籃下,廣東靠2將

北京G3半場逆轉廣東!聯防+雙小外立功,周琦統治籃下,廣東靠2將

籃球資訊達人
2026-05-12 20:33:39
京滬高鐵漲價,罵聲一片

京滬高鐵漲價,罵聲一片

鳳眼論
2026-05-12 16:53:49
今早高峰江場路近云秀路SUV側翻釀3車事故 駕駛員脫困幸無人員傷亡

今早高峰江場路近云秀路SUV側翻釀3車事故 駕駛員脫困幸無人員傷亡

上觀新聞
2026-05-12 17:38:06
彭加木被找到了!知情人:DNA專家說99%就是彭加木,但有個遺憾!

彭加木被找到了!知情人:DNA專家說99%就是彭加木,但有個遺憾!

拳擊時空
2026-05-12 05:55:35
美媒披露:阿聯酋秘密對伊朗發動軍事打擊

美媒披露:阿聯酋秘密對伊朗發動軍事打擊

參考消息
2026-05-12 20:36:12
2026-05-12 21:39:00
moonfdd incentive-icons
moonfdd
福大大架構師每日一題
1221文章數 67關注度
往期回顧 全部

科技要聞

宇樹發布載人變形機甲,定價390萬元起

頭條要聞

新電動車到手不足一月頻繁自動鎖死 老人被摔傷五六次

頭條要聞

新電動車到手不足一月頻繁自動鎖死 老人被摔傷五六次

體育要聞

總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

娛樂要聞

白鹿風波升級!掉粉20萬評論區淪陷

財經要聞

黃仁勛真是被白宮徹底封殺了

汽車要聞

吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

態度原創

旅游
房產
藝術
本地
公開課

旅游要聞

藏在南京新街口的老巷子,你知道哪幾條

房產要聞

穗八條引爆樓市!萬博寶藏紅盤,五一勁銷出圈

藝術要聞

這位畫家的油畫美人讓人驚嘆不已!

本地新聞

用蘇繡的方式,打開江西婺源

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版