網易首頁 > 網易號 > 正文 申請入駐

微軟推出Maia 200?提升?AI?推理門檻

0
分享至

微軟(Microsoft) 推出了 Maia 200,這是其用于驅動 AI 工作負載的自研芯片的最新迭代版本。Maia 200 擁有一些令人印象深刻的數據,包括 10 petaflops 的 FP4 算力和 216GB 的HBM3,這讓 Microsoft 及其 Azure 云在 AI Token 生成方面獲得了立竿見影的提升。更重要的是,這給了 Microsoft在自研 AI 加速器方面超越 AWS 和 Google Cloud 的底氣。


Microsoft 表示,Maia 200 是其首款專門解決 AI 性能挑戰的芯片。除了原始的數字運算能力,AI 推理還需要大量高速內存,以及內存和處理器之間的高速鏈接。Maia 200 似乎在這兩個方面都有所斬獲。

Maia 200 采用臺積電 3nm (納米)工藝開發,功耗設計(TDP)為 750 瓦。Maia 200 的核心包含兩個執行引擎:一個是用于高吞吐量矩陣乘法和卷積的 Tile Tensor Unit(TTU:Tile 張量處理單元),支持 FP8、FP6和 FP4 精度;另一個是用于 SIMD(單指令多數據)指令的 Tile Vector Processor(TVP:Tile 向量處理器),提供 FP8、BF16和 FP32 處理能力。TTU 和 TVP 執行引擎連接到 216GB 的高帶寬內存(HBM3)以及 272MB 的片上TSRAM(Tile 靜態隨機存取存儲器)。

Maia 200 配備了一個直接內存訪問(DMA)子系統,用于在 TSRAM 和TTU 之間保持數據流動,以及一個小的 Tile Control Processor(TCP:Tile 控制處理器)來協調TTU 和 DMA 之間的工作。

根據 Azure 工程博客中 Saurabh Dighe(系統與架構副總裁)和 Artour Levin(AI 硅工程副總裁)撰寫的 Maia 200 深度解析,Maia 200 架構的一個決定性特征是其豐富的內存和內存層次結構?!斑@種巨大的片上內存資源支持廣泛的各種低延遲、高帶寬的數據管理策略?!彼麄儗懙馈!癈SRAM 和 TSRAM都是完全軟件管理的,允許開發者——或編譯器/運行時——確定性地放置和固定數據,以精確控制數據的局部性和移動?!?/p>


Maia 200 芯片配備了片上以太網網絡接口卡(NIC),與相鄰芯片之間提供每秒 2.8 TB 的雙向帶寬。據 Dighe 和 Levin 介紹,Maia 200 采用了“兩層、縱向擴展”拓撲結構,結合了基于以太網的縱向擴展互連,可在包含多達 6,144 個加速器的集群中提供高帶寬、低延遲通信。

Microsoft 表示,它可以在一個“兩層、縱向擴展”集群拓撲中連接多達6,144 個 Maia 200 加速器。

據 Dighe 和Levin 稱,Maia 200 的 Tile 級處理能力,結合 DMA 和片上網絡能力,使芯片能夠達到當今大規模 AI 工作負載所需的廣泛規模?!癉MA 引擎專為多通道、高帶寬傳輸而設計,支持 1D/2D/3D 步進移動,使常見的 ML 張量布局能夠在片上 SRAM、HBM和外部接口之間高效移動,同時實現數據移動與計算的重疊,”他們寫道?!巴瑫r,NoC 在集群和內存子系統之間提供可擴展、低延遲的通信,并支持單播和多播傳輸——這是分發張量塊和協調并行執行的重要能力?!?/p>

距離 Microsoft 推出 Maia 100——其首款專門用于 AI 推理的第一代 AI 加速器——剛剛過去兩年多。Maia 100 采用臺積電 5 納米工藝開發,提供每秒 1.8 TB 的雙向內存帶寬和 64GB SRAM。它提供 3.2 petaflops 的 MXFP4 性能和 1.6 petaflops 的 FP8 或 MXInt8 性能,大約是Maia 200 的三分之一。

Maia 200 的能力與其他頂級 AI 加速器相當,使其成為“AI 推理動力源”,Microsoft 云和 AI 執行副總裁 Scott Guthrie 表示:“實際上,Maia 200 可以輕松運行當今最大的模型,并為未來更大的模型留出充足的空間。”“Maia 200 是來自任何超大規模云服務商的最強大的第一方硅芯片,其 FP4 性能是第三代 Amazon Trainium 的三倍,FP8 性能高于 Google 第七代 TPU?!彼€補充說:“Maia 200 也是 Microsoft 部署過的最高效的推理系統,與目前我們機群中的最新代硬件相比,性能提升了 30%?!?/p>


Maia 200 可在風冷和水冷環境中運行。它的設計旨在與 Azure 的第三方 GPU 機群協同工作,并遵守機架、電源和機械架構的標準。它集成到 Azure 的原生控制平面中,Microsoft 這使得部署和服務變得輕而易舉,同時與同一數據中心空間內的其他 AI 加速器和諧共存。

Microsoft 計劃使用其 Maia 200 芯片運行各種模型,包括最新的 OpenAI GPT-5.2 模型。它還將用于生成合成數據,供 AI 模型用于訓練目的。新芯片目前部署在 Microsoft 位于愛荷華州得梅因附近的 Central 數據中心區域。它接下來將部署在亞利桑那州鳳凰城附近的 US West 3 數據中心區域,未來還會有更多區域跟進。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
扎心!丈夫勸妻子停止化療,怕人財兩空,網友:這或是最好的決定

扎心!丈夫勸妻子停止化療,怕人財兩空,網友:這或是最好的決定

火山詩話
2026-05-02 17:54:15
荷蘭光刻機巨頭急了:中國人太聰明,封鎖中國先餓死的是西方企業

荷蘭光刻機巨頭急了:中國人太聰明,封鎖中國先餓死的是西方企業

同一片??绽?/span>
2026-05-03 00:57:55
5月開始將迎來4大降價潮:除房價以外,這幾類也開始降價了

5月開始將迎來4大降價潮:除房價以外,這幾類也開始降價了

梁佇愛玩車
2026-05-01 21:50:57
2026北京車展:113.98萬起!4.0T V8!爆500馬力!全新奧迪SQ8上市!

2026北京車展:113.98萬起!4.0T V8!爆500馬力!全新奧迪SQ8上市!

聊聊車生活
2026-05-03 10:09:48
吃他汀不能碰牛奶?多次警告:不止牛奶,這5物再饞也要忌嘴

吃他汀不能碰牛奶?多次警告:不止牛奶,這5物再饞也要忌嘴

小胡軍事愛好
2026-05-03 10:03:21
55年,薄一波同志如果參與授銜,應該授什么軍銜?這個軍銜最合適

55年,薄一波同志如果參與授銜,應該授什么軍銜?這個軍銜最合適

薦史
2026-05-02 17:21:51
廣東3消息!杜鋒更衣室發言曝光,胡明軒做尿檢,徐昕做好準備

廣東3消息!杜鋒更衣室發言曝光,胡明軒做尿檢,徐昕做好準備

多特體育說
2026-05-03 11:41:31
“窮人炫富,難掩心酸!”男大學生炫耀坐高鐵一等座,因長相被嘲

“窮人炫富,難掩心酸!”男大學生炫耀坐高鐵一等座,因長相被嘲

妍妍教育日記
2026-04-24 09:05:03
百億美元砸出的荒誕死局:一國正規軍為何永遠打不贏一支民兵

百億美元砸出的荒誕死局:一國正規軍為何永遠打不贏一支民兵

寰球經緯所
2026-04-20 22:59:41
中國足球未來無望?孫繼海:試訓40人最終0人入圍 可怕!太可怕了

中國足球未來無望?孫繼海:試訓40人最終0人入圍 可怕!太可怕了

風過鄉
2026-05-02 18:34:46
一嫁日本,二嫁美國,三嫁法國,絕不嫁中國人的李勤勤,咋樣了?

一嫁日本,二嫁美國,三嫁法國,絕不嫁中國人的李勤勤,咋樣了?

傲傲講歷史
2026-03-09 10:19:52
以革命的名義殺人,對法國大革命的重新審視與批判

以革命的名義殺人,對法國大革命的重新審視與批判

壹家言
2026-04-28 20:27:12
38歲袁姍姍曬近況疑整容失敗!撞臉楊冪被指認不出,鼻子突兀變化大

38歲袁姍姍曬近況疑整容失敗!撞臉楊冪被指認不出,鼻子突兀變化大

八卦王者
2026-05-02 13:16:05
賽后謝場環節,浙江死忠球迷區打出橫幅:拒絕外行指導內行

賽后謝場環節,浙江死忠球迷區打出橫幅:拒絕外行指導內行

懂球帝
2026-05-02 22:44:16
汪小菲他爸,汪則翰,可真不是一般人

汪小菲他爸,汪則翰,可真不是一般人

小鯨叫我照顧海
2026-05-01 23:38:19
兩年8次手術!早已透支!他今年會離隊嗎?

兩年8次手術!早已透支!他今年會離隊嗎?

柚子說球
2026-05-02 12:30:03
騎士3-3猛龍!哈登談搶七把話挑明,米切爾毫無退路,2點也成關鍵

騎士3-3猛龍!哈登談搶七把話挑明,米切爾毫無退路,2點也成關鍵

魚崖大話籃球
2026-05-02 16:31:09
石油巨震!阿聯酋宣布退出歐佩克!話音剛落,中國就發現了新油田

石油巨震!阿聯酋宣布退出歐佩克!話音剛落,中國就發現了新油田

探源歷史
2026-05-03 02:07:29
足壇瘋狂一夜:阿森納橫掃富勒姆,大巴黎爆冷丟分,巴薩2-1險勝

足壇瘋狂一夜:阿森納橫掃富勒姆,大巴黎爆冷丟分,巴薩2-1險勝

足球狗說
2026-05-03 05:19:37
人不會無緣無故患帶狀皰疹!調查發現:得帶狀皰疹,離不開這5點

人不會無緣無故患帶狀皰疹!調查發現:得帶狀皰疹,離不開這5點

岐黃傳人孫大夫
2026-05-01 14:35:03
2026-05-03 12:56:49
Ai時代前沿
Ai時代前沿
人工智能新聞動態及應用案例。
1726文章數 512關注度
往期回顧 全部

科技要聞

庫克罕見"拒答"!蘋果正被AI供應鏈卡脖子

頭條要聞

上海科技大學王晨輝教授因營救至親不幸去世 年僅39歲

頭條要聞

上海科技大學王晨輝教授因營救至親不幸去世 年僅39歲

體育要聞

裁判準備下班,結果吳宜澤進了決賽

娛樂要聞

蔡卓妍婚后首現身 戴結婚戒指笑容不斷

財經要聞

后巴菲特時代,首場股東會透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

健康
家居
房產
教育
時尚

干細胞治燒燙傷面臨這些“瓶頸”

家居要聞

靈動實用 生活藝術場

房產要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

教育要聞

能者不想干,中學行政“空心化”何時休?

春天別總傻傻穿一身黑,看看這些日常穿搭,高級舒適又優雅

無障礙瀏覽 進入關懷版