无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

4倍性能、50%成本降幅!亞馬遜強勢推出Trainium3芯片,AI訓(xùn)練推理增添新選項!

0
分享至

當(dāng)?shù)貢r間 12 月 2 日,亞馬遜云計算服務(wù)(AWS)在美國拉斯維加斯舉辦的年度云計算盛會“AWS re:Invent 2025”上發(fā)布了全新的自研 Trainium3 芯片,以及采用 Trainium3 芯片的 Trainium3 UltraServer 服務(wù)器。

根據(jù)首席執(zhí)行官 Matt Garman 的介紹,新款 Trainium3 芯片的性能是前代產(chǎn)品的 4 倍,并采用臺積電 3 納米工藝制造。每個芯片都配備了 144 GB 的 HBM3E 內(nèi)存,內(nèi)存帶寬為 4.9 TB/s,提供 2.52 FP8 PFLOPs 的算力。

(來源:社交媒體 X)

Trainium3 UltraServer 單機(jī)最多集成 144 顆 Trainium3 芯片,總共配備 20.7 TB HBM3E、706 TB/s 內(nèi)存帶寬,可提供最高 362 FP8 PFLOPS 的算力,時延降低 4 倍,可更快訓(xùn)練超大模型,并大規(guī)模支撐推理服務(wù)。

其計算性能比 Trainium2 UltraServer 高出 4.4 倍,能源效率高出 4 倍,內(nèi)存帶寬也高出近 4 倍。在使用 OpenAI 的開源大模型 GPT-OSS 進(jìn)行測試時,Trainium3 UltraServer 的單芯片吞吐量可提升 3 倍,推理響應(yīng)速度提升 4 倍。這意味著企業(yè)可以在更小的基礎(chǔ)設(shè)施規(guī)模下應(yīng)對峰值需求,顯著優(yōu)化用戶體驗,同時降低每次推理請求的成本。

AWS 以垂直整合方式打造 Trainium3 UltraServer,從芯片架構(gòu)到軟件棧全鏈路協(xié)同。核心之一是新一代網(wǎng)絡(luò)基礎(chǔ)設(shè)施,用于消除傳統(tǒng)分布式 AI 計算的通信瓶頸:NeuronSwitch-v1 提供 2 倍 的 UltraServer 內(nèi)部帶寬;增強型 Neuron Fabric 將芯片間通信延遲降低至 10 微秒以內(nèi)。

這種強大的配置使得它非常適合處理下一代最前沿的 AI 工作負(fù)載,例如:訓(xùn)練大規(guī)模AI模型,可以將復(fù)雜模型的訓(xùn)練時間從數(shù)月縮短至數(shù)周;處理高并發(fā)的 AI 推理請求,以低延遲實時處理數(shù)百萬用戶的請求,例如智能對話、視頻生成等;運行特定復(fù)雜任務(wù),如智能體系統(tǒng)、專家混合模型和大規(guī)模強化學(xué)習(xí)等。

包括 Anthropic、Karakuri、Metagenomi、NetoAI、Ricoh、Splash Music 等客戶,已經(jīng)借助 Trainium 將訓(xùn)練和推理成本降低最多 50%。其中,Decart 在實時生成式視頻方面實現(xiàn)了 4 倍推理速度提升,成本僅為 GPU 的一半;而 Amazon Bedrock 已經(jīng)在生產(chǎn)環(huán)境中使用 Trainium3 提供服務(wù)。

(來源:社交媒體 X)

對于需要更大規(guī)模的客戶,EC2 UltraCluster 3.0 可連接數(shù)千臺 UltraServer,構(gòu)成擁有多達(dá) 100 萬顆 Trainium 芯片的集群——是上一代的 10 倍。這使得此前完全不可能的任務(wù)成為現(xiàn)實:從在萬億級 token 數(shù)據(jù)集上訓(xùn)練多模態(tài)模型,到為數(shù)百萬并發(fā)用戶提供實時推理服務(wù)。

自研芯片是亞馬遜的重要戰(zhàn)略項目之一,目標(biāo)是避免過度依賴昂貴的英偉達(dá)硬件。而對于 Trainium3 來說,一個關(guān)鍵問題在于:有多少大型外部客戶會愿意采用這套硬件。尤其是在谷歌旗下的 TPU 持續(xù)搶占 AI 芯片市場的背景下。

另一個重要變量是 AI 初創(chuàng)公司 Anthropic 的芯片采購分配。今年 10 月,Anthropic 宣布與谷歌達(dá)成合作,將使用多達(dá) 100 萬顆谷歌 TPU 芯片,以實現(xiàn)除亞馬遜和英偉達(dá)之外的供應(yīng)多元化。

Anthropic 表示,亞馬遜仍是其主要訓(xùn)練合作伙伴與云服務(wù)提供商。該公司預(yù)計,到今年年底,將使用超過 100 萬顆 Trainium 2 芯片,其中包括運行在擁有近 50 萬顆 Trainium 處理器的 Project Rainier 超級計算機(jī)之上。

此外,AWS 也預(yù)告了下一代 AI 訓(xùn)練芯片 Trainium4 的研發(fā)進(jìn)展。其在各方面都將實現(xiàn)大幅性能躍升,包括處理性能(FP4)至少提升 6 倍、FP8 性能提升 3 倍、內(nèi)存帶寬提升 4 倍。結(jié)合持續(xù)的軟硬件優(yōu)化,其實際性能提升將遠(yuǎn)超基準(zhǔn)數(shù)值。


其中,F(xiàn)P8 提升 3 倍是一次基礎(chǔ)性飛躍。模型訓(xùn)練至少快 3 倍,推理吞吐量也至少提升 3 倍,并且隨著軟件優(yōu)化將獲得進(jìn)一步加成。FP8 已成為現(xiàn)代 AI 工作負(fù)載在精度與效率之間的行業(yè)標(biāo)準(zhǔn)格式。

為進(jìn)一步提升單機(jī)擴(kuò)展性能,Trainium4 將支持 NVIDIA NVLink Fusion 高速互聯(lián)技術(shù)。該能力將使 Trainium4、AWS Graviton 處理器及 Elastic Fabric Adapter(EFA)能在統(tǒng)一 MGX 機(jī)架內(nèi)協(xié)同工作,為客戶提供支持 GPU 與 Trainium 的成本更優(yōu)、性能更強的機(jī)架級 AI 基礎(chǔ)設(shè)施。

這一整合將構(gòu)建一個靈活、高性能的平臺,優(yōu)化應(yīng)對未來對訓(xùn)練與推理都極其苛刻的 AI 工作負(fù)載。

https://www.aboutamazon.com/news/aws/trainium-3-ultraserver-faster-ai-training-lower-cost

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
南方"小清華"賺麻了,卻依然是中國最被低估的頂級985

南方"小清華"賺麻了,卻依然是中國最被低估的頂級985

新10億商業(yè)參考
2026-06-22 09:35:17
《諜影重重》換血!贊達(dá)亞接棒馬特·達(dá)蒙

《諜影重重》換血!贊達(dá)亞接棒馬特·達(dá)蒙

追星雷達(dá)站
2026-06-25 00:37:33
94歲原中央保健局局長王敏清:50年沒感冒,無三高,靠的就是這幾招

94歲原中央保健局局長王敏清:50年沒感冒,無三高,靠的就是這幾招

新浪財經(jīng)
2026-06-24 02:28:33
“明史”可不可信,國家明史修訂工程:重新發(fā)現(xiàn)8400多條錯誤

“明史”可不可信,國家明史修訂工程:重新發(fā)現(xiàn)8400多條錯誤

百家雜評
2026-06-24 07:35:42
向太曝馬伊琍已再婚:當(dāng)年文章過不了心理那關(guān)

向太曝馬伊琍已再婚:當(dāng)年文章過不了心理那關(guān)

娛樂看阿敞
2025-12-12 15:50:00
終于沒了!大量應(yīng)用開屏廣告被取消,App 秒進(jìn)時代回歸

終于沒了!大量應(yīng)用開屏廣告被取消,App 秒進(jìn)時代回歸

XCiOS俱樂部
2026-06-24 19:44:49
中國足壇6月24日迎來久違巨星!曾是英格蘭隊主力,已現(xiàn)身村超

中國足壇6月24日迎來久違巨星!曾是英格蘭隊主力,已現(xiàn)身村超

振剛說足球
2026-06-25 10:01:32
確定壓倒四支小組第三,波黑4分、-1凈勝球晉級32強!

確定壓倒四支小組第三,波黑4分、-1凈勝球晉級32強!

懂球帝
2026-06-25 08:10:33
捷克0-3墨西哥 積1分小組墊底出局 40歲門將奧喬亞替補登場創(chuàng)紀(jì)錄

捷克0-3墨西哥 積1分小組墊底出局 40歲門將奧喬亞替補登場創(chuàng)紀(jì)錄

我愛英超
2026-06-25 11:02:14
6月25日俄烏:克里米亞繼續(xù)挨炸,烏克蘭成功改變戰(zhàn)場態(tài)勢

6月25日俄烏:克里米亞繼續(xù)挨炸,烏克蘭成功改變戰(zhàn)場態(tài)勢

山河路口
2026-06-25 19:42:59
俄羅斯頻繁喊話烏克蘭和談

俄羅斯頻繁喊話烏克蘭和談

原某報記者
2026-06-25 11:05:40
被曝門緊閉、不見人?實探“靠譜老王” 背后深圳公司,本人最新回應(yīng)

被曝門緊閉、不見人?實探“靠譜老王” 背后深圳公司,本人最新回應(yīng)

南方都市報
2026-06-25 08:27:29
陳敏兒安息禮倆兒子送花圈,遺照笑容慈祥,94歲胡楓來送最后一程

陳敏兒安息禮倆兒子送花圈,遺照笑容慈祥,94歲胡楓來送最后一程

洲洲影視娛評
2026-06-25 23:16:15
辦世界杯竟成燙手山芋,2030年僅兩個申辦國,為啥沒人搶?

辦世界杯竟成燙手山芋,2030年僅兩個申辦國,為啥沒人搶?

嘆為觀止易
2026-06-08 14:22:53
張維為:中國哲學(xué)從不信奉所謂的“絕對真理”

張維為:中國哲學(xué)從不信奉所謂的“絕對真理”

看看新聞Knews
2026-06-24 23:22:23
當(dāng)今社會存在的五類蛀蟲,第五種最可恨!

當(dāng)今社會存在的五類蛀蟲,第五種最可恨!

細(xì)說職場
2026-06-25 23:28:32
華為余承東:我們的理念和特斯拉不一樣,尊界S800Grand Design典藏大觀面向L3+自動駕駛設(shè)計

華為余承東:我們的理念和特斯拉不一樣,尊界S800Grand Design典藏大觀面向L3+自動駕駛設(shè)計

金融界
2026-06-25 22:41:11
委內(nèi)瑞拉7.2級地震后現(xiàn)7.5級余震,特朗普愿提供援助

委內(nèi)瑞拉7.2級地震后現(xiàn)7.5級余震,特朗普愿提供援助

地球記
2026-06-25 23:51:19
印代表團(tuán)訪華后,回國對莫迪說了句狠話:不親近中國就淪為盤中餐

印代表團(tuán)訪華后,回國對莫迪說了句狠話:不親近中國就淪為盤中餐

好賢觀史記
2026-06-25 15:15:08
油價要跌破天了!6月23日油價迎來大幅暴跌,調(diào)價后全國油價價格

油價要跌破天了!6月23日油價迎來大幅暴跌,調(diào)價后全國油價價格

娛樂圈的筆娛君
2026-06-23 19:50:23
2026-06-26 00:51:00
問芯 incentive-icons
問芯
訪遍天下芯事,聆聽大時代人物芯聲
179文章數(shù) 28關(guān)注度
往期回顧 全部

科技要聞

存儲成本壓力山大!蘋果罕見全球提價

頭條要聞

男子徒手抓蛇被咬還淡定合影 結(jié)果歷經(jīng)4次搶救兩進(jìn)ICU

頭條要聞

男子徒手抓蛇被咬還淡定合影 結(jié)果歷經(jīng)4次搶救兩進(jìn)ICU

體育要聞

世界杯最動人一吻:我若離世 你就改嫁吧

娛樂要聞

這國產(chǎn)劇太裝了,居然還熱播第一?

財經(jīng)要聞

又有紙尿褲送檢后被檢測出甲酰胺!

汽車要聞

老板們的新座駕!65萬元起,尊界V800/V680開啟預(yù)訂

態(tài)度原創(chuàng)

教育
親子
本地
數(shù)碼
旅游

教育要聞

6月24日,2026年河南普通高校招生批次錄取控制分?jǐn)?shù)線出爐

親子要聞

為什么醫(yī)生不輕易剖宮產(chǎn)?這個死里逃生的女人說出了原因

本地新聞

2026世界杯全勤太難?這份保姆級攻略請收好

數(shù)碼要聞

蘋果全面漲價!iPad和Mac起售價最高漲了3500元,暫未影響iPhone

旅游要聞

人生第一次去巴黎,最難忘的竟然是掃墓

無障礙瀏覽 進(jìn)入關(guān)懷版