網易首頁 > 網易號 > 正文 申請入駐

阿里發布Qwen3-Max,性能超GPT5,躋身全球前三

0
分享至

9月24日,2025云棲大會開幕,阿里通義旗艦模型Qwen3-Max重磅亮相,性能超過GPT5、Claude Opus 4等,躋身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)兩大版本,其預覽版已在 Chatbot Arena 排行榜上位列第三,正式版性可望再度實現突破。

Qwen3-Max為通義千問家族中最大、最強的基礎模型。該模型預訓練數據量達36T tokens,總參數超過萬億,擁有極強的Coding編程能力和Agent工具調用能力。在大模型用Coding解決真實世界問題的SWE-Bench Verified測試中,Instruct版本斬獲69.6分,位列全球第一梯隊;在聚焦Agent工具調用能力的Tau2-Bench測試中,Qwen3-Max取得突破性的74.8分,超過Claude Opus4和DeepSeek-V3.1。

Qwen3-Max的推理增強版本Qwen3-Max-Thinking-Heavy也展現出非凡性能,結合工具調用和并行推理技術,其推理能力創下新高,尤其在聚焦數學推理的AIME 25和HMMT測試中,均達到突破性的滿分100分,為國內首次。Qwen3-Max推理模型之所以能夠取得優異成績,原因在于大模型在解數學題時懂得調動工具,能夠寫代碼做題,同時,增加測試時的計算資源,也讓模型表現變得更好。

大模型預訓練原理Scaling Law(規模化法則)認為,持續地增長數據和參數規模,是通向 AGI 的可能路徑之一。由于自然數據的數量有限,當前有部分學者認為預訓練的Scaling Law即將逼近上限,而Qwen3-Max的性能突破顯示,繼續增大數據、模型參數,依然能鍛造出更強的模型,給予了大家更多的信心。目前,通義千問系列模型已經實現從0.5B到超萬億的全尺寸覆蓋,包含三百多個大模型,可滿足不同場景的需求。

即日起,用戶可在通義千問QwenChat上免費體驗Qwen3-Max,也可通過阿里云百煉平臺調用API服務。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
黃亞光建議鈔票設計毛澤東頭像,毛主席聽后:可以印上偉人的頭像

黃亞光建議鈔票設計毛澤東頭像,毛主席聽后:可以印上偉人的頭像

大運河時空
2026-04-21 17:15:03
B站最無聊的UP主,拋了十萬次硬幣證明正反面概率不是1比1

B站最無聊的UP主,拋了十萬次硬幣證明正反面概率不是1比1

17173游戲網
2026-04-21 13:44:24
寧馬線開通場面太火爆,有乘客等三趟車沒擠上

寧馬線開通場面太火爆,有乘客等三趟車沒擠上

現代快報
2026-04-22 14:20:23
僅差4票!歷史首次!亞歷山大全收割!聯盟第一人?

僅差4票!歷史首次!亞歷山大全收割!聯盟第一人?

籃球盛世
2026-04-22 14:36:43
政治上封殺,文化上封神

政治上封殺,文化上封神

最愛歷史
2026-04-20 13:07:36
如今定居廣東的朱芳雨,大兒走籃球路,二兒優秀低調,三兒最瀟灑

如今定居廣東的朱芳雨,大兒走籃球路,二兒優秀低調,三兒最瀟灑

翰飛觀事
2026-04-22 14:42:17
李榮浩報平安“人沒事,手機撈回來了,到家了”,網友:我還在下游等著撈手機呢

李榮浩報平安“人沒事,手機撈回來了,到家了”,網友:我還在下游等著撈手機呢

瀟湘晨報
2026-04-21 22:26:12
中國游客暴跌55.9%,日本361萬游客擠爆櫻花季,缺口被全球填平

中國游客暴跌55.9%,日本361萬游客擠爆櫻花季,缺口被全球填平

芳姐侃社會
2026-04-21 16:37:18
中國,第二次被蛇咬?

中國,第二次被蛇咬?

美第奇效應
2026-04-21 21:53:03
央國企倒查追責,再次升級!

央國企倒查追責,再次升級!

細說職場
2026-04-22 15:35:36
51歲何潤東騎自行車買早飯,妻子林姵希蹬車小腿纖細,很般配

51歲何潤東騎自行車買早飯,妻子林姵希蹬車小腿纖細,很般配

娛樂圈圈圓
2026-04-22 10:45:56
功莫大于斬首,計莫毒于絕糧——特朗普雙向封鎖,欲困死伊朗?

功莫大于斬首,計莫毒于絕糧——特朗普雙向封鎖,欲困死伊朗?

高博新視野
2026-04-21 08:00:23
副省級城市兩位市委常委先后落馬

副省級城市兩位市委常委先后落馬

上觀新聞
2026-04-21 10:32:09
廣東汕尾一地下車庫新能源電動汽車起火:已處置完畢,無傷亡

廣東汕尾一地下車庫新能源電動汽車起火:已處置完畢,無傷亡

澎湃新聞
2026-04-22 17:52:30
訂單銳減,廣東東莞15年電氣大廠經濟性裁員

訂單銳減,廣東東莞15年電氣大廠經濟性裁員

微微熱評
2026-04-22 11:48:16
揭秘:美西方怎么就因為一個WPS文檔格式就炸鍋了?

揭秘:美西方怎么就因為一個WPS文檔格式就炸鍋了?

林子說事
2026-04-20 07:40:10
楊尚昆揭秘:博古葉挺遺體運回延安,毛主席為何沒參加追悼會?

楊尚昆揭秘:博古葉挺遺體運回延安,毛主席為何沒參加追悼會?

輿圖看世界
2026-04-21 15:50:03
觸目驚心,大學生正在淪為最廉價勞動力,教育初心何在?

觸目驚心,大學生正在淪為最廉價勞動力,教育初心何在?

宏哥談商道
2026-04-18 19:00:03
周潤發也沒想到,梁家輝5奪影帝后說的一番話,幫他實現口碑暴漲

周潤發也沒想到,梁家輝5奪影帝后說的一番話,幫他實現口碑暴漲

天馬幸福的人生
2026-04-21 21:59:31
五連敗切爾西徹底崩盤!主帥放豪言:6年合同在手,絕不下課!

五連敗切爾西徹底崩盤!主帥放豪言:6年合同在手,絕不下課!

田先生籃球
2026-04-22 06:57:15
2026-04-22 19:31:00
鹿鳴財經
鹿鳴財經
科技新媒體,專注新金融研究。
2912文章數 2209關注度
往期回顧 全部

科技要聞

對話梅濤:沒有視頻底座,具身智能走不遠

頭條要聞

三甲醫院科主任被舉報"巨額財產來源不明" 舉報人發聲

頭條要聞

三甲醫院科主任被舉報"巨額財產來源不明" 舉報人發聲

體育要聞

網易傳媒再度簽約法國隊和阿根廷隊

娛樂要聞

復婚無望!baby黃曉明陪小海綿零交流

財經要聞

伊朗拒絕出席 特朗普宣布延長停火期限

汽車要聞

純電續航301km+激光雷達 宋Pro DM-i飛馳版9.99萬起

態度原創

數碼
教育
房產
旅游
時尚

數碼要聞

Beats發布3米USB-C數據線:售229元 最高240W快充

教育要聞

重磅!中招自主招生政策發布

房產要聞

狂搶284輪!中海海口再拿重磅宅地!

旅游要聞

跟著天氣游山東|淄博·風止雨霽 邂逅一場煙火與詩

初夏穿赫本的白褲子,清新又高級!

無障礙瀏覽 進入關懷版