无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

阿里發布新一代千問旗艦模型Qwen3.7-Max,登頂最佳國產模型

0
分享至

圖說:Qwen3.7-Max發布,位列國產模型第一圖說:Qwen3.7-Max可獨立執行35小時的長程復雜任務

5月20日,阿里巴巴發布全新一代千問旗艦模型Qwen3.7-Max,在三方機構Arena全球大模型盲測總榜中,Qwen3.7-Max超過Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,與GPT、Claude、Gemini最強模型接近,位列國產模型第一。千問3.7面向當下智能體(Agent)全新設計,實現了編程、推理等核心能力的持續突破,甚至可全自主完成35小時的超長程智能體復雜任務:在一個全新的芯片平臺上,Qwen3.7-Max通過自主編程和超1000次工具調用,實現了一個關鍵內核的自我進化,推理速度較原版本提升10倍。



阿里大模型研發顯著加速,近3個月內,千問旗艦大模型已穩定迭代了3.5、3.6、3.7三個版本,不斷抬高國產模型的性能上限,Qwen3.7-Max在數項權威評測中位居前列:在編程智能體方面,Qwen3.7-Max 在 SWE-Pro、SWE-Multilingual等測評中均取得領先表現,在Terminal Bench 2.0-Terminus得分69.7,超過了DeepSeek-v4-pro-Max、Claude-Opus4.6等一眾模型;在通用智能體方面,Qwen3.7-Max提升顯著,在MCP-Atlas、MCP-Mark、Skillbench等現實能力測試中表現優異,超越GLM5.1、Kimi-K2.6等,創下國產新高,并在 Kernel Bench L3上展示了強大的 GPU 內核優化能力;推理能力上, Qwen3.7-Max 在GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench等推理核心測評中均超越了Claude-Opus4.6及所有國產模型;在通用能力與多語言方面,Qwen3.7-Max 在指令遵循 IFBench 評測中得分79.1分突破新高,在多語言理解和翻譯的WMT24++、MAXIFE評測中領先。

當下,編程能力已成為衡量LLM大語言模型的核心指標,Qwen3.7-Max較上代模型實現了大幅提升,從前端原型開發到復雜的多文件工程均能駕馭。在評估AI解決真實世界的實戰編程任務SWE-bench系列測評、面向真實科學問題的編程測評SciCode中,Qwen3.7-Max較Qwen3.6-Plus大幅提升,并超越了Claude Opus 4.6-Max、Kimi-K2.6、DeepSeek-v4-Pro-Max等模型。千問3.7是出色的編程智能體,可自主編寫代碼創造工具,精準執行任務,完成復雜編程的自我糾錯迭代,就像個資深工程師,跑完從需求分析到測試迭代的全流程,自主產出可用的工業級成果。

不斷提升的編程能力,也為智能體完成更復雜、更長周期的任務打下堅實基礎。千問3.7本身具有極強的Agent能力,并涌現出跨多種智能體框架的泛化能力,在 Claude Code、OpenClaw、Qwen Code 等框架下都能穩定發揮,有望成為各類智能體系統的可靠底座。通過MCP集成和多智能體協作,Qwen3.7-Max在企業級辦公場景實現工作流自動化,在辦公自動化基準 SpreadSheetBench-v1上斬獲87分,處于頂尖水平,是可靠的辦公與生產力助手。以往需專業團隊耗時一至兩周的復雜項目,現由 Qwen3.7-Max 驅動的智能體可在數小時內完成端到端交付閉環。

實戰任務測試中,Qwen3.7-Max還展示了當下智能體所能達到的長程任務極限。對大模型而言,推理速度與推理框架息息相關,AI Infra工程師最重要的工作之一就是進行推理框架中的算子優化,這需要極強的經驗、知識、算法能力以及反復調試、糾錯迭代。如今,千問3.7也嘗試自主解決這一難題。在一個模型訓練時從未接觸過的全新硬件平臺——平頭哥真武M890芯片上,千問3.7自主完成了一個復雜的推理內核優化任務。在沒有任何性能分析數據、硬件文檔或新架構的示例內核情況下,千問3.7僅從一個包含任務描述、SGLang Triton 參考實現和評測腳本的空白工作空間出發,從“零”開始持續編程 35 小時,獨立進行了 432 次內核評估、1158 次工具調用,完全自主地完成了編寫、編譯、性能分析與迭代改進的全流程。



最終,在平頭哥新AI芯片上,經千問優化后的推理內核比 SGLang Triton 官方參考實現取得了 10 倍的加速。測試軌跡還顯示,模型在獨立運行超過 30 小時后仍發現了有效優化點,甚至主動發起了一次關鍵的架構重設計——這充分體現千問在復雜任務中長周期自主迭代的能力,為未來模型與智能體的自我演進打開了全新的想象空間。

在2026阿里云峰會現場,阿里云宣布面向Agentic時代全面升級,重磅發布全新的“芯-云-模型-推理”技術體系。據了解,Qwen3.7-Max模型API即將上線阿里云百煉,同時,千問3.7系列還將推出Qwen3.7-Plus等不同版本模型,擁有極強的多模態推理、視覺理解能力,實現從編程智能體到視覺智能體的全覆蓋,為下一代AI提供全能智能體新基座。

聲明:個人原創,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
40年前街機神作復活!這款臺球游戲悄悄登陸Switch/PS/PC

40年前街機神作復活!這款臺球游戲悄悄登陸Switch/PS/PC

娛圈觀察員
2026-06-12 00:36:55
95年妻子去世后,丈母娘把妻姐許給我,新婚夜我才知道賺大了

95年妻子去世后,丈母娘把妻姐許給我,新婚夜我才知道賺大了

千秋文化
2026-06-11 18:00:17
開封男童已丟3天!2個致命噩耗曝光,難怪警犬無人機全找不到線索

開封男童已丟3天!2個致命噩耗曝光,難怪警犬無人機全找不到線索

奇思妙想草葉君
2026-06-13 21:40:23
2027年起小中高學制,將由633調整為532?多地教委明確回應了!

2027年起小中高學制,將由633調整為532?多地教委明確回應了!

今朝牛馬
2026-06-12 17:30:23
中菲交惡錯在中方?第二個指責中國的已經出現,點名南海用詞激烈

中菲交惡錯在中方?第二個指責中國的已經出現,點名南海用詞激烈

共工之錨
2026-06-14 01:29:26
第一屆打藥運動會,游泳運動員因打藥太多浮不起來

第一屆打藥運動會,游泳運動員因打藥太多浮不起來

果殼
2026-06-11 12:14:41
印度極端高溫:空調危機撕開制造業遮羞布

印度極端高溫:空調危機撕開制造業遮羞布

風鈴草語
2026-06-13 07:22:48
翁帆近況被爆不到2天,荒唐一幕發生,差點走上辛柏青的老路

翁帆近況被爆不到2天,荒唐一幕發生,差點走上辛柏青的老路

老屬科普
2026-06-13 23:40:39
網傳張百喬小雪婚變,近一年無互動,售賣沈陽別墅,回應來了!

網傳張百喬小雪婚變,近一年無互動,售賣沈陽別墅,回應來了!

深析古今
2026-06-14 02:04:52
萬萬沒想到!落馬張軍妻子來頭不小,同是冠軍,實力不容小覷

萬萬沒想到!落馬張軍妻子來頭不小,同是冠軍,實力不容小覷

人間煙火記事本
2026-05-01 06:47:32
13日WTT挑戰賽:男單4強確定,陳俊菘出局,陳垣宇爆冷晉級

13日WTT挑戰賽:男單4強確定,陳俊菘出局,陳垣宇爆冷晉級

章民解說體育
2026-06-14 00:32:24
坐月子時我媽轉來70萬,婆婆竟轉走給小叔子救急,我果斷報警

坐月子時我媽轉來70萬,婆婆竟轉走給小叔子救急,我果斷報警

千秋文化
2026-06-13 19:43:15
1.2萬億順差創百年紀錄,張燕生卻警告:再賺下去,中國要有麻煩

1.2萬億順差創百年紀錄,張燕生卻警告:再賺下去,中國要有麻煩

趣文說娛
2026-05-29 20:13:52
深圳女商人羅長麗把國內套路搬去美國,12億天價勒索栽在FBI手里

深圳女商人羅長麗把國內套路搬去美國,12億天價勒索栽在FBI手里

觀星娛記
2026-05-13 11:06:24
心理學有一個殘忍的規律:男人對一個女人的占有欲越深,表現出來的不是糾纏,而是一種近乎冷酷的精神囚禁

心理學有一個殘忍的規律:男人對一個女人的占有欲越深,表現出來的不是糾纏,而是一種近乎冷酷的精神囚禁

心理觀察局
2026-06-11 06:39:05
梁文鋒向左,楊植麟向右

梁文鋒向左,楊植麟向右

虎嗅APP
2026-06-13 02:52:07
北京科技大學副校長張衛冬已任教育部科學技術與信息化司副司長

北京科技大學副校長張衛冬已任教育部科學技術與信息化司副司長

澎湃新聞
2026-06-13 21:20:27
第六冠!張雪機車意大利封王,落后榜首僅38分,年度冠軍真不遠了

第六冠!張雪機車意大利封王,落后榜首僅38分,年度冠軍真不遠了

童叔不飆車
2026-06-14 00:18:13
吉魯:姆巴佩與登貝萊不是麻煩,是法國今夏最大本錢

吉魯:姆巴佩與登貝萊不是麻煩,是法國今夏最大本錢

墜入溫柔晚風
2026-06-14 00:35:15
三年套現15億,賣掉摩拜單車的創始人胡瑋煒,竟然活成了這樣!

三年套現15億,賣掉摩拜單車的創始人胡瑋煒,竟然活成了這樣!

琴琴有氧運動
2026-06-05 22:12:10
2026-06-14 03:15:00
懂懂筆記 incentive-icons
懂懂筆記
TMT深度分析
3676文章數 11697關注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

寶媽考編排名第一卻被低分者遞補 維權后崗位直接取消

頭條要聞

寶媽考編排名第一卻被低分者遞補 維權后崗位直接取消

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

游戲
時尚
本地
藝術
數碼

LPL淘汰賽:就差一點,今天無奇跡!BLG五局戰勝WE,決賽見

夏天穿衣要杜絕土氣感!試試精致的小香風,優雅與俏皮并存

本地新聞

AK劉彰邂逅河北南大港濕地

藝術要聞

廣州再建一座“小蠻腰”?190米,頂著個球,2027年見!

數碼要聞

綠聯推出DXP 6800/8800 Ultra NAS:雙萬兆雙雷電4,PCIe擴展

無障礙瀏覽 進入關懷版