无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

35小時智能體自主進化!千問旗艦模型Qwen3.7-Max重磅發布

0
分享至

5月20日,阿里巴巴發布全新一代千問旗艦模型Qwen3.7-Max,在三方機構Arena全球大模型盲測總榜中,Qwen3.7-Max超過Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,與GPT、Claude、Gemini最強模型接近,位列國產模型第一。千問3.7面向當下智能體(Agent)全新設計,實現了編程、推理等核心能力的持續突破,甚至可全自主完成35小時的超長程智能體復雜任務:在一個全新的芯片平臺上,Qwen3.7-Max通過自主編程和超1000次工具調用,實現了一個關鍵內核的自我進化,推理速度較原版本提升10倍。



圖說:Qwen3.7-Max發布,位列國產模型第一

阿里大模型研發顯著加速,近3個月內,千問旗艦大模型已穩定迭代了3.5、3.6、3.7三個版本,不斷抬高國產模型的性能上限,Qwen3.7-Max在數項權威評測中位居前列:在編程智能體方面,Qwen3.7-Max 在 SWE-Pro、SWE-Multilingual等測評中均取得領先表現,在Terminal Bench 2.0-Terminus得分69.7,超過了DeepSeek-v4-pro-Max、Claude-Opus4.6等一眾模型;在通用智能體方面,Qwen3.7-Max提升顯著,在MCP-Atlas、MCP-Mark、Skillbench等現實能力測試中表現優異,超越GLM5.1、Kimi-K2.6等,創下國產新高,并在 Kernel Bench L3上展示了強大的 GPU 內核優化能力;推理能力上, Qwen3.7-Max 在GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench等推理核心測評中均超越了Claude-Opus4.6及所有國產模型;在通用能力與多語言方面,Qwen3.7-Max 在指令遵循 IFBench 評測中得分79.1分突破新高,在多語言理解和翻譯的WMT24++、MAXIFE評測中領先。

當下,編程能力已成為衡量LLM大語言模型的核心指標,Qwen3.7-Max較上代模型實現了大幅提升,從前端原型開發到復雜的多文件工程均能駕馭。在評估AI解決真實世界的實戰編程任務SWE-bench系列測評、面向真實科學問題的編程測評SciCode中,Qwen3.7-Max較Qwen3.6-Plus大幅提升,并超越了Claude Opus 4.6-Max、Kimi-K2.6、DeepSeek-v4-Pro-Max等模型。千問3.7是出色的編程智能體,可自主編寫代碼創造工具,精準執行任務,完成復雜編程的自我糾錯迭代,就像個資深工程師,跑完從需求分析到測試迭代的全流程,自主產出可用的工業級成果。

不斷提升的編程能力,也為智能體完成更復雜、更長周期的任務打下堅實基礎。千問3.7本身具有極強的Agent能力,并涌現出跨多種智能體框架的泛化能力,在 Claude Code、OpenClaw、Qwen Code 等框架下都能穩定發揮,有望成為各類智能體系統的可靠底座。通過MCP集成和多智能體協作,Qwen3.7-Max在企業級辦公場景實現工作流自動化,在辦公自動化基準 SpreadSheetBench-v1上斬獲87分,處于頂尖水平,是可靠的辦公與生產力助手。以往需專業團隊耗時一至兩周的復雜項目,現由 Qwen3.7-Max 驅動的智能體可在數小時內完成端到端交付閉環。

實戰任務測試中,Qwen3.7-Max還展示了當下智能體所能達到的長程任務極限。對大模型而言,推理速度與推理框架息息相關,AI Infra工程師最重要的工作之一就是進行推理框架中的算子優化,這需要極強的經驗、知識、算法能力以及反復調試、糾錯迭代。如今,千問3.7也嘗試自主解決這一難題。在一個模型訓練時從未接觸過的全新硬件平臺——平頭哥真武M890芯片上,千問3.7自主完成了一個復雜的推理內核優化任務。在沒有任何性能分析數據、硬件文檔或新架構的示例內核情況下,千問3.7僅從一個包含任務描述、SGLang Triton 參考實現和評測腳本的空白工作空間出發,從“零”開始持續編程 35 小時,獨立進行了 432 次內核評估、1158 次工具調用,完全自主地完成了編寫、編譯、性能分析與迭代改進的全流程。



圖說:Qwen3.7-Max可獨立執行35小時的長程復雜任務

最終,在平頭哥新AI芯片上,經千問優化后的推理內核比 SGLang Triton 官方參考實現取得了 10 倍的加速。測試軌跡還顯示,模型在獨立運行超過 30 小時后仍發現了有效優化點,甚至主動發起了一次關鍵的架構重設計——這充分體現千問在復雜任務中長周期自主迭代的能力,為未來模型與智能體的自我演進打開了全新的想象空間。

在2026阿里云峰會現場,阿里云宣布面向Agentic時代全面升級,重磅發布全新的“芯-云-模型-推理”技術體系。據了解,Qwen3.7-Max模型API即將上線阿里云百煉,同時,千問3.7系列還將推出Qwen3.7-Plus等不同版本模型,擁有極強的多模態推理、視覺理解能力,實現從編程智能體到視覺智能體的全覆蓋,為下一代AI提供全能智能體新基座。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
3年1.19億!歐文留守達拉斯,湖人錯失最強二當家,佩林卡盡力了

3年1.19億!歐文留守達拉斯,湖人錯失最強二當家,佩林卡盡力了

體育大朋說
2026-06-14 00:08:37
醫生調查發現:天天抽煙的糖尿病人,多半到65歲后或有4種異樣

醫生調查發現:天天抽煙的糖尿病人,多半到65歲后或有4種異樣

醫學科普匯
2026-05-19 23:25:03
當你接觸的女人多了之后,你會發現:女人的“味道”,各有千秋

當你接觸的女人多了之后,你會發現:女人的“味道”,各有千秋

千秋文化
2026-06-13 19:38:58
《教父》早就講透:男人真正吸引異性的,從來不是甜言蜜語,也不是吃喝玩樂,而是這兩種底層能力

《教父》早就講透:男人真正吸引異性的,從來不是甜言蜜語,也不是吃喝玩樂,而是這兩種底層能力

心理觀察局
2026-06-03 07:39:04
莫言:主動買單、不占便宜、不斤斤計較的男人,注定是干大事的人

莫言:主動買單、不占便宜、不斤斤計較的男人,注定是干大事的人

杏花煙雨江南的碧園
2026-05-26 16:15:03
小伙職高畢業期望薪資3萬,面試官笑問:牛奶倒入大海怎么拿回?

小伙職高畢業期望薪資3萬,面試官笑問:牛奶倒入大海怎么拿回?

青青會講故事
2025-10-17 17:12:53
誰能想到,這些東西的正確用法竟然是“倒著用”!真是刷新認知

誰能想到,這些東西的正確用法竟然是“倒著用”!真是刷新認知

甜茶極簡記
2026-06-13 16:19:27
他從朝鮮回來無職務,授銜時得知自己是海南軍區司令,懷疑聽錯了

他從朝鮮回來無職務,授銜時得知自己是海南軍區司令,懷疑聽錯了

史之韻
2026-06-14 00:48:49
淪落到打野球了,你還是態度散漫,曾經的NBA三雙王徹底毀了自己

淪落到打野球了,你還是態度散漫,曾經的NBA三雙王徹底毀了自己

蠟筆小新愛體育
2026-06-07 17:04:24
異性對接吻一定要慎重,一旦“接吻”了,關系就會發生重大變化!

異性對接吻一定要慎重,一旦“接吻”了,關系就會發生重大變化!

皓皓情感說
2026-05-15 12:29:38
伊朗用中國導彈擊落美國F-15戰機,引發美中關系動蕩,深度分析

伊朗用中國導彈擊落美國F-15戰機,引發美中關系動蕩,深度分析

黑鷹觀軍事
2026-06-12 16:10:40
深圳通報香蜜湖度假村清拆工程坍塌致死事故

深圳通報香蜜湖度假村清拆工程坍塌致死事故

南方都市報
2026-06-13 17:50:27
伊朗外長披露伊美諒解備忘錄草案部分內容

伊朗外長披露伊美諒解備忘錄草案部分內容

新華社
2026-06-13 05:57:02
A股:股民要做好準備了,信號很強烈,后天周一或迎來更大的暴風雨?

A股:股民要做好準備了,信號很強烈,后天周一或迎來更大的暴風雨?

趨勢清風俠
2026-06-13 19:00:44
伊朗多家銀行出現技術故障,正開展修復工作;有消息稱可能發生了網絡攻擊,但尚未得到官方確認

伊朗多家銀行出現技術故障,正開展修復工作;有消息稱可能發生了網絡攻擊,但尚未得到官方確認

瀟湘晨報
2026-06-13 21:29:12
才播4集,收視率第一!40集諜戰大劇于和偉、王奎榮再掀諜戰風云

才播4集,收視率第一!40集諜戰大劇于和偉、王奎榮再掀諜戰風云

樂楓電影
2026-02-10 13:47:50
北京突降大暴雨,本以為糟透了,抬頭一幕所有人拍瘋了

北京突降大暴雨,本以為糟透了,抬頭一幕所有人拍瘋了

攝影筆記
2026-06-13 21:56:19
這一夜,CBA的體面,終于被懷特塞德撕了個粉碎

這一夜,CBA的體面,終于被懷特塞德撕了個粉碎

老觷系戲精北鼻
2026-06-14 02:17:37
滴滴改名,程維徹底不裝了!

滴滴改名,程維徹底不裝了!

首席品牌評論
2026-06-13 23:26:03
世界杯主帥年薪盤點:安切洛蒂年薪1000萬歐第一,圖赫爾第二

世界杯主帥年薪盤點:安切洛蒂年薪1000萬歐第一,圖赫爾第二

懂球帝
2026-06-13 23:59:23
2026-06-14 03:52:49
數智前線 incentive-icons
數智前線
關注數字化和智能化
1366文章數 619關注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

特朗普:美伊協議計劃周日簽署 霍爾木茲海峽立即開放

頭條要聞

特朗普:美伊協議計劃周日簽署 霍爾木茲海峽立即開放

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

房產
親子
教育
家居
游戲

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

親子要聞

真正覺醒的家庭

教育要聞

基礎不好建議避開的超恐怖院校。

家居要聞

空間微調 移形換境

LPL淘汰賽:就差一點,今天無奇跡!BLG五局戰勝WE,決賽見

無障礙瀏覽 進入關懷版