无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

為了平替Claude,阿里這次真拼了!

0
分享至

不得不說,現(xiàn)在大模型的格局真是瞬息萬變。

比如,在AI編程界,大家都公認(rèn)Claude是老大,盡管A社的做派很不討人喜歡,但是擋不住他家東西好用。



但是,就在前幾天,阿里悄悄發(fā)了新旗艦?zāi)P?strong>Qwen3.7-Max,竟然跟不可一世的Claude杠上了。

Qwen3.7-Max發(fā)布后,口碑一路攀升,在全球權(quán)威三方編程榜單Code Arena上,已經(jīng)超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一眾模型,目前僅次于Claude系列。



甚至,還超過了Claude-opus-4.6,僅僅落后4.6-thinking 1分,GPT、Gemini們都被遠(yuǎn)遠(yuǎn)甩在后面。

為什么大模型能力那么多,偏偏編程能力總被單拎出來說事呢?

因?yàn)樗鼛缀跏钱?dāng)下模型智能水平最硬試金石,考驗(yàn)的是理解需求、拆解任務(wù)、邏輯推理、工程實(shí)現(xiàn)、錯(cuò)誤修復(fù)和結(jié)果交付。

更關(guān)鍵的是,代碼能不能跑、功能是否完整,用戶一眼就能驗(yàn)貨,這不像生圖或者寫小作文,各花入各眼,不好評價(jià)優(yōu)劣。

所以,編程能力也成了大模型走向生產(chǎn)場景最瓷實(shí)的指標(biāo)之一。

而Code Arena,是目前全球最受關(guān)注的AI編程能力榜單之一,來自知名第三方盲測平臺(tái)LMArena。

這個(gè)榜單的評測玩法,是讓開發(fā)者出題,要求模型從零生成完整、可交互的Web應(yīng)用。

用戶在不知道模型身份的情況下,對兩個(gè)模型的生成結(jié)果進(jìn)行盲測PK,最終由真實(shí)投票形成排名。



這次,千問的表現(xiàn)可謂「有點(diǎn)兒東西」,在全球開發(fā)者真實(shí)體驗(yàn)盲測中,一舉沖進(jìn)前四,打破了Claude長期霸榜的格局。

而且,Qwen3.7-Max也成為榜單中唯一突破1540分大關(guān)的國產(chǎn)大模型。



再給大家補(bǔ)充點(diǎn)背景信息,Qwen3.7-Max主要面向Agent場景,最擅長干的就是編程、智能體、長程任務(wù)。

尤其是長程任務(wù),相當(dāng)牛掰。

在Qwen官方給出的實(shí)際例子中,千問3.7在一個(gè)全新的芯片平臺(tái)上,通過自主編程和超1000次工具調(diào)用,連續(xù)不間斷地跑了35個(gè)小時(shí),實(shí)現(xiàn)了一個(gè)關(guān)鍵內(nèi)核的自我進(jìn)化,推理速度較原版本提升10倍。



注:細(xì)看這張圖很明顯,其它模型跑一會(huì)兒就躺平了,只有Qwen一口氣肝了30多個(gè)小時(shí)。

很多開發(fā)者也評價(jià)它「長程自主執(zhí)行能力驚艷」,適合作為Agent的基座模型。

還有AI機(jī)構(gòu)橫向測評了Qwen3.7-Max、Claude 4.7 和GPT-5.5,給出的結(jié)論是千問3.7相比上代提升最大,推理成本最低,在速度和生成質(zhì)量上都有明顯優(yōu)勢。



注:測評機(jī)構(gòu)利用三個(gè)模型編寫一個(gè)會(huì)玩俄羅斯方塊并能自我訓(xùn)練的機(jī)器人,每個(gè)模型都可以讀取自己的代碼、運(yùn)行基準(zhǔn)測試,并在 10 輪迭代中重寫和優(yōu)化自己。結(jié)果,Qwen3.7-Max在每個(gè)維度都贏了。

當(dāng)然,所有這些,我覺得還不夠。

我就盼著,國產(chǎn)模型們有一天能夠把Claude徹底拉下馬,讓Y的求著我們用。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突發(fā)!追覓汽車CEO離職,造車業(yè)務(wù)僅剩研發(fā)

突發(fā)!追覓汽車CEO離職,造車業(yè)務(wù)僅剩研發(fā)

泡泡網(wǎng)
2026-06-23 10:55:14
瞞不住了!難怪日本女乒實(shí)力暴漲,主帥竟是馬琳落選國家隊(duì)的師兄

瞞不住了!難怪日本女乒實(shí)力暴漲,主帥竟是馬琳落選國家隊(duì)的師兄

做一個(gè)合格的吃瓜群眾
2026-05-14 09:32:01
有貴人運(yùn)的3大星座,天生好命,一生福氣滿滿

有貴人運(yùn)的3大星座,天生好命,一生福氣滿滿

別人都叫我阿螫
2026-06-10 07:12:26
被中國拉黑才兩周,菲律賓防長又點(diǎn)名了——看來制裁的火候還不夠

被中國拉黑才兩周,菲律賓防長又點(diǎn)名了——看來制裁的火候還不夠

漢字筆跡心理分析
2026-06-24 00:19:55
1928年,楊宇霆被槍決前跟張學(xué)良合影,從站姿來看,早已貌合神離

1928年,楊宇霆被槍決前跟張學(xué)良合影,從站姿來看,早已貌合神離

談古論今歷史有道
2026-06-23 17:55:03
76歲希拉里傳跨界緋聞?對象是49歲萊昂納多,游艇同框是算計(jì)?

76歲希拉里傳跨界緋聞?對象是49歲萊昂納多,游艇同框是算計(jì)?

綠茵八卦君
2026-06-20 19:45:04
陳立武剖析半導(dǎo)體供應(yīng)鏈重塑

陳立武剖析半導(dǎo)體供應(yīng)鏈重塑

風(fēng)鈴草語
2026-06-23 06:34:42
楊振寧去世5個(gè)月后,49歲翁帆現(xiàn)狀:剪了頭發(fā)染了色,仍獨(dú)居國內(nèi)

楊振寧去世5個(gè)月后,49歲翁帆現(xiàn)狀:剪了頭發(fā)染了色,仍獨(dú)居國內(nèi)

照見古今
2026-03-26 19:06:28
老婆出軌初戀后,我半年沒碰她,她質(zhì)問我原因,我說:我嫌臟

老婆出軌初戀后,我半年沒碰她,她質(zhì)問我原因,我說:我嫌臟

千秋文化
2026-06-06 20:06:18
波蘭剛撤澤連斯基勛章,歐盟卻要在波蘭大會(huì)上給烏克蘭發(fā)32億歐元

波蘭剛撤澤連斯基勛章,歐盟卻要在波蘭大會(huì)上給烏克蘭發(fā)32億歐元

桂系007
2026-06-23 03:10:22
反轉(zhuǎn)!寶媽避雨被趕引眾怒,店家公開10分鐘監(jiān)控,真相完全不一樣

反轉(zhuǎn)!寶媽避雨被趕引眾怒,店家公開10分鐘監(jiān)控,真相完全不一樣

北緯的咖啡豆
2026-06-23 19:39:46
母親曾是浙江最長壽老人!臺(tái)州94歲阿婆日子過得和母親一模一樣:沒啥長壽秘訣

母親曾是浙江最長壽老人!臺(tái)州94歲阿婆日子過得和母親一模一樣:沒啥長壽秘訣

環(huán)球網(wǎng)資訊
2026-06-23 14:29:29
查爾斯國王邀請哈里梅根留宿皇家莊園后,威廉表明立場:拒絕原諒

查爾斯國王邀請哈里梅根留宿皇家莊園后,威廉表明立場:拒絕原諒

人物檔案局
2026-06-23 13:11:04
東風(fēng)導(dǎo)彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

東風(fēng)導(dǎo)彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
姆巴佩首次回應(yīng)沖擊梅西紀(jì)錄,不按套路出牌,記者都懵了

姆巴佩首次回應(yīng)沖擊梅西紀(jì)錄,不按套路出牌,記者都懵了

生活新鮮市
2026-06-23 10:47:58
難以置信!同一律所兩個(gè)39歲律師離世,一人為家中獨(dú)子,尚未成家

難以置信!同一律所兩個(gè)39歲律師離世,一人為家中獨(dú)子,尚未成家

火山詩話
2026-06-23 10:47:23
情人之間,關(guān)系遲遲斷不掉,通常是這3個(gè)原因

情人之間,關(guān)系遲遲斷不掉,通常是這3個(gè)原因

葉飛飛情感屋
2026-06-23 16:18:13
菲防長預(yù)測中國的下一步行動(dòng),大事不妙!日專家提醒高市:忍著!

菲防長預(yù)測中國的下一步行動(dòng),大事不妙!日專家提醒高市:忍著!

焦點(diǎn)集結(jié)號
2026-06-24 01:58:18
智建偉任黑龍江省信訪局局長,丁泉寧任副局長

智建偉任黑龍江省信訪局局長,丁泉寧任副局長

中國青年報(bào)
2026-06-23 22:44:27
谷歌7500萬美元投A24,暴露AI落地最大軟肋

谷歌7500萬美元投A24,暴露AI落地最大軟肋

我是一個(gè)養(yǎng)蝦人
2026-06-23 02:05:50
2026-06-24 04:20:49
AI全球總部
AI全球總部
全球最新、最酷AI解決方案
1197文章數(shù) 715關(guān)注度
往期回顧 全部

科技要聞

48名中國開發(fā)者聯(lián)名舉報(bào)蘋果

頭條要聞

葡萄牙5-0烏茲別克斯坦 C羅梅開二度

頭條要聞

葡萄牙5-0烏茲別克斯坦 C羅梅開二度

體育要聞

揚(yáng)尼斯去了邁阿密:凱爾特人怎么辦?

娛樂要聞

內(nèi)娛95后頂流格局發(fā)生潛移默化的變化

財(cái)經(jīng)要聞

AI“算力稀缺”信仰開始動(dòng)搖?

汽車要聞

施鵬澤:為什么奧迪E7X強(qiáng)調(diào)座艙氣味安全?

態(tài)度原創(chuàng)

手機(jī)
房產(chǎn)
教育
數(shù)碼
公開課

手機(jī)要聞

外媒上手蘋果iOS 27 AI擴(kuò)圖功能:生成畫面自然

房產(chǎn)要聞

洞察新局|預(yù)算不變 居住升級 2026廣州置業(yè)成本觀察

教育要聞

出分在即!這件事沒做對,藝考分再高也白搭 用對工具,志愿填報(bào)少走90%彎路

數(shù)碼要聞

Meta推出299美元智能眼鏡新系列 加倍押注AI硬件平臺(tái)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版