國產(chǎn)模型悶聲登頂：7.8倍差價把GPT-5.4按在地上

2026-04-11 09:53:25　來源: 報錯免疫體

北京舉報

分享至

SWE-Bench Pro排行榜上周悄悄變天。一個MIT開源許可證的模型把GPT-5.4和Claude Opus 4.6同時擠了下去，而它的API價格只有前者的七分之一。

這個叫GLM-5.1的模型來自智譜，國內(nèi)用戶可能更熟悉它的中文名。測試者花了兩天時間跑真實任務，發(fā)現(xiàn)benchmark上的分數(shù)和實際體驗是兩回事——有些模型分數(shù)漂亮，遇到復雜代碼庫卻開始胡言亂語。

「它在處理遺留代碼時的表現(xiàn)，比分數(shù)差距顯示的還要穩(wěn)。」測試者在報告中寫道。GLM-5.1的上下文窗口是128K，支持32K輸出，對于需要啃大型代碼庫的場景，這算是剛需配置。

價格對比更刺眼。GLM-5.1每百萬token收費0.3美元，Claude Opus 4.6是2.35美元，GPT-5.4更高。換算下來，跑同樣任務的成本差出將近8倍。對于每天燒掉幾千美元API調(diào)用的創(chuàng)業(yè)公司，這筆賬不難算。

不過測試者也留了后路：排行榜是排行榜，生產(chǎn)環(huán)境是生產(chǎn)環(huán)境。有些模型在特定語言上表現(xiàn)突出，換一門語言可能翻車。GLM-5.1的代碼能力是否泛化到所有場景，還需要更多人踩坑驗證。

智譜官方還沒大規(guī)模宣傳這次登頂。但在開發(fā)者群里，已經(jīng)有團隊開始遷移測試環(huán)境——畢竟同樣的預算，能跑八倍調(diào)用量，這對現(xiàn)金流緊張的中廠來說，誘惑實在不小。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
75 跟貼 75
Claude Opus 4.7深夜上線，評分碾壓

機器之心Pro 2026-04-17 10:08:00
2 跟貼 2

OpenAI徹底重構Codex！長出獨立鼠標，自己排班狂卷打工人

新智元 2026-04-17 14:43:06
1 跟貼 1

DeepSeek悄悄更新：Mega MoE、FP4 Indexer來了

機器之心Pro 2026-04-17 11:12:13
7 跟貼 7
Claude Opus 4.7深夜炸場！勝任更長任務、自主檢查，視覺能力拉滿

智東西 2026-04-17 12:08:22
1 跟貼 1

從越用越便宜到越用越貴，誰在為AI的“算力饑渴”買單？

鈦媒體APP 2026-04-17 13:32:25
0 跟貼 0

Claude Code之父，公開Opus 4.7內(nèi)部使用技巧

智東西 2026-04-17 18:50:21
3 跟貼 3
上一個兄弟離職了，我接手了他的代碼，我承認沒憋住

環(huán)亞搞笑 2026-04-14 14:35:36
3 跟貼 3

Elephant走紅：AI開始為“Token浪費”算細賬

華爾街見聞官方 2026-04-17 16:51:57
0 跟貼 0
慢性自殺排行榜，看看你占了幾條，看完筷子都放不住了！

可互時尚 2026-04-17 09:11:30
0 跟貼 0
間諜策反中企員工致項目停工停產(chǎn) 國安機關披露詳情

極目新聞 2026-04-17 07:00:50
9866 跟貼 9866
長文問答準確率大漲 17% 后，Anthropic 把“不亂猜”做成了核心賣點

鈦媒體APP 2026-04-17 11:26:15
0 跟貼 0
五大聯(lián)賽歐冠奪冠次數(shù)排行榜！

足球印象CC 2026-04-15 18:33:59
20 跟貼 20
網(wǎng)友票選中國最油膩的10位歌手排行榜

聚焦光輝與陰暗 2026-04-17 07:45:40
1 跟貼 1
真正值錢的 AI，都長在業(yè)務里

虎嗅APP 2026-04-17 21:07:32
0 跟貼 0
小貓這是代碼沖突了還是抽筋了，突然就卡了一下

重慶城市TV 2026-04-14 17:04:41
0 跟貼 0
AI價格倒掛終結：算力、模型同步漲價，純應用公司死局

鈦媒體APP 2026-04-17 20:04:24
4 跟貼 4
一夜之間，打工人都被“煉化”了？

悲了傷的白犀牛 2026-04-17 17:01:32
0 跟貼 0
貓兒雖然怕但是代碼讓它還是先叼著才說

扎克東哥 2026-04-17 10:12:55
1 跟貼 1
中美俄德朝軍機數(shù)量排行榜！各國有多少架！

感恩每日相伴 2026-04-17 06:42:20
0 跟貼 0
馬斯克、奧特曼與OpenAI的“最后審判”

虎嗅APP 2026-04-18 03:07:05
0 跟貼 0
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍鯨新聞 2026-04-15 09:44:24
3696 跟貼 3696
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
奧特曼預言與現(xiàn)實相差幾何？12個頂級模型“創(chuàng)業(yè)”一年，僅3個存活

鈦媒體APP 2026-04-03 17:11:08
1 跟貼 1
Anthropic發(fā)布Claude Opus 4.7：金融分析能力登頂公開模型軟件工程、多模態(tài)全面進階

財聯(lián)社 2026-04-17 01:18:06
24 跟貼 24
川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
3 跟貼 3
Transformer與RNN合體，谷歌打下顯存門檻，解鎖超長上下文

機器之心Pro 2026-04-17 18:31:53
0 跟貼 0
張雪機車增重7公斤仍奪荷蘭站練習賽第三

北青網(wǎng)-北京青年報 2026-04-17 18:56:24
936 跟貼 936
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
洛杉磯只有這4戶房子沒燒掉，竟利用泳池自救，還是華人比較聰明

哞哞的搞笑 2026-04-14 16:43:38
1 跟貼 1
新疆新設草湖市

新京報 2026-04-17 12:30:35
116 跟貼 116
組裝V8汽車發(fā)動機模型

制造科技 2026-04-16 13:26:17
0 跟貼 0
梁文鋒，被曝融資20億！

智東西 2026-04-18 00:21:01
0 跟貼 0
無錫機器人交警上路執(zhí)勤當?shù)亟还埽涸圏c投入兩臺，身高1.75米，單次充滿電可工作5小時

紅星新聞 2026-04-17 17:07:58
1879 跟貼 1879
廣東“莫氏雞煲大公主”爆火前后反差大，晚上干到凌晨2點才收工，發(fā)文吐槽：這個雞你們是非吃不可嗎

大象新聞 2026-04-15 12:57:04
1774 跟貼 1774
五爽越級實力直擊年輕用戶需求走進極狐全新阿爾法S5

AutoVideo 2026-04-16 17:55:00
32 跟貼 32
格力怒斥海信，稱其沒資格用“真銅實料”四字進行宣傳，海信高管回懟：又當又立

大風新聞 2026-04-15 15:07:03
898 跟貼 898
中國退役運動員身家排行榜，動不動就是億，中國人就是有錢！

中先生搞笑 2026-04-14 09:17:09
1 跟貼 1
本田或?qū)㈥P停廣州、武漢兩座燃油車工廠

中國能源網(wǎng) 2026-04-17 14:45:03
2502 跟貼 2502
想買車的注意了，純電車保值率排行榜出爐，這些車可以放心買

車之養(yǎng)護 2026-04-17 16:38:16
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

國產(chǎn)模型悶聲登頂：7.8倍差價把GPT-5.4按在地上

7家頭部平臺被罰沒35.97億元

知情人：伊朗為霍爾木茲海峽通行設定三個條件

知情人：伊朗為霍爾木茲海峽通行設定三個條件

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

劉德華摯友潘宏彬離世 曾一起租房住

"影子萬科"2.0：管理層如何吸血萬物云？

又快又穩(wěn)的開掛動力！ 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

14歲小孩哥詮釋腹有詩書氣自華

庫克都沒想到：MacBook Neo賣爆了！官網(wǎng)交付已排到5月

三月三登泰山！蟠桃會+古風巡游驚艷出圈

法式線條 時光靜淌

中超-泰山1-1海港楊希處子球克雷桑任意球扳平

劉德華摯友潘宏彬離世曾一起租房住

又快又穩(wěn)的開掛動力！阿維塔06T全系搭分布式電驅(qū)

法式線條時光靜淌