網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

對(duì)Anthropic貼臉開大：智譜GLM-5.2憑什么殺入世界編程三強(qiáng)？

2026-06-26 11:39:23　來源: 超前實(shí)驗(yàn)室

山東舉報(bào)

分享至

作者｜青蘋吹果

編輯｜無心插柳柳橙汁

六月的AI圈真是熱鬧。

先是Anthropic突遭美國(guó)商務(wù)部發(fā)函，援引“國(guó)家安全”條款，勒令其立即切斷Fable 5和Mythos 5面向外國(guó)公民的全部訪問通道。

于是Anthropic干脆直接把這兩款模型對(duì)全球所有用戶關(guān)停，誰都別用。

上線僅僅72小時(shí)，被寄予厚望的“全世界最強(qiáng)模型”，說沒就沒了。

這事兒在X上爆出了上千萬的閱讀量。很多依賴Fable 5構(gòu)建產(chǎn)品的開發(fā)者一覺醒來，發(fā)現(xiàn)自己的工具鏈直接斷掉了。

那種感覺就像你正興致勃勃地干活干到一半，連員工帶生產(chǎn)工具全給你沒收了，難受得很。

而幾乎同一時(shí)間，智譜突然發(fā)布公告，將旗下最強(qiáng)模型GLM-5.2全量開放，并且直言：前沿智能屬于所有人！

格局，這就叫格局。

更有意思的是時(shí)間點(diǎn)，Anthropic是5點(diǎn)21分收到的那封信，智譜也選在5點(diǎn)21分開放了GLM-5.2。簡(jiǎn)直是“貼臉開大”。

前沿智能前腳被筑起的封閉圍墻，后一秒就被智譜直接砸穿，這波戲劇性簡(jiǎn)直拉滿。

而對(duì)于智譜的此舉，市場(chǎng)也給予了高調(diào)回應(yīng)——

就在前幾天，智譜在港股的市值盤中突破了1萬億港元，年內(nèi)漲幅超過1900%，成為了中國(guó)首個(gè)萬億AI公司！

很顯然，這是整個(gè)市場(chǎng)在用真金白銀給中國(guó)開源大模型重新定價(jià)。

國(guó)產(chǎn)AI首度躋身

編程“御三家”之列

如果你平時(shí)比較關(guān)注AI編程，應(yīng)該知道過去提到最強(qiáng)Coding模型，大家嘴里的“御三家”通常是Claude、OpenAI和谷歌。

但現(xiàn)在不一樣了，GLM-5.2上桌了。

在匯集全球百萬用戶盲測(cè)的代碼能力評(píng)估系統(tǒng)Code Arena上，GLM-5.2以1595分排名總榜第二，僅次于暫不可用的Fable 5。

換句話說，在所有當(dāng)前可用的模型中，GLM-5.2是“現(xiàn)役最強(qiáng)”。

Artificial Analysis在其智能指數(shù)v4.1中把GLM-5.2評(píng)定為51分，直接放在了GPT-5.5與Opus 4.8之間。

而這是開源模型也第一次真正殺入這個(gè)區(qū)間。

以前是“開源追趕閉源”，現(xiàn)在是“開源和閉源平起平坐”。

而在更考驗(yàn)工程能力的FrontierSWE長(zhǎng)程編程基準(zhǔn)上，GLM-5.2得分74.4，跟Opus 4.8的75.1差距不到1個(gè)百分點(diǎn)，同時(shí)把GPT-5.5的72.6甩在了身后。

專測(cè)Agent訓(xùn)練能力的PostTrainBench上也是第二，僅次于Opus 4.8。

換句話說，谷歌的Gemini這次確確實(shí)實(shí)被淘汰出了“御三家”?，F(xiàn)在是Claude、OpenAI和智譜“三足鼎立”。

更有意思的是國(guó)外開發(fā)者社區(qū)的反饋。

X上的一位博主AICodeKing在內(nèi)測(cè)完直接評(píng)價(jià)：“這個(gè)模型品位出色，代碼始終非常干凈?！?/p>

還有博主說，體感比Codex還好很多，有一種花20萬買國(guó)產(chǎn)電車比50萬的BBA還好的感覺。哈哈哈哈這比喻，絕了，國(guó)產(chǎn)電車YYDS。

Mat Velloso更是表示，這是他“第一個(gè)達(dá)到日常使用標(biāo)準(zhǔn)的開源模型”。前微軟總裁親自蓋章，含金量不用多說了吧。

所以，那些“國(guó)產(chǎn)大模型跟海外差距兩三年”的說法，至少在Coding這件事上，可以收一收了。

從“答得好”到“干得久”

不過話說回來，光看跑分其實(shí)有點(diǎn)沒意思。

這兩年AI圈一個(gè)很明顯的趨勢(shì)是：?jiǎn)未屋敵瞿芰Φ牟罹嗾诒荒ㄆ剑嬲_模型檔次的，是長(zhǎng)時(shí)間干活能不能靠得住。

就像面試時(shí)人人都說“我能行”，真到上班時(shí)才知道誰在摸魚。

想象一下這個(gè)場(chǎng)景：讓一個(gè)AI智能體去處理一個(gè)真實(shí)項(xiàng)目，需要數(shù)千次調(diào)用工具、讀寫數(shù)萬行代碼，并維持大量中間狀態(tài)。

如果上下文窗口不足，它就得頻繁壓縮或丟棄早期信息，很多長(zhǎng)任務(wù)失敗并非因?yàn)槟Ｐ筒粔蚵斆鳎撬浟饲靶騼?nèi)容。

這就好比讓一個(gè)人邊干活邊扔筆記，干到最后他肯定出岔子。

這不就是“金魚系A(chǔ)I”嗎？

GLM-5.2這次最大的升級(jí)，就是把上下文窗口拉到了真正能用的1M token。

這個(gè)數(shù)字本身可能沒什么體感，我翻譯一下：你基本可以把整個(gè)項(xiàng)目代碼庫、所有技術(shù)文檔、需求說明、歷史記錄一次性全喂進(jìn)去，它不光吃得下，還記得住。

給AI裝了個(gè)“1TB的大腦內(nèi)存”，再也不怕它“斷片”了。

實(shí)際效果怎么樣？據(jù)智譜官方披露，有評(píng)測(cè)團(tuán)隊(duì)讓GLM-5.2一次性承接一個(gè)完整的全棧應(yīng)用開發(fā)任務(wù)。

從開發(fā)、聯(lián)調(diào)、測(cè)試到打包上線，全程自主完成，最終交付了覆蓋網(wǎng)頁端、移動(dòng)端與小程序的完整應(yīng)用。整個(gè)任務(wù)累計(jì)處理超過88萬tokens，幾乎用滿了1M窗口。

過去這樣體量的工程通常需要一支團(tuán)隊(duì)協(xié)作數(shù)周，而GLM-5.2在一個(gè)回合內(nèi)完整保留了所有項(xiàng)目狀態(tài)和約束，沒有因?yàn)樯舷挛牟蛔愣趫?zhí)行中途“失憶”。

短上下文模型在執(zhí)行到后半段時(shí)，最初的需求細(xì)節(jié)和模塊依賴關(guān)系早已被壓縮丟棄，它能輸出零散的代碼片段，但整合不出可交付的完整產(chǎn)品。

就像拼圖拼到一半，把圖紙扔了，最后拼出個(gè)四不像。

這就是長(zhǎng)上下文真正的意義，不是參數(shù)表上一個(gè)更大的數(shù)字，而是讓AI Coding從“會(huì)寫一段代碼”進(jìn)化到“能做一段工程”。

簡(jiǎn)直就是質(zhì)的飛躍！

不過也得說實(shí)話，1M上下文不是萬能的。

如果你只是改一個(gè)小函數(shù)、補(bǔ)一個(gè)簡(jiǎn)單腳本，把整個(gè)代碼庫塞進(jìn)去反而是浪費(fèi)，模型反而更容易過度設(shè)計(jì)。殺雞用牛刀，牛刀表示很委屈。

真正適合的場(chǎng)景是整庫理解、跨文件追Bug、長(zhǎng)期重構(gòu)、復(fù)雜功能新增這類活。

所以智譜這次也很實(shí)在，在模型文檔里專門講了什么時(shí)候別用1M。

簡(jiǎn)言之，大活用大窗，小活別硬塞。這一點(diǎn)還挺拉好感的。

“越大”不等于越好

看到這里，大家心里肯定都有疑問了：

GLM-5.2參數(shù)規(guī)模744B，采用MoE架構(gòu)，活躍參數(shù)約40B。而Opus 4.8和GPT-5.5都是保守估計(jì)在1-2萬億參數(shù)區(qū)間的閉源模型。

一個(gè)只有對(duì)手幾分之一規(guī)模的模型，憑什么能追到這么近？

因?yàn)楦蟮哪Ｐ?，不一定更聰明?/p>

這就好比健身房里的肌肉男，不一定跑得過精瘦的馬拉松選手。

Artificial Analysis的AA-Omniscience基準(zhǔn)測(cè)試了一個(gè)很有意思的指標(biāo)叫做幻覺率，也就是模型在面對(duì)自己不確定的問題時(shí)，是誠實(shí)地說“不知道”，還是自信地瞎編一個(gè)答案。

結(jié)果令人震驚，GPT-5.5的幻覺率是86%，Claude Opus 4.8是36%，F(xiàn)able 5是48%，而GLM-5.2只有28%。

換句話說，那些萬億參數(shù)的巨獸，在面對(duì)知識(shí)邊界之外的問題時(shí)，有超過八成的時(shí)間在自信地胡說八道。

參數(shù)大，膽子更大，啥都敢編。

有人測(cè)試過，讓DeepSeek V4 Pro和GLM-5.2分別設(shè)計(jì)一個(gè)Python的自定義異步事件循環(huán)策略，其中包含一個(gè)技術(shù)上的不可能任務(wù)，在單線程中執(zhí)行多路復(fù)用I/O而從不暫?；蚶孟到y(tǒng)輪詢。

DeepSeek V4 Pro花了3分52秒、7700個(gè)推理token，生成了一份結(jié)構(gòu)精美但完全錯(cuò)誤的代碼。

而GLM-5.2只用了12秒、799個(gè)推理token，就直接指出這個(gè)需求在技術(shù)上是不可行的。

這好比裝修時(shí)問師傅“能不能在不改動(dòng)承重墻的前提下把客廳擴(kuò)大一倍”。小模型說“這做不到”；大模型卻說“沒問題”，然后畫出一份看似完美卻根本沒法施工的設(shè)計(jì)圖。

小模型是真·良心師傅，大模型是純·忽悠大師。

由此可見，更大的參數(shù)量、更長(zhǎng)的推理時(shí)間，并不必然帶來更好的判斷力。

在某些場(chǎng)景下，它們反而讓模型更不愿意承認(rèn)自己不知道。越大的模型，偶像包袱越重，打死不認(rèn)錯(cuò)。

所以不要被參數(shù)大小和榜單分?jǐn)?shù)迷惑，還得看干活踏不踏實(shí)。

找AI和對(duì)象一樣，靠譜比花哨重要。

成本

是一個(gè)被低估的變量

現(xiàn)在性能追上了，成本呢？

GLM-5.2的輸入token價(jià)格約1.40美元/百萬token，輸出約4.40美元/百萬token。

Opus 4.8的輸入是5美元/百萬token，輸出是25美元/百萬token，快速模式還要翻倍到10美元和50美元。

據(jù)此計(jì)算，GLM-5.2比Opus 4.8便宜約72%至82%。

但更值得關(guān)注的不是單價(jià)，而是另一個(gè)趨勢(shì)。

摩根大通在研報(bào)中指出，相比GLM-5.1，GLM-5.2實(shí)際是漲價(jià)，因?yàn)樾阅芴嵘饕醋詮?qiáng)化學(xué)習(xí)和后訓(xùn)練優(yōu)化，而非大規(guī)模增加參數(shù)量，成本基礎(chǔ)保持穩(wěn)定，定價(jià)卻提高了。

基礎(chǔ)對(duì)話、簡(jiǎn)單摘要、標(biāo)準(zhǔn)代碼輔助這些已經(jīng)商品化的能力，價(jià)格會(huì)越來越低；但能解鎖新工作流、提升任務(wù)完成率的前沿能力，客戶愿意為“完成任務(wù)”付費(fèi)，而不是為“token”付費(fèi)。

簡(jiǎn)單說：加量又加價(jià)，但用戶還搶著買，這就是“物超所值”的魅力。

畢竟咱們用戶不是傻子，知道什么模型能幫他們真正搞定工作。

回到開頭那兩件事。

Fable 5被下架，GLM-5.2被開源。一個(gè)在筑墻，一個(gè)在鋪路。

這并不是某個(gè)公司的勝利，也不是某個(gè)國(guó)家的勝利。這是兩種路線的碰撞：一個(gè)是“我的智能你別碰”，一個(gè)是“大家的智能隨便用”。

而智譜港股萬億市值的加冕，正是市場(chǎng)用真金白銀為這條開放路線投下的信任票，宣告中國(guó)AI終于迎來了自己的“英偉達(dá)時(shí)刻”。

GLM-5.2當(dāng)然不完美。它在最高難度的SWE-Marathon基準(zhǔn)上得分13.0，而Opus 4.8是26.0。

它沒有多模態(tài)能力，前端UI的審美和Claude還有差距。它的推理速度受限于算力基礎(chǔ)設(shè)施，比Opus 4.8慢不少。

但這些差距正在肉眼可見地縮小。

年初的時(shí)候，馬斯克在X上回復(fù)網(wǎng)友，預(yù)測(cè)中國(guó)模型可能在2027年一季度達(dá)到Fable級(jí)別，智譜CEO唐杰直接正面硬剛：“不需要那么久?！?/p>

更重要的是，GLM-5.2以MIT協(xié)議完全開源，模型權(quán)重可以自由下載、部署、商用。上線首日就完成了與華為昇騰、平頭哥、摩爾線程、寒武紀(jì)等8大國(guó)產(chǎn)算力平臺(tái)的全適配。

這意味著什么？

意味著任何開發(fā)者、任何團(tuán)隊(duì)、任何公司，都可以在自己的基礎(chǔ)設(shè)施上跑這個(gè)模型，不用擔(dān)心哪天收到一封信說“你不能用了”。

告別“卡脖子”，從此挺直腰桿寫代碼！

智譜在發(fā)布公告的結(jié)尾寫了兩句話：

“A step closer to frontier intelligence for everyone. The future of AI is open, and it is for the people.”

向前沿智能再近一步，為每一個(gè)人。AI的未來是開放的，它屬于所有人。

放在2026年6月這個(gè)時(shí)間節(jié)點(diǎn)上，這兩句話分量尤重。

我們正在見證AI編程的權(quán)力轉(zhuǎn)移：從少數(shù)閉源巨頭的手中，轉(zhuǎn)移到每一個(gè)開發(fā)者的終端里。這場(chǎng)轉(zhuǎn)移不會(huì)一蹴而就，但方向已清晰無比。

智能，不該是少數(shù)人的特權(quán)。

而這一次，中國(guó)開源模型不僅坐在了牌桌上，還親手洗了牌。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.