无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)Anthropic貼臉開大:智譜GLM-5.2憑什么殺入世界編程三強(qiáng)?

0
分享至





作者|青蘋吹果

編輯|無心插柳柳橙汁

六月的AI圈真是熱鬧。

先是Anthropic突遭美國(guó)商務(wù)部發(fā)函,援引“國(guó)家安全”條款,勒令其立即切斷Fable 5和Mythos 5面向外國(guó)公民的全部訪問通道。

于是Anthropic干脆直接把這兩款模型對(duì)全球所有用戶關(guān)停,誰都別用。



上線僅僅72小時(shí),被寄予厚望的“全世界最強(qiáng)模型”,說沒就沒了。

這事兒在X上爆出了上千萬的閱讀量。很多依賴Fable 5構(gòu)建產(chǎn)品的開發(fā)者一覺醒來,發(fā)現(xiàn)自己的工具鏈直接斷掉了。

那種感覺就像你正興致勃勃地干活干到一半,連員工帶生產(chǎn)工具全給你沒收了,難受得很。

而幾乎同一時(shí)間,智譜突然發(fā)布公告,將旗下最強(qiáng)模型GLM-5.2全量開放,并且直言:前沿智能屬于所有人!



格局,這就叫格局。

更有意思的是時(shí)間點(diǎn),Anthropic是5點(diǎn)21分收到的那封信,智譜也選在5點(diǎn)21分開放了GLM-5.2。簡(jiǎn)直是“貼臉開大”。

前沿智能前腳被筑起的封閉圍墻,后一秒就被智譜直接砸穿,這波戲劇性簡(jiǎn)直拉滿。

而對(duì)于智譜的此舉,市場(chǎng)也給予了高調(diào)回應(yīng)——

就在前幾天,智譜在港股的市值盤中突破了1萬億港元,年內(nèi)漲幅超過1900%,成為了中國(guó)首個(gè)萬億AI公司!

很顯然,這是整個(gè)市場(chǎng)在用真金白銀給中國(guó)開源大模型重新定價(jià)。



國(guó)產(chǎn)AI首度躋身

編程“御三家”之列


如果你平時(shí)比較關(guān)注AI編程,應(yīng)該知道過去提到最強(qiáng)Coding模型,大家嘴里的“御三家”通常是Claude、OpenAI和谷歌。

但現(xiàn)在不一樣了,GLM-5.2上桌了。

在匯集全球百萬用戶盲測(cè)的代碼能力評(píng)估系統(tǒng)Code Arena上,GLM-5.2以1595分排名總榜第二,僅次于暫不可用的Fable 5。

換句話說,在所有當(dāng)前可用的模型中,GLM-5.2是“現(xiàn)役最強(qiáng)”。



Artificial Analysis在其智能指數(shù)v4.1中把GLM-5.2評(píng)定為51分,直接放在了GPT-5.5與Opus 4.8之間。



而這是開源模型也第一次真正殺入這個(gè)區(qū)間。

以前是“開源追趕閉源”,現(xiàn)在是“開源和閉源平起平坐”。

而在更考驗(yàn)工程能力的FrontierSWE長(zhǎng)程編程基準(zhǔn)上,GLM-5.2得分74.4,跟Opus 4.8的75.1差距不到1個(gè)百分點(diǎn),同時(shí)把GPT-5.5的72.6甩在了身后。

專測(cè)Agent訓(xùn)練能力的PostTrainBench上也是第二,僅次于Opus 4.8。

換句話說,谷歌的Gemini這次確確實(shí)實(shí)被淘汰出了“御三家”?,F(xiàn)在是Claude、OpenAI和智譜“三足鼎立”。

更有意思的是國(guó)外開發(fā)者社區(qū)的反饋。

X上的一位博主AICodeKing在內(nèi)測(cè)完直接評(píng)價(jià):“這個(gè)模型品位出色,代碼始終非常干凈?!?/p>



還有博主說,體感比Codex還好很多,有一種花20萬買國(guó)產(chǎn)電車比50萬的BBA還好的感覺。哈哈哈哈這比喻,絕了,國(guó)產(chǎn)電車YYDS。



Mat Velloso更是表示,這是他“第一個(gè)達(dá)到日常使用標(biāo)準(zhǔn)的開源模型”。前微軟總裁親自蓋章,含金量不用多說了吧。



所以,那些“國(guó)產(chǎn)大模型跟海外差距兩三年”的說法,至少在Coding這件事上,可以收一收了。



從“答得好”到“干得久”


不過話說回來,光看跑分其實(shí)有點(diǎn)沒意思。

這兩年AI圈一個(gè)很明顯的趨勢(shì)是:?jiǎn)未屋敵瞿芰Φ牟罹嗾诒荒ㄆ剑嬲_模型檔次的,是長(zhǎng)時(shí)間干活能不能靠得住。

就像面試時(shí)人人都說“我能行”,真到上班時(shí)才知道誰在摸魚。

想象一下這個(gè)場(chǎng)景:讓一個(gè)AI智能體去處理一個(gè)真實(shí)項(xiàng)目,需要數(shù)千次調(diào)用工具、讀寫數(shù)萬行代碼,并維持大量中間狀態(tài)。

如果上下文窗口不足,它就得頻繁壓縮或丟棄早期信息,很多長(zhǎng)任務(wù)失敗并非因?yàn)槟P筒粔蚵斆鳎撬浟饲靶騼?nèi)容。

這就好比讓一個(gè)人邊干活邊扔筆記,干到最后他肯定出岔子。

這不就是“金魚系A(chǔ)I”嗎?

GLM-5.2這次最大的升級(jí),就是把上下文窗口拉到了真正能用的1M token。

這個(gè)數(shù)字本身可能沒什么體感,我翻譯一下:你基本可以把整個(gè)項(xiàng)目代碼庫、所有技術(shù)文檔、需求說明、歷史記錄一次性全喂進(jìn)去,它不光吃得下,還記得住。

給AI裝了個(gè)“1TB的大腦內(nèi)存”,再也不怕它“斷片”了。

實(shí)際效果怎么樣?據(jù)智譜官方披露,有評(píng)測(cè)團(tuán)隊(duì)讓GLM-5.2一次性承接一個(gè)完整的全棧應(yīng)用開發(fā)任務(wù)。

從開發(fā)、聯(lián)調(diào)、測(cè)試到打包上線,全程自主完成,最終交付了覆蓋網(wǎng)頁端、移動(dòng)端與小程序的完整應(yīng)用。整個(gè)任務(wù)累計(jì)處理超過88萬tokens,幾乎用滿了1M窗口。



過去這樣體量的工程通常需要一支團(tuán)隊(duì)協(xié)作數(shù)周,而GLM-5.2在一個(gè)回合內(nèi)完整保留了所有項(xiàng)目狀態(tài)和約束,沒有因?yàn)樯舷挛牟蛔愣趫?zhí)行中途“失憶”。

短上下文模型在執(zhí)行到后半段時(shí),最初的需求細(xì)節(jié)和模塊依賴關(guān)系早已被壓縮丟棄,它能輸出零散的代碼片段,但整合不出可交付的完整產(chǎn)品。

就像拼圖拼到一半,把圖紙扔了,最后拼出個(gè)四不像。

這就是長(zhǎng)上下文真正的意義,不是參數(shù)表上一個(gè)更大的數(shù)字,而是讓AI Coding從“會(huì)寫一段代碼”進(jìn)化到“能做一段工程”。

簡(jiǎn)直就是質(zhì)的飛躍!

不過也得說實(shí)話,1M上下文不是萬能的。

如果你只是改一個(gè)小函數(shù)、補(bǔ)一個(gè)簡(jiǎn)單腳本,把整個(gè)代碼庫塞進(jìn)去反而是浪費(fèi),模型反而更容易過度設(shè)計(jì)。殺雞用牛刀,牛刀表示很委屈。



真正適合的場(chǎng)景是整庫理解、跨文件追Bug、長(zhǎng)期重構(gòu)、復(fù)雜功能新增這類活。

所以智譜這次也很實(shí)在,在模型文檔里專門講了什么時(shí)候別用1M。

簡(jiǎn)言之,大活用大窗,小活別硬塞。這一點(diǎn)還挺拉好感的。



“越大”不等于越好


看到這里,大家心里肯定都有疑問了:

GLM-5.2參數(shù)規(guī)模744B,采用MoE架構(gòu),活躍參數(shù)約40B。而Opus 4.8和GPT-5.5都是保守估計(jì)在1-2萬億參數(shù)區(qū)間的閉源模型。

一個(gè)只有對(duì)手幾分之一規(guī)模的模型,憑什么能追到這么近?

因?yàn)楦蟮哪P?,不一定更聰明?/p>

這就好比健身房里的肌肉男,不一定跑得過精瘦的馬拉松選手。

Artificial Analysis的AA-Omniscience基準(zhǔn)測(cè)試了一個(gè)很有意思的指標(biāo)叫做幻覺率,也就是模型在面對(duì)自己不確定的問題時(shí),是誠實(shí)地說“不知道”,還是自信地瞎編一個(gè)答案。

結(jié)果令人震驚,GPT-5.5的幻覺率是86%,Claude Opus 4.8是36%,F(xiàn)able 5是48%,而GLM-5.2只有28%。

換句話說,那些萬億參數(shù)的巨獸,在面對(duì)知識(shí)邊界之外的問題時(shí),有超過八成的時(shí)間在自信地胡說八道。

參數(shù)大,膽子更大,啥都敢編。

有人測(cè)試過,讓DeepSeek V4 Pro和GLM-5.2分別設(shè)計(jì)一個(gè)Python的自定義異步事件循環(huán)策略,其中包含一個(gè)技術(shù)上的不可能任務(wù),在單線程中執(zhí)行多路復(fù)用I/O而從不暫?;蚶孟到y(tǒng)輪詢。



DeepSeek V4 Pro花了3分52秒、7700個(gè)推理token,生成了一份結(jié)構(gòu)精美但完全錯(cuò)誤的代碼。

而GLM-5.2只用了12秒、799個(gè)推理token,就直接指出這個(gè)需求在技術(shù)上是不可行的。

這好比裝修時(shí)問師傅“能不能在不改動(dòng)承重墻的前提下把客廳擴(kuò)大一倍”。小模型說“這做不到”;大模型卻說“沒問題”,然后畫出一份看似完美卻根本沒法施工的設(shè)計(jì)圖。

小模型是真·良心師傅,大模型是純·忽悠大師。

由此可見,更大的參數(shù)量、更長(zhǎng)的推理時(shí)間,并不必然帶來更好的判斷力。

在某些場(chǎng)景下,它們反而讓模型更不愿意承認(rèn)自己不知道。越大的模型,偶像包袱越重,打死不認(rèn)錯(cuò)。

所以不要被參數(shù)大小和榜單分?jǐn)?shù)迷惑,還得看干活踏不踏實(shí)。

找AI和對(duì)象一樣,靠譜比花哨重要。



成本

是一個(gè)被低估的變量


現(xiàn)在性能追上了,成本呢?

GLM-5.2的輸入token價(jià)格約1.40美元/百萬token,輸出約4.40美元/百萬token。

Opus 4.8的輸入是5美元/百萬token,輸出是25美元/百萬token,快速模式還要翻倍到10美元和50美元。

據(jù)此計(jì)算,GLM-5.2比Opus 4.8便宜約72%至82%。



但更值得關(guān)注的不是單價(jià),而是另一個(gè)趨勢(shì)。

摩根大通在研報(bào)中指出,相比GLM-5.1,GLM-5.2實(shí)際是漲價(jià),因?yàn)樾阅芴嵘饕醋詮?qiáng)化學(xué)習(xí)和后訓(xùn)練優(yōu)化,而非大規(guī)模增加參數(shù)量,成本基礎(chǔ)保持穩(wěn)定,定價(jià)卻提高了。

基礎(chǔ)對(duì)話、簡(jiǎn)單摘要、標(biāo)準(zhǔn)代碼輔助這些已經(jīng)商品化的能力,價(jià)格會(huì)越來越低;但能解鎖新工作流、提升任務(wù)完成率的前沿能力,客戶愿意為“完成任務(wù)”付費(fèi),而不是為“token”付費(fèi)。

簡(jiǎn)單說:加量又加價(jià),但用戶還搶著買,這就是“物超所值”的魅力。

畢竟咱們用戶不是傻子,知道什么模型能幫他們真正搞定工作。




回到開頭那兩件事。

Fable 5被下架,GLM-5.2被開源。一個(gè)在筑墻,一個(gè)在鋪路。

這并不是某個(gè)公司的勝利,也不是某個(gè)國(guó)家的勝利。這是兩種路線的碰撞:一個(gè)是“我的智能你別碰”,一個(gè)是“大家的智能隨便用”。

而智譜港股萬億市值的加冕,正是市場(chǎng)用真金白銀為這條開放路線投下的信任票,宣告中國(guó)AI終于迎來了自己的“英偉達(dá)時(shí)刻”。

GLM-5.2當(dāng)然不完美。它在最高難度的SWE-Marathon基準(zhǔn)上得分13.0,而Opus 4.8是26.0。

它沒有多模態(tài)能力,前端UI的審美和Claude還有差距。它的推理速度受限于算力基礎(chǔ)設(shè)施,比Opus 4.8慢不少。

但這些差距正在肉眼可見地縮小。

年初的時(shí)候,馬斯克在X上回復(fù)網(wǎng)友,預(yù)測(cè)中國(guó)模型可能在2027年一季度達(dá)到Fable級(jí)別,智譜CEO唐杰直接正面硬剛:“不需要那么久?!?/p>



更重要的是,GLM-5.2以MIT協(xié)議完全開源,模型權(quán)重可以自由下載、部署、商用。上線首日就完成了與華為昇騰、平頭哥、摩爾線程、寒武紀(jì)等8大國(guó)產(chǎn)算力平臺(tái)的全適配。

這意味著什么?

意味著任何開發(fā)者、任何團(tuán)隊(duì)、任何公司,都可以在自己的基礎(chǔ)設(shè)施上跑這個(gè)模型,不用擔(dān)心哪天收到一封信說“你不能用了”。

告別“卡脖子”,從此挺直腰桿寫代碼!

智譜在發(fā)布公告的結(jié)尾寫了兩句話:

“A step closer to frontier intelligence for everyone. The future of AI is open, and it is for the people.”

向前沿智能再近一步,為每一個(gè)人。AI的未來是開放的,它屬于所有人。

放在2026年6月這個(gè)時(shí)間節(jié)點(diǎn)上,這兩句話分量尤重。

我們正在見證AI編程的權(quán)力轉(zhuǎn)移:從少數(shù)閉源巨頭的手中,轉(zhuǎn)移到每一個(gè)開發(fā)者的終端里。這場(chǎng)轉(zhuǎn)移不會(huì)一蹴而就,但方向已清晰無比。

智能,不該是少數(shù)人的特權(quán)。

而這一次,中國(guó)開源模型不僅坐在了牌桌上,還親手洗了牌。





特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
泰緬邊境又炸了!妙瓦底倒了,更血腥的“KK園區(qū)2.0”正在崛起

泰緬邊境又炸了!妙瓦底倒了,更血腥的“KK園區(qū)2.0”正在崛起

小小科普員
2026-06-25 16:06:40
2.6萬名中國(guó)學(xué)生用AI寫作業(yè)30個(gè)月后,成績(jī)單驚現(xiàn)恐怖倒掛:考試分?jǐn)?shù)暴跌24%

2.6萬名中國(guó)學(xué)生用AI寫作業(yè)30個(gè)月后,成績(jī)單驚現(xiàn)恐怖倒掛:考試分?jǐn)?shù)暴跌24%

紫京講談
2026-06-24 14:45:29
印度人擠爆深圳了

印度人擠爆深圳了

深圳客
2026-06-26 10:53:38
曾3-2擊敗巴西?伊東純也:友誼賽和世界杯完全是兩回事

曾3-2擊敗巴西?伊東純也:友誼賽和世界杯完全是兩回事

懂球帝
2026-06-26 13:05:08
百萬網(wǎng)紅黃一鳴賬號(hào)被封禁,作品全部清空,此前囂張網(wǎng)暴女素人

百萬網(wǎng)紅黃一鳴賬號(hào)被封禁,作品全部清空,此前囂張網(wǎng)暴女素人

四斤
2026-06-25 10:08:29
60歲以后,存款超過這三個(gè)數(shù),那么恭喜您,你已經(jīng)超過了大多數(shù)人

60歲以后,存款超過這三個(gè)數(shù),那么恭喜您,你已經(jīng)超過了大多數(shù)人

貓叔東山再起
2026-06-26 09:45:11
多艘船通過運(yùn)河,中巴爆發(fā)新爭(zhēng)端,我大使斬釘截鐵,不許撕毀契約

多艘船通過運(yùn)河,中巴爆發(fā)新爭(zhēng)端,我大使斬釘截鐵,不許撕毀契約

策前論
2026-06-26 13:44:36
普京:烏克蘭是前線撐不住才打俄本土

普京:烏克蘭是前線撐不住才打俄本土

桂系007
2026-06-23 23:10:03
iPhone 18 Pro Max曝光:靈動(dòng)島暴瘦35,蘋果正面設(shè)計(jì)四年首變

iPhone 18 Pro Max曝光:靈動(dòng)島暴瘦35,蘋果正面設(shè)計(jì)四年首變

小柱解說游戲
2026-06-25 02:56:49
A股:今天跌破4030了,下周一,股市可能要這樣走了!

A股:今天跌破4030了,下周一,股市可能要這樣走了!

明心
2026-06-26 15:10:13
世界杯32強(qiáng)淘汰賽:巴西vs日本 日本球員發(fā)話:不管對(duì)手是誰 目標(biāo)奪冠

世界杯32強(qiáng)淘汰賽:巴西vs日本 日本球員發(fā)話:不管對(duì)手是誰 目標(biāo)奪冠

新英體育
2026-06-26 11:04:45
為什么不能干涉他人的因果?網(wǎng)友:有些事兒說不清楚

為什么不能干涉他人的因果?網(wǎng)友:有些事兒說不清楚

阿康四歲啦
2026-06-26 11:05:34
“李思潼畢業(yè)發(fā)言”,沖上熱搜

“李思潼畢業(yè)發(fā)言”,沖上熱搜

南方都市報(bào)
2026-06-26 12:32:22
CCTV5直播!2026美國(guó)大滿貫國(guó)乒參賽名單、賽程以及央視直播表

CCTV5直播!2026美國(guó)大滿貫國(guó)乒參賽名單、賽程以及央視直播表

好乒乓
2026-06-26 15:01:56
王菲低調(diào)登西安城墻!隨行人員氣場(chǎng)不凡,疑似解鎖秦腔非遺新身份

王菲低調(diào)登西安城墻!隨行人員氣場(chǎng)不凡,疑似解鎖秦腔非遺新身份

魔都姐姐雜談
2026-06-26 15:38:11
朝陽群眾又立新功!網(wǎng)紅印度餐廳上午爆火下午涼透,老板直接遣返

朝陽群眾又立新功!網(wǎng)紅印度餐廳上午爆火下午涼透,老板直接遣返

愛下廚的阿釃
2026-06-26 13:54:08
替女上司擋災(zāi)縫15針,第二天被開除,收拾東西時(shí)她突然叫住我

替女上司擋災(zāi)縫15針,第二天被開除,收拾東西時(shí)她突然叫住我

千秋文化
2026-06-23 20:03:54
3-1!1-1!世界杯死亡之組大結(jié)局:3隊(duì)攜手出線 日本vs巴西

3-1!1-1!世界杯死亡之組大結(jié)局:3隊(duì)攜手出線 日本vs巴西

葉青足球世界
2026-06-26 09:00:18
19歲網(wǎng)紅“鐘美美”被波士頓大學(xué)錄取引爭(zhēng)議,網(wǎng)友到底在“酸”什么?

19歲網(wǎng)紅“鐘美美”被波士頓大學(xué)錄取引爭(zhēng)議,網(wǎng)友到底在“酸”什么?

新民周刊
2026-06-25 16:19:30
轟25+11!中國(guó)女籃20歲1米86混血前鋒崛起:偶像是李夢(mèng)

轟25+11!中國(guó)女籃20歲1米86混血前鋒崛起:偶像是李夢(mèng)

李喜林籃球絕殺
2026-06-26 16:54:04
2026-06-26 19:23:00
超前實(shí)驗(yàn)室 incentive-icons
超前實(shí)驗(yàn)室
前沿科技,超前觀察? ——『超前實(shí)驗(yàn)室』
13文章數(shù) 3關(guān)注度
往期回顧 全部

科技要聞

拿了500億的梁文鋒,只挖地基,不信銷售

頭條要聞

已有19支隊(duì)伍晉級(jí)32強(qiáng) 盤點(diǎn)世界杯小組出線形勢(shì)

頭條要聞

已有19支隊(duì)伍晉級(jí)32強(qiáng) 盤點(diǎn)世界杯小組出線形勢(shì)

體育要聞

我在世界杯的每次奔跑,都為了證明你沒看錯(cuò)

娛樂要聞

玥兒不回北京,馬筱梅解釋后媽身份

財(cái)經(jīng)要聞

懸在科技頭上的達(dá)摩克利斯之劍

汽車要聞

老板們的新座駕!65萬元起,尊界V800/V680開啟預(yù)訂

態(tài)度原創(chuàng)

藝術(shù)
健康
親子
教育
公開課

藝術(shù)要聞

王羲之的7個(gè)兒子,只有他學(xué)到了父親書法的神韻,水平不輸王獻(xiàn)之

“無糖湯圓”是否隱藏著健康陷阱?

親子要聞

科普|備孕第一步:讀懂身體“悄悄話”

教育要聞

全程免費(fèi)!面向河南等省高一高二學(xué)生,海軍工程大學(xué)夏令營(yíng)開始報(bào)名

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版