无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<label id="6ceqn"><xmp id="6ceqn">

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

剛剛，Fable-5之下，智譜開源的GLM-5.2拿下AI編程第一！

2026-06-17 10:49:38　來源: 量子位

北京舉報

0

分享至

金磊發自凹非寺
量子位 | 公眾號 QbitAI

在Coding這件事上，國產AI又famous了一下。

因為剛剛，在Claude Fable 5之下，開源界里拿下了AI編程第一（全球第二）：

不僅Arena官方用“令人難以置信的里程碑”來形容GLM-5.2取得的成績，很多網友也是直呼“瘋狂”：

不僅如此，在專門評測模型品味（taste）的Design Arena上，GLM-5.2取得全球第一的表現。

以及，在八項權威基準測試中，GLM-5.2的表現也是比較亮眼：

從結果上來看，國產、開源的大模型，可以說在Coding這件事上，首次躋身模型全球御三家（Claude、OpenAI和智譜）。

要知道，此前提到AI界的御三家，那大概率指向的是Claude、OpenAI和谷歌，不過這一次，從實打實的榜單能力來看，谷歌的Gemini實實在在地被GLM淘汰掉了。

而且這幾天國外各大博主陸陸續續開始了各種實測。

當然，實測的主角不只是GLM-5.2，他們還把GPT-5.5 High、Opus 4.8 High和Kimi K2.7 Code拉來一起同臺競技。

先說結論：

GLM 5.2表現得極其出色。

實際的對比效果是這樣的：

這位博主認為這類測試是在X上比較能體現AI實力的那種，而GLM-5.2的表現已經接近Claude Opus 4.8。

無獨有偶。

另一位外國博主同樣做了類似的實測，GLM-5.2依舊是穩穩輸出，讓他直呼道：

This is crazy.

但體感和口碑還只是一方面。

若是深挖一下GLM-5.2，它的亮點還包括：

支持真正可用的1M上下文，并在長程任務中繼續保持領先。

換句話說，現在的GLM-5.2可以一口氣“吃”下大項目級上下文、跨數小時自主推進。在很長一段時間里，Opus 級別的長任務與大型開發任務，是國產模型與海外旗艦之間很大的gap。

那么當它走進真實工作環境，效果如何？

一波實測，走起~

是真記得，還是只裝得下？

完整代碼庫理解

首先我們要測試的是GLM-5.2的記憶力。

因此，我們特意準備了GitHub上的Appsmith項目。

之所以選這個項目，是因為它是一個開源低代碼平臺，用于構建dashboard、admin panel、IT自動化等內部應用，天然包含前端、后端、插件、部署、權限等復雜模塊。

然后我們直接“喂”給GLM-5.2這樣的Prompt：

你是資深軟件架構師。桌面上的Appsmith是一個完整項目代碼庫，請先不要修改代碼。請完成三件事： 1.梳理項目整體架構，輸出核心模塊、調用關系和數據流； 2.找出跨模塊耦合最重的3處，并說明原因； 3.給出一份可執行的重構路線圖，要求不破壞現有接口和測試。

這項任務的重點看模型能否把前端、后端、插件、Git服務、運行時和部署關系串起來。

先來看GLM-5.2的結果（上下滑動查看）：

可以看到，GLM-5.2先把Appsmith拆成monorepo結構，前端、后端的定位，以及拆分目錄也是非常精準。

更關鍵的是，它把幾條主鏈路串了出來。并且在耦合點判斷上，GLM-5.2也抓到了3個關鍵位置。

接下來是CodeX的表現（上下滑動查看）：

從輸出的效果來看，CodeX的結果更加清爽一些，它直接畫出了Appsmith的整體架構圖，并且對核心模塊的拆解也準確。

兩者的判斷有不少交集，都抓到了前端Redux/Saga中心化、后端ActionExecutionSolutionCEImpl.java過重，以及CE/EE繼承結構的問題。

不過雖然Codex的可讀性更強一些，但更像一份結構清晰的技術備忘；而GLM-5.2覆蓋更深，文件、鏈路、風險點和遷移階段給得更多，像是在給項目做一次工程體檢。

跨文件追Bug

第二項實測，我們換成OpenWebUI，測試一個真實工程里常見的問題，跨文件追Bug。

Prompt是這樣的：

桌面上的open-webui項目里有一個線上Bug，請你從全庫代碼中定位可能原因，給出：1.最可能的問題鏈路；2.涉及文件和函數；3.修復方案；4.需要補充的測試用例。不要只看單個文件，請結合調用鏈分析。

GLM-5.2抓住了一個核心點，也就是DirectConnection流式返回的邊界不可靠（上下滑動查看）。

它把問題定位到“前端把上游SSE分片后再回傳，后端按完整事件解析”這條鏈路，并給出前后端兩側修復方向。

這一關很適合看模型有沒有真正沿著調用鏈走。

如果只看單個文件，很容易給出“加重試”、“加日志”、“檢查緩存”這類通用答案。但這個問題真正藏在前端chunk、SSE協議、socket轉發和后端JSON解析之間。

新增功能

第三個實測，我們繼續用OpenWebUI，任務是新增“會話摘要導出為Markdown”功能：

請在open-webui項目中新增一個“會話摘要導出為Markdown”的功能：1.用戶可以選擇一個歷史會話；2.系統生成結構化摘要；3.支持導出Markdown；4.補充必要測試；5.不要破壞現有接口。請先給出實現計劃，再分步驟修改。

對于這個任務，模型需要先理解會話數據怎么存，權限怎么判斷，前端菜單入口在哪里，API怎么封裝，測試應該放在哪里。

GLM-5.2這一輪更像完整工程交付：

它把“Markdown導出”拆成后端工具、路由、前端API、UI入口和測試五層；最后，它跑出了38個后端測試全部通過。

這就是AgenticCoding真正要看的地方。交付物不能只是一段代碼，還要能并入項目。

一口氣做多項任務

第四個實測，我們這次嘗試讓GLM-5.2和CodeX一口完成多個任務。

Prompt是這樣的：

基于公開可驗證數據，構建一套可追溯、可復現的 2026 年英國 PBSA（學生公寓）行業研究與數據分析包，系統評估學生需求、供給管線、租金走勢、運營商格局及投資環境，為內部投資與預算決策提供支持。

在片刻之后，GLM-5.2一口在桌面輸出一整個文件夾的內容：

做的圖表是這樣的（上下滑動查看）：

也同時生成了一份完整的分析報告：

整體來看，GLM-5.2在文件數量、表格結構、圖表覆蓋、復現腳本和數據質量控制上更完整，最終更像一套可以拿去內部評審前繼續打磨的研究材料包。

什么時候別用1M

不過有一說一，1M上下文并不是什么任務都適用。

如果只是改一個小函數、補一個簡單腳本、改一個按鈕文案，整庫上下文的收益并不明顯。很多時候，只給必要文件，模型反而更快、更干凈，也更不容易過度設計。

真正適合1M上下文的，可能是下面這幾類任務：

整庫理解、跨文件追Bug、長期重構、復雜功能新增、多交付物研究項目、超長文檔審閱、代碼和文檔一起分析。

也就是說，1M上下文是為了讓它在真實工作里少忘事、少跑偏、少反復問你要背景。

它把長上下文從一個發布參數，拉回了開發者和知識工作者真正熟悉的現場：一個大項目、一堆歷史包袱、幾個跨模塊Bug、一項不能破壞舊邏輯的新需求，以及一整套必須同時交付的報告、表格、圖表和腳本。

模型競爭進入長期工作能力階段

這輪測完，一個最直接感受或許是這樣的：

AICoding正在換階段。

過去大家更關注模型會不會寫代碼、會不會補全、會不會一次性生成一個Demo。這個階段比的是單次輸出能力。

但現在，開發者開始把模型放進真實工程流里使用。任務不再是寫一個孤立函數，而是讀完整項目、理解架構、追蹤調用鏈、保持需求約束、修改多處文件、補測試、生成文檔，甚至連續十幾分鐘、幾個小時自主推進。

這時候，模型競爭的核心就變了。

上下文長度不再只是參數表上的數字，它開始變成Coding Agent的工作內存。一個Agent要持續工作，就必須記住項目結構、接口約定、歷史決策、工具調用結果、中間修改狀態和用戶最開始給出的邊界條件。只要中途忘掉一項，最后產物就可能偏。

所以長上下文真正重要的地方，在于把AI Coding從會寫一段代碼，推向能做一段工程。

這也是為什么GLM-5.2有機會進入AI Coding里的“御三家”。

在全球CodingAgent進入硬核的長程工程階段后，開發者正在形成三類主流選擇：ClaudeCode、OpenAICodex，以及以GLM-5.2為核心的開源長程CodingAgent路線。

Claude Code代表的是閉源Coding Agent體驗的上限，強在工程體感、工具調用和復雜任務推進；
OpenAI CodeX代表的是OpenAI體系下的代碼生成和智能體路線，背后有模型、產品和開發者生態的連續投入；
而GLM-5.2代表的，則是另一條同樣關鍵的路線：開源、長上下文、面向真實工程任務的Coding Agent底座。

這條路線的價值，不只在于國產模型也能寫代碼。

更重要的是，當AI Coding進入大工程階段，開發者需要的不只是一個云端黑盒。很多團隊會關心模型能否私有化，能否接入自己的工具鏈，能否讀內部代碼庫，能否承載長上下文任務，能否在成本可控的前提下穩定工作。

開源長程Coding Agent路線，正好補上了這塊拼圖。

如果說前一階段的AI Coding，比的是誰能更快寫出一段能跑的代碼；那么下一階段，比的就是誰能更久地待在項目里，理解它、記住它、改動它，并且不把它弄壞。

這也是GLM-5.2這次最核心的信號：

國產開源模型的競爭，已經不只是在榜單上追分，而是在進入真實開發者工作流，進入長程工程任務，進入AICoding最硬核的牌桌。

而這張牌桌上，GLM-5.2終于有了一個清晰的位置。

參考鏈接：
[1]https://x.com/ng_thanh8/status/2066806465042718755
[2]https://x.com/OmedVibeCodes/status/2066568185202012170
[3]https://x.com/aicodeking/status/2065714397159555563
[4]https://x.com/arena/status/2066957802741043641
[5]https://x.com/Designarena/status/2066940737011560652

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

當Fable 5全球下架，GLM 5.2逼近Opus 4.8“意義重大”

華爾街見聞官方 2026-06-17 10:10:25
0 跟貼 0
40萬次Claude Code會話實錘：這才是AI時代最值錢的本事！

新智元 2026-06-17 12:18:11
0 跟貼 0

馬斯克麾下最慘打工人：手滑刪掉xAI三周訓練數據

新智元 2026-06-17 10:10:04
0 跟貼 0

當AI Agent開始工作，安全該如何跟上？AgentDoG 1.5開源發布

機器之心Pro 2026-06-16 18:34:50
0 跟貼 0
AI巨頭算經濟賬！微軟據報考慮采用開源模型降低智能體費用

財聯社 2026-06-17 04:47:11
1 跟貼 1

小米云端辦公龍蝦來了！打通了WPS，14.9元交個朋友

智東西 2026-06-17 10:09:49
0 跟貼 0

大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0
廣東開先河：全省公務員共享一個AI Agent辦公大腦

智東西 2026-06-17 10:40:42
0 跟貼 0

李飛飛剛立規矩才13天，國產卡上「真物理」就來了！

新智元 2026-06-17 12:19:19
0 跟貼 0
成本高企倒逼轉向，微軟考慮以DeepSeek替換昂貴的美國AI模型

華爾街見聞官方 2026-06-17 12:11:26
0 跟貼 0
“AI領域最被濫用的術語”李飛飛終于把世界模型講明白了

量子位 2026-06-07 04:37:43
0 跟貼 0
剛剛，又一XR頭部玩家殺入AI眼鏡賽道，聯手英偉達

智東西 2026-06-17 11:02:00
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
國產萬億級模型技術報告公開！螞蟻這樣攻克能力成本延遲“不可能三角”

智東西 2026-06-16 20:32:58
1 跟貼 1
4個MIT 00后，兩年干出全球最火AI編程工具，600億美元賣給SpaceX

DeepTech深科技 2026-06-17 11:03:34
0 跟貼 0
山姆中國被約談當日變更董事長

瀟湘晨報 2026-06-16 18:15:10
49149 跟貼 49149
睡前一按“補氣按鈕”，腿腳利索，年輕態！

博學成長社 2026-06-16 10:40:37
3 跟貼 3
熊孩子隨意按下電梯的急停按鈕，結果導致所有人陷入危險

影視寶藏 2026-06-15 10:47:42
3 跟貼 3
爬樓機器人多方便，只需要兩個按鈕，最后輕松實現上下樓！

爆笑小次郎 2026-06-13 12:03:45
14 跟貼 14
AI悄然成為游戲開發基建，2026關鍵數據解讀

固件更新中 2026-06-17 01:14:53
0 跟貼 0
朝鮮族市場隱藏菜單，醬蟹拌飯一口入魂！

饞嘴小陳 2026-06-16 04:58:39
0 跟貼 0
未來10年學什么技術最搶手？根據國家發展方向，最緊缺的技術崗位

冷白喵 2026-06-15 00:55:47
0 跟貼 0
好優秀！四年級小孩哥電腦編程。網友：未來的代碼高手！

政法頻道 2026-06-15 08:51:03
0 跟貼 0
佛得角隊逼平西班牙隊：有人贏了470萬美元，也有人100萬美元一夜歸零

紅星新聞 2026-06-16 12:54:45
5121 跟貼 5121
“三江轉債”今日申購

每日經濟新聞 2026-06-17 08:23:04
0 跟貼 0
AI自己寫代碼，訓出1B端側「小鋼炮」-1

機器之心Pro 2026-05-26 14:32:09
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
Anthropic CEO：如果我是25歲，不會選編程，會選

機器之心Pro 2026-04-18 12:00:00
0 跟貼 0
免費復刻影視颶風工作流

科技俠來了 2026-06-15 14:16:35
5 跟貼 5
奔馳廣州4S店大興寶鴻悄然撤場近千名車主預付權益懸空

新快報新聞 2026-06-17 10:59:05
85 跟貼 85
男子曬出兒子的“冷門”玩具，不僅有“道閘”還有電梯按鈕，網友調侃：年紀輕輕就當上了保安

氧氣周末 2026-06-15 14:53:00
1 跟貼 1
公廁里面有沖水提示，貼的太不合理，找按鈕找了半天！

山河藏意深 2026-06-16 15:38:29
1 跟貼 1
國家剛剛明確：支持上海先行先試

界面新聞 2026-06-17 10:08:39
2 跟貼 2
讓機器人動作流暢絲滑如「連音」1

機器之心Pro 2026-05-29 10:07:02
0 跟貼 0
理想發布具身智能汽車戰略，下半年迎來三輪OTA升級

IPO早知道 2026-06-16 17:26:35
0 跟貼 0
柬埔寨對華免簽落地首日即有老廣團出發

新快報新聞 2026-06-16 08:19:02
12133 跟貼 12133
上海鏈家通報調查細節：未吃差價！已主動聯系主管部門指導

澎湃新聞 2026-06-16 15:26:29
1164 跟貼 1164
黑色目錄競賽

大熊綜藝 2026-06-15 16:52:47
7 跟貼 7
劉浩存在《光明日報》發文：借由憶秦娥，觸摸到了秦腔的魂

華商網 2026-06-17 10:18:09
12 跟貼 12
風行CEO易正朝：真正的全產業殺手應用是AI編程，相比AI視頻，AI編程對企業經營的意義更大

量子位 2026-05-21 08:05:56
0 跟貼 0

不愧是哈蘭德，世界杯首秀2球1助！挪威4比1拿下伊拉克

不愧是哈蘭德，世界杯首秀2球1助！挪威4比1拿下伊拉克

澎湃新聞

2026-06-17 08:04:28

佛得角：感謝中國幫圓夢世界杯

大象新聞

2026-06-16 17:41:02

梅西獲評10分+加冕MVP:戴帽+飆2記世界波,率阿根廷迎世界杯開門紅

梅西獲評10分+加冕MVP:戴帽+飆2記世界波,率阿根廷迎世界杯開門紅

側身凌空斬

2026-06-17 11:00:56

制裁比預想快？特奧多羅被制裁沒幾天，鄉鎮生力啤酒罕見全線清倉

制裁比預想快？特奧多羅被制裁沒幾天，鄉鎮生力啤酒罕見全線清倉

青梅侃史啊

2026-06-16 16:39:31

伊朗宣稱：已全面戰勝美國！

微評社

2026-06-16 19:22:07

悲涼！考研刪光舍友，6人唯一上岸的青海女生，哭訴不堪宿舍經歷

悲涼！考研刪光舍友，6人唯一上岸的青海女生，哭訴不堪宿舍經歷

火山詩話

2026-06-17 09:40:58

德仁天皇當眾怒懟高市早苗：70年來頭一遭，日本皇室要變天？

德仁天皇當眾怒懟高市早苗：70年來頭一遭，日本皇室要變天？

新姐看世界

2026-06-16 19:52:28

向佐透露弟弟向佑近況：和父母斷聯，回不了家，靠他提供經濟支持

向佐透露弟弟向佑近況：和父母斷聯，回不了家，靠他提供經濟支持

一盅情懷

2026-06-17 06:17:55

力壓姆巴佩!24歲天才當選MVP：4數據全場第1 皇馬要買？得掏2億歐

力壓姆巴佩!24歲天才當選MVP：4數據全場第1 皇馬要買？得掏2億歐

風過鄉

2026-06-17 06:08:58

39歲梅西連進3球，登頂世界杯歷史射手王，賽前用中文發帖！41歲C羅明天登場！德國隊營地遭毒蛇入侵，隊員受驚：每走一步都要低頭看腳下

39歲梅西連進3球，登頂世界杯歷史射手王，賽前用中文發帖！41歲C羅明天登場！德國隊營地遭毒蛇入侵，隊員受驚：每走一步都要低頭看腳下

每日經濟新聞

2026-06-17 11:57:19

剛剛，馬斯克拿下Cursor，SpaceX大漲17%！

剛剛，馬斯克拿下Cursor，SpaceX大漲17%！

智東西

2026-06-17 00:15:29

十字韌帶撕裂+癌癥+腰椎手術！還能打NBA，奇跡...

十字韌帶撕裂+癌癥+腰椎手術！還能打NBA，奇跡...

左右為籃

2026-06-17 12:09:40

高市早苗在G7峰會會場“轉椅子”畫面引爭議，日本網民：沒教養，真丟人

高市早苗在G7峰會會場“轉椅子”畫面引爭議，日本網民：沒教養，真丟人

環球網資訊

2026-06-17 09:58:22

國家金融監管總局：支持新型金融業務在上海先行先試

國家金融監管總局：支持新型金融業務在上海先行先試

界面新聞

2026-06-17 10:08:39

雷軍被罵東施效顰！都是在街邊，都是吃面，遭嘲諷模仿黃仁勛翻車

雷軍被罵東施效顰！都是在街邊，都是吃面，遭嘲諷模仿黃仁勛翻車

譚談社會

2026-06-16 18:34:43

最新消息：3000億美元伊朗重建基金已落實一半！到底誰出錢？特朗普：美國不出；萬斯：海灣國家出！伊朗380萬桶原油通過美軍封鎖線

最新消息：3000億美元伊朗重建基金已落實一半！到底誰出錢？特朗普：美國不出；萬斯：海灣國家出！伊朗380萬桶原油通過美軍封鎖線

每日經濟新聞

2026-06-17 09:27:07

俄羅斯高官：75.5%的中國青年愿意學俄語或提升俄語水平

俄羅斯高官：75.5%的中國青年愿意學俄語或提升俄語水平

風向觀察

2026-06-16 15:10:20

歌手蘇醒稱贊梅西：臥槽瘋了，奔四了來刷射手榜了！

歌手蘇醒稱贊梅西：臥槽瘋了，奔四了來刷射手榜了！

懂球帝

2026-06-17 12:06:03

這個小女孩火了！大聲吐槽雷軍：吃早飯還要拍照，評論區替她擔心

這個小女孩火了！大聲吐槽雷軍：吃早飯還要拍照，評論區替她擔心

譚談社會

2026-06-16 19:46:45

日本球迷揮舞垃圾袋入場，在世界杯賽后撿垃圾，被本國民眾批評“出國作秀”：也請撿撿澀谷街頭的垃圾吧

日本球迷揮舞垃圾袋入場，在世界杯賽后撿垃圾，被本國民眾批評“出國作秀”：也請撿撿澀谷街頭的垃圾吧

大象新聞

2026-06-16 11:53:02

追蹤人工智能動態

12801文章數 176499關注度

往期回顧全部

科技要聞

美國給Anthropic新模型上了“芯片級管制”

頭條要聞

"退衣姐"被刑拘：曾1次調包90多件衣服這手法玩了4年

頭條要聞

"退衣姐"被刑拘：曾1次調包90多件衣服這手法玩了4年

體育要聞

梅西帽子戲法：紀錄厚重，球王輕盈

娛樂要聞

百花獎名單惹爭議，這5位實在可惜！

財經要聞

陸家嘴論壇上，央行帶來六大新政策利好

汽車要聞

三車齊發零跑全新C10/C11/C16上市12.58萬元起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

手機

旅游

藝術

數碼

本地新聞

這屆年輕人為什么都在找心流時刻？

手機要聞

古爾曼爆料蘋果布局2028款iPhone：升級1.4nm工藝

旅游要聞

青海大柴旦地震翡翠湖等景區臨時關閉，游客擔心影響月底行程，當地回應

藝術要聞

劉小東 2026年油畫近作

數碼要聞

三星顯示展示40000 nits超高亮RGB OLEDoS微顯示器面板

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<style id="ae14l"></style>

<sub id="ae14l"><tr id="ae14l"><div id="ae14l"></div></tr></sub>