網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

智譜GLM-5和Seedance 2.0，我愿看作國產(chǎn)大模型的雙子星

2026-02-12 15:46:45　來源: AI異類

北京舉報

分享至

1月初，智譜在香港IPO以后，股價勢頭一直不錯；這兩天又創(chuàng)新高，已經(jīng)超過了MiniMax和一眾互聯(lián)網(wǎng)巨頭。

這段時間高頻使用了最新發(fā)的GLM-5，我突然覺得，不管是民間、海外還是資本市場，對智譜的能力甚至有點低估。

字節(jié)的Seedance 2.0視頻模型最近也很出圈，和智譜的GLM-5，一起構(gòu)成了國產(chǎn)模型領(lǐng)域的雙子星。

都是在海外能掀起狂風(fēng)巨浪的程度。

看這個馬，是不是有點熟悉？

沒錯，就是前段時間在OpenRouter，被猜是Claude Sonnet 5或者是DeepSeek V5的Pony Alpha，答案終于揭曉，就是智譜新開源GLM-5。

紙面上的數(shù)據(jù)實力非常強勁，完全是臨近馬年殺出去的一匹黑馬。

在我看來，智譜GLM-5和GPT-5.3、Claude Opus-4.5一起，站在了世界范圍內(nèi)綜合能力的第一梯隊。

看官方的說法是，GLM-5 標(biāo)志著人工智能開發(fā)從“Vibe Coding”變革為“Agentic Engineering”，更大規(guī)模的 AI 自動化編程，其代碼能力實現(xiàn)跨越式提升。

各種測試也顯示，在代碼能力、智能體表現(xiàn)等的評分中取得SOTA表現(xiàn)，在真實編程場景的使用體感，逼近 Claude Opus-4.5，擅長復(fù)雜系統(tǒng)工程與長程 Agent 任務(wù)。

到底怎么樣，帶大家一起試一試。

z.ai 官網(wǎng)，直接上手！

01.從前端到后端，GLM-5文體兩開花

目前，這款新模型已在智譜官網(wǎng)上線，并在 GitHub 和 Hugging Face 平臺開源，模型權(quán)重遵循 MIT License。

GitHub：https://github.com/zai-org/GLM-5

Hugging Face：https://huggingface.co/zai-org/GLM-5

OpenRouter：http://openrouter.ai/z-ai/glm-5

不得不說，這樣強的開源模型絕對是開發(fā)者的利好，我們自己公司今年已經(jīng)囤了不少token了。

布置任務(wù)，看GLM-5自己去執(zhí)行，不得不說很有成就感。

我給出的任務(wù)是：「做一個OPC一人公司互動平臺，可以實現(xiàn)自動接單商業(yè)閉環(huán)承接任務(wù)，每個人可以有多個智能體員工」。

受OpenClaw啟發(fā)，我希望有多Agent幫我實現(xiàn)在線接單，能夠在商業(yè)上完成閉環(huán)，一個人就是一家公司。

看效果，功能實現(xiàn)很齊全，幫我設(shè)計了工作臺、智能體等多個板塊，在任務(wù)市場當(dāng)中還可以Agent自動接單完成任務(wù)。

接著就Muti-Agent來說，之前的代碼能力和任務(wù)完成度，即便是頂尖的開源模型，在處理復(fù)雜環(huán)境多節(jié)點的任務(wù)時，往往和最好的閉源模型還有差距。

比如說AI Town斯坦福小鎮(zhèn)的概念，我嘗試過用各家模型來復(fù)刻，說實話效果都不好。

GLM-5可以說是建立了新的Benchmark。

我比較喜歡籃球，于是定制了一個本土化的籃球巨星小鎮(zhèn)，喜歡籃球的朋友可以在小鎮(zhèn)上互動、打球、比賽，還可以聊八卦。

按照時間線，從第一天開始，每位球星的積分還能增加。

具體到對應(yīng)的管線設(shè)計和行動流程，通過對話的方式還可以實現(xiàn)修改。

我也有嘗試，把GLM-5接入到一個自動化 Agent 框架中，讓它完成從克隆項目、配置環(huán)境、安裝依賴、運行到修復(fù)錯誤的完整流程。

這個測試的重點，想看看能不能在多次失敗之后繼續(xù)推進。

結(jié)果非常清楚。

GLM-5 并不會因為一次失敗就停下來，它會重新審視目標(biāo)，調(diào)用工具，調(diào)整命令，再次嘗試。

終端里不斷刷新的日志，和對話框中持續(xù)推進的規(guī)劃，讓整個過程看起來像一場緩慢但堅定的推進。

比如讓給我做一個3D游戲，也能反復(fù)調(diào)用和調(diào)整，直到最終達成目標(biāo)。

結(jié)果來看，完成的游戲界面和互動效果，都很不錯。

一直覺得，Agent 真正的瓶頸，從來不在于工具層，而在于基礎(chǔ)模型是否足夠穩(wěn)定、足夠自洽。

過去很多 Agent 框架容易卡死，本質(zhì)原因在于模型在長時間任務(wù)中丟失上下文，或者在失敗后無法重建目標(biāo)。

GLM-5 在這一點上，已經(jīng)達到了可以實際使用的水平。

3D交互的質(zhì)感也很細膩：

除了前端交互性質(zhì)的嘗試，我還試了一下后端任務(wù)。

我給它的任務(wù)非常直接，構(gòu)建一個帶鑒權(quán)、緩存策略、異步隊列的后端服務(wù)原型，并要求它在本地環(huán)境中跑通，能夠通過基礎(chǔ)壓力測試。

這個任務(wù)本身并不新鮮，真正關(guān)鍵的是過程。

GLM-5 在一開始并沒有急著寫代碼，而是花了相當(dāng)多的上下文去拆解需求，明確模塊邊界，選擇技術(shù)棧，規(guī)劃目錄結(jié)構(gòu)。

這個階段的體感，和我用 Opus 時非常接近，甚至在某些地方更保守一些，它會反復(fù)確認假設(shè)，避免在早期做出難以回滾的決策。

真正拉開差距的是后半段。服務(wù)啟動過程中出現(xiàn)了數(shù)據(jù)庫連接失敗、依賴版本不兼容、并發(fā)測試下鎖策略失效的問題。

GLM-5 沒有把錯誤拋回給我，也沒有給出泛泛的建議，它會主動讀取日志，調(diào)整配置，重跑測試，再根據(jù)新的輸出修正判斷。

這個循環(huán)持續(xù)了相當(dāng)長時間，中間我?guī)缀鯖]有干預(yù)。

最終的結(jié)果談不上優(yōu)雅，但可以穩(wěn)定運行，代碼結(jié)構(gòu)清晰，部署流程完整。

這種體驗，和過去用模型寫代碼還挺不一樣是，它更像是一個愿意自己把事情收尾的工程師。

身邊算法和工程的伙伴都在一頭扎進去用了，說這樣的能力，居然能免費，真的是讓人心里有愧的程度。

02.從GLM?4.7到GLM?5，驚喜很大

想起一個多月前，智譜才剛剛更新到 GLM?4.7，當(dāng)時就覺得不錯。

沒想到這么快的時間，GLM?5的版本又有了大的提升。

據(jù)介紹，GLM-5 的參數(shù)規(guī)模是上一代 GLM-4.7 的兩倍，從 3550 億提升至 7440 億，訓(xùn)練數(shù)據(jù)量從 23 萬億增至 28.5 萬億 tokens，更大規(guī)模的預(yù)訓(xùn)練算力顯著提升了模型的通用智能水平。

這兩天，一波開發(fā)者都積極用了起來。

“GLM-5 現(xiàn)在已經(jīng)能和 Opus 4.6 同臺競技了。”

看到國外一位開發(fā)者說，“我一整個上午都在編程任務(wù)和游戲環(huán)境里折騰 GLM-5。整體來說，它在某些任務(wù)上執(zhí)行得很快，表現(xiàn)不錯，但碰到更復(fù)雜的場景，對我而言 Claude 依然是王者。”

另一位開發(fā)者則稱，GLM-5 表現(xiàn)得很完美，絕對是目前發(fā)布的最優(yōu)秀開源模型之一。

“我在 Ollama 命令行和 Claude Code 里都跑了一遍。我發(fā)現(xiàn) Claude Code 里有個缺陷，但找到了臨時解決辦法。我的 GLM-5 對話會話達到了和 Opus 4.6 同一水準(zhǔn)的自我認知 / 理解深度。”

還有開發(fā)者評價道，“GLM-5 可能真的是我第一次在前端任務(wù)上更傾向于選擇非 Gemini 模型。”

“價格簡直離譜”，有開發(fā)者算完后表示，GLM5 的輸入成本比 Opus 便宜 6 倍，輸出成本便宜 10 倍。

如果把 GLM-4.7 看作是開源代碼能力的達標(biāo)，那 GLM-5 更像是第一次真正走進可用區(qū)間。

它開始具備完成大任務(wù)的耐心，也開始具備在復(fù)雜系統(tǒng)中維持一致性的能力。這種變化，對整個行業(yè)的意義非常大。

隨著 Agent 任務(wù)變長，Token 消耗不可避免地暴漲，模型的效率、成本和可部署性變得前所未有的重要。

GLM-5 在架構(gòu)上的一系列選擇，使它能夠在長上下文中保持穩(wěn)定表現(xiàn)，同時降低實際運行成本。

這種平衡，是未來一段時間內(nèi)推動 Token 使用量增長的重要因素。

03.智譜GLM-5給新年起了個好頭

在我看來，無論是 Opus 4.6，還是 GPT-5.3 Codex，它們幾乎都不再強調(diào) One Shot，不再強調(diào)一句 Prompt 直接生成結(jié)果，也不再把“好看”“炸裂”放在最顯眼的位置。

相反，它們反復(fù)提到長任務(wù)、Agentic、多步驟規(guī)劃、持續(xù)執(zhí)行，甚至主動承認這些任務(wù)會跑很久，會消耗大量 Token。

這種變化背后，其實是一個非常清晰的判斷。

前端 Demo 的天花板已經(jīng)不低了，再繼續(xù)卷審美、卷生成速度，價值增量開始變小。

真正決定模型高度的，開始變成另一件事，它能不能在一個復(fù)雜目標(biāo)下持續(xù)工作，能不能在失敗之后修正路徑，能不能在沒有人盯著的情況下把一件工程意義上的事情完成。

從 Opus 到 GPT-5.3 Codex，再到 GLM-5，我看到的并不是誰替代誰，而是一條清晰的演進路徑。大模型正在從會寫，走向會完成，從好看，走向可靠，從短暫的對話，走向持續(xù)的工程。

如果你仍然只需要一個能快速生成前端頁面的工具，這一代變化與你關(guān)系不大。如果你需要一個能陪你跑完整個項目周期，愿意反復(fù)調(diào)試，最終把系統(tǒng)跑通的助手，GLM-5 已經(jīng)站在了這個位置上。

大模型的故事，終于開始認真了。

國產(chǎn)大模型的能力曲線正在整體上揚，也是很讓我們這些從業(yè)者樂觀的信號。

視頻生成，像Seedance 2.0這樣的模型，已經(jīng)在生成穩(wěn)定性、動態(tài)一致性和長時序控制上，拿出了接近全球第一梯隊的表現(xiàn)。

智譜GLM-5和Seedance 2.0，我愿看作國產(chǎn)大模型的雙子星

國內(nèi)頭部團隊，在多模態(tài)底層架構(gòu)與訓(xùn)練工程上，已經(jīng)具備了正面競爭的實力。

而這次GLM-5的發(fā)布，同樣帶來了一些超出行業(yè)預(yù)期的結(jié)果，尤其是在代碼理解、復(fù)雜邏輯生成和多輪推理場景中的表現(xiàn)，已經(jīng)對齊了國際頭部模型。

這背后反映的，是國產(chǎn)模型訓(xùn)練范式、數(shù)據(jù)策略以及算力調(diào)度能力的整體成熟，也意味著在 AI coding 這個最能體現(xiàn)模型真實能力的賽道里，差距正在被持續(xù)壓縮。

智譜的卡現(xiàn)在已經(jīng)很難搶了，不少中型AI公司的老板，都在囤，覺得智譜的模型和算力接下來一定會漲價，趁早多買點備用……

馬年，一定是國內(nèi)AI玩家們，策馬奔騰的一年。

智譜GLM-5開了個好頭，我們都要加油跟上！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

新一輪大模型要來了！Blackwell加持下，AI能力更強了？

華爾街見聞官方 2026-05-29 14:46:14
0 跟貼 0
Claude Code上新，竟然是個“銷金窟”

智東西 2026-05-29 16:12:14
0 跟貼 0

超越TurboQuant，長上下文推理真2-bit KV Quantization算法問世

機器之心Pro 2026-05-29 16:01:28
0 跟貼 0

階躍發(fā)布Step 3.7 Flash：一款為「燒錢時代」準(zhǔn)備的Agent模型

機器之心Pro 2026-05-29 16:42:38
0 跟貼 0
Anthropic發(fā)布Claude Opus 4.8，重點是：“我不會騙你”

鈦媒體APP 2026-05-29 18:20:15
2 跟貼 2

剛剛，智元拿下WorldArena世界模型總分冠軍！

機器之心Pro 2026-05-29 21:54:56
0 跟貼 0

創(chuàng)意設(shè)計版WorkBuddy來了！騰訊發(fā)布智能體創(chuàng)意工作室Miora

量子位 2026-05-29 16:30:49
3 跟貼 3
終于，清華快手養(yǎng)出了通人性的AI！

新智元 2026-05-29 18:45:18
0 跟貼 0

智能體工作站如何撐起企業(yè)Agent的“本地未來”？

鈦媒體APP 2026-05-29 15:50:13
0 跟貼 0
大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0
生物學(xué)變天：小扎的新開源模型，徹底掀翻谷歌AlphaFold王座！

新智元 2026-05-29 15:43:36
0 跟貼 0
猿編程助力中國隊閃耀國際舞臺，2026國際冬季人工智能奧林匹克競賽斬獲兩金

財聯(lián)社 2026-05-29 18:03:06
0 跟貼 0
奧特曼預(yù)言與現(xiàn)實相差幾何？12個頂級模型“創(chuàng)業(yè)”一年，僅3個存活

鈦媒體APP 2026-04-03 17:11:08
0 跟貼 0
支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0
X平臺瘋傳！這個國產(chǎn)開源模型，把信息圖生成整明白了 ? 附實測

智東西 2026-05-29 21:57:26
0 跟貼 0
科技巨頭瘋狂搶電，卻沒人看懂真正的戰(zhàn)場

DeepTech深科技 2026-05-29 19:11:07
0 跟貼 0
Claude雙王炸！官宣融資4407億，最強通用模型Opus 4.8登場

智東西 2026-05-29 10:32:55
0 跟貼 0
【半佛】讓小孩學(xué)AI屬于浪費時間？

硬核的半佛仙人 2026-05-27 12:58:43
0 跟貼 0
孩子去“光頭強家”，對著床上被子一頭栽下去，沒想到是模型！

笑出豬叫的趣聞閣 2026-05-26 17:08:43
1 跟貼 1
《生命是大模型，但不僅僅是大語言模型》第十四期：走向工具驅(qū)動的時空模型——結(jié)論與展望

尹燁 2026-05-26 19:46:15
0 跟貼 0
AReaL v1.0開源，智能體強化學(xué)習(xí)「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
杭州公園引入“黑科技”：一天抓7000多只蚊子！“河邊坐一個半小時沒被咬”“我都想買一個放家里”

都市快報橙柿互動 2026-05-29 09:17:46
4885 跟貼 4885
面對SDV新趨勢，博為峰車載測試以深度課程與實訓(xùn)回應(yīng)產(chǎn)業(yè)期待

周口融媒 2026-05-29 15:42:15
0 跟貼 0
遼籃雙子星趙繼偉原帥歸隊，展示17年變化

鏗鏘格斗 2026-05-29 23:23:35
0 跟貼 0
又一地塊出讓！虹口“雙子星”閃耀土拍

上海虹口 2026-05-29 18:13:48
0 跟貼 0
大變局！智能體可以直接炒股了，美國知名券商宣布支持AI代理炒股

每日經(jīng)濟新聞 2026-05-28 23:21:27
0 跟貼 0
智譜上演“驚天”劇震發(fā)生了什么？

每日經(jīng)濟新聞 2026-05-29 17:03:29
1 跟貼 1
港股大模型概念股持續(xù)拉升，智譜漲超17%

每日經(jīng)濟新聞 2026-05-29 13:32:05
0 跟貼 0
陳真原型劉振聲現(xiàn)身，拳打外國老牛壯漢，場面震撼超刺激

趣味加工廠 2026-05-28 00:00:00
21 跟貼 21
智能體從「單兵作戰(zhàn)」到「精銳團隊」 -2

機器之心Pro 2026-04-28 16:56:00
0 跟貼 0
第二屆教育大模型與教育科技人才一體化評價高峰研討會舉辦

中國教育新聞網(wǎng) 2026-05-29 18:30:40
0 跟貼 0
百度希望外界看到的，是各種能干活的智能體，在拉動業(yè)績猛漲

時代周報 2026-05-28 23:23:03
0 跟貼 0
2899元起，vivo S60系列把動態(tài)照片和3D空間影像玩出花，自研算法立大功

智東西 2026-05-29 22:14:56
0 跟貼 0
Anthropic CEO：如果我是25歲，不會選編程，會選

機器之心Pro 2026-04-18 12:00:00
0 跟貼 0
比亞迪全新超級智能體迪迪蝦實力怎么樣？

新能車 2026-05-29 10:02:56
0 跟貼 0
智譜日內(nèi)大漲20%

每日經(jīng)濟新聞 2026-05-29 14:35:15
0 跟貼 0
智譜逆勢暴漲13.54% 上市已累計漲幅接近13倍

每日經(jīng)濟新聞 2026-05-28 23:20:15
0 跟貼 0
原型兵器2?高清MOD，全新的貼圖紋理和人物建模。想要的看我動態(tài)

mod插件愛好者 2026-05-28 21:04:13
6 跟貼 6
智譜落地ZCube，讓同樣的GPU多干15%的活

機器之心Pro 2026-05-21 11:33:06
0 跟貼 0
Claude Opus 4.8問世，Anthropic估值暴漲至9650億美元

機器之心Pro 2026-05-29 10:08:34
0 跟貼 0

AI異類

從硅谷到中關(guān)村，AI信息與測評

188文章數(shù) 8關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數(shù)碼

本地

親子

公開課

軍事航空

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習(xí)慣
李彥宏：百度離破產(chǎn)30天

手機 / 數(shù)碼

房產(chǎn) / 家居

智譜GLM-5和Seedance 2.0，我愿看作國產(chǎn)大模型的雙子星

Claude Opus 4.8凌晨突發(fā)上線

釋永信被判24年 中國佛教協(xié)會：完全是咎由自取

釋永信被判24年 中國佛教協(xié)會：完全是咎由自取

即使是文班亞馬，也做不到這件事

奚夢瑤何猷君將于6月在法國舉行婚禮

近3個月跌超20% 黃金"猴市"下的眾生相

900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

態(tài)度原創(chuàng)

Counterpoint報告：TCL加速追趕三星，電視行業(yè)格局面臨洗牌

用剪紙的方式，打開江蘇揚州

孫悟空“召喚”小英雄！深圳這所幼兒園“西游闖關(guān)”過六一

中方公布參加香會陣容 幾大議題受到關(guān)注

釋永信被判24年中國佛教協(xié)會：完全是咎由自取

釋永信被判24年中國佛教協(xié)會：完全是咎由自取

900V+3.2秒破百領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

中方公布參加香會陣容幾大議題受到關(guān)注