无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

智譜GLM-5和Seedance 2.0,我愿看作國產(chǎn)大模型的雙子星

0
分享至

1月初,智譜在香港IPO以后,股價勢頭一直不錯;這兩天又創(chuàng)新高,已經(jīng)超過了MiniMax和一眾互聯(lián)網(wǎng)巨頭。

這段時間高頻使用了最新發(fā)的GLM-5,我突然覺得,不管是民間、海外還是資本市場,對智譜的能力甚至有點低估。

字節(jié)的Seedance 2.0視頻模型最近也很出圈,和智譜的GLM-5,一起構(gòu)成了國產(chǎn)模型領(lǐng)域的雙子星。

都是在海外能掀起狂風(fēng)巨浪的程度。



看這個馬,是不是有點熟悉?

沒錯,就是前段時間在OpenRouter,被猜是Claude Sonnet 5或者是DeepSeek V5的Pony Alpha,答案終于揭曉,就是智譜新開源GLM-5。

紙面上的數(shù)據(jù)實力非常強勁,完全是臨近馬年殺出去的一匹黑馬。


在我看來,智譜GLM-5和GPT-5.3、Claude Opus-4.5一起,站在了世界范圍內(nèi)綜合能力的第一梯隊。

看官方的說法是,GLM-5 標(biāo)志著人工智能開發(fā)從“Vibe Coding”變革為“Agentic Engineering”,更大規(guī)模的 AI 自動化編程,其代碼能力實現(xiàn)跨越式提升。


各種測試也顯示,在代碼能力、智能體表現(xiàn)等的評分中取得SOTA表現(xiàn),在真實編程場景的使用體感,逼近 Claude Opus-4.5,擅長復(fù)雜系統(tǒng)工程與長程 Agent 任務(wù)。

到底怎么樣,帶大家一起試一試。

z.ai 官網(wǎng),直接上手!

01.從前端到后端,GLM-5文體兩開花


目前,這款新模型已在智譜官網(wǎng)上線,并在 GitHub 和 Hugging Face 平臺開源,模型權(quán)重遵循 MIT License。

GitHub:https://github.com/zai-org/GLM-5

Hugging Face:https://huggingface.co/zai-org/GLM-5

OpenRouter:http://openrouter.ai/z-ai/glm-5

不得不說,這樣強的開源模型絕對是開發(fā)者的利好,我們自己公司今年已經(jīng)囤了不少token了。

布置任務(wù),看GLM-5自己去執(zhí)行,不得不說很有成就感。


我給出的任務(wù)是:「做一個OPC一人公司互動平臺,可以實現(xiàn)自動接單商業(yè)閉環(huán)承接任務(wù),每個人可以有多個智能體員工」。

受OpenClaw啟發(fā),我希望有多Agent幫我實現(xiàn)在線接單,能夠在商業(yè)上完成閉環(huán),一個人就是一家公司。


看效果,功能實現(xiàn)很齊全,幫我設(shè)計了工作臺、智能體等多個板塊,在任務(wù)市場當(dāng)中還可以Agent自動接單完成任務(wù)。


接著就Muti-Agent來說,之前的代碼能力和任務(wù)完成度,即便是頂尖的開源模型,在處理復(fù)雜環(huán)境多節(jié)點的任務(wù)時,往往和最好的閉源模型還有差距。

比如說AI Town斯坦福小鎮(zhèn)的概念,我嘗試過用各家模型來復(fù)刻,說實話效果都不好。

GLM-5可以說是建立了新的Benchmark。


我比較喜歡籃球,于是定制了一個本土化的籃球巨星小鎮(zhèn),喜歡籃球的朋友可以在小鎮(zhèn)上互動、打球、比賽,還可以聊八卦。


按照時間線,從第一天開始,每位球星的積分還能增加。

具體到對應(yīng)的管線設(shè)計和行動流程,通過對話的方式還可以實現(xiàn)修改。

我也有嘗試,把GLM-5接入到一個自動化 Agent 框架中,讓它完成從克隆項目、配置環(huán)境、安裝依賴、運行到修復(fù)錯誤的完整流程。

這個測試的重點,想看看能不能在多次失敗之后繼續(xù)推進。

結(jié)果非常清楚。

GLM-5 并不會因為一次失敗就停下來,它會重新審視目標(biāo),調(diào)用工具,調(diào)整命令,再次嘗試。

終端里不斷刷新的日志,和對話框中持續(xù)推進的規(guī)劃,讓整個過程看起來像一場緩慢但堅定的推進。

比如讓給我做一個3D游戲,也能反復(fù)調(diào)用和調(diào)整,直到最終達成目標(biāo)。



結(jié)果來看,完成的游戲界面和互動效果,都很不錯。

一直覺得,Agent 真正的瓶頸,從來不在于工具層,而在于基礎(chǔ)模型是否足夠穩(wěn)定、足夠自洽。

過去很多 Agent 框架容易卡死,本質(zhì)原因在于模型在長時間任務(wù)中丟失上下文,或者在失敗后無法重建目標(biāo)。

GLM-5 在這一點上,已經(jīng)達到了可以實際使用的水平。

3D交互的質(zhì)感也很細膩:


除了前端交互性質(zhì)的嘗試,我還試了一下后端任務(wù)。

我給它的任務(wù)非常直接,構(gòu)建一個帶鑒權(quán)、緩存策略、異步隊列的后端服務(wù)原型,并要求它在本地環(huán)境中跑通,能夠通過基礎(chǔ)壓力測試。


這個任務(wù)本身并不新鮮,真正關(guān)鍵的是過程。

GLM-5 在一開始并沒有急著寫代碼,而是花了相當(dāng)多的上下文去拆解需求,明確模塊邊界,選擇技術(shù)棧,規(guī)劃目錄結(jié)構(gòu)。

這個階段的體感,和我用 Opus 時非常接近,甚至在某些地方更保守一些,它會反復(fù)確認假設(shè),避免在早期做出難以回滾的決策。


真正拉開差距的是后半段。服務(wù)啟動過程中出現(xiàn)了數(shù)據(jù)庫連接失敗、依賴版本不兼容、并發(fā)測試下鎖策略失效的問題。

GLM-5 沒有把錯誤拋回給我,也沒有給出泛泛的建議,它會主動讀取日志,調(diào)整配置,重跑測試,再根據(jù)新的輸出修正判斷。

這個循環(huán)持續(xù)了相當(dāng)長時間,中間我?guī)缀鯖]有干預(yù)。



最終的結(jié)果談不上優(yōu)雅,但可以穩(wěn)定運行,代碼結(jié)構(gòu)清晰,部署流程完整。

這種體驗,和過去用模型寫代碼還挺不一樣是,它更像是一個愿意自己把事情收尾的工程師。

身邊算法和工程的伙伴都在一頭扎進去用了,說這樣的能力,居然能免費,真的是讓人心里有愧的程度。

02.從GLM?4.7到GLM?5,驚喜很大

想起一個多月前,智譜才剛剛更新到 GLM?4.7,當(dāng)時就覺得不錯。

沒想到這么快的時間,GLM?5的版本又有了大的提升。


據(jù)介紹,GLM-5 的參數(shù)規(guī)模是上一代 GLM-4.7 的兩倍,從 3550 億提升至 7440 億,訓(xùn)練數(shù)據(jù)量從 23 萬億增至 28.5 萬億 tokens,更大規(guī)模的預(yù)訓(xùn)練算力顯著提升了模型的通用智能水平。

這兩天,一波開發(fā)者都積極用了起來。

“GLM-5 現(xiàn)在已經(jīng)能和 Opus 4.6 同臺競技了。”

看到國外一位開發(fā)者說,“我一整個上午都在編程任務(wù)和游戲環(huán)境里折騰 GLM-5。整體來說,它在某些任務(wù)上執(zhí)行得很快,表現(xiàn)不錯,但碰到更復(fù)雜的場景,對我而言 Claude 依然是王者。”

另一位開發(fā)者則稱,GLM-5 表現(xiàn)得很完美,絕對是目前發(fā)布的最優(yōu)秀開源模型之一。

“我在 Ollama 命令行和 Claude Code 里都跑了一遍。我發(fā)現(xiàn) Claude Code 里有個缺陷,但找到了臨時解決辦法。我的 GLM-5 對話會話達到了和 Opus 4.6 同一水準(zhǔn)的自我認知 / 理解深度。”


還有開發(fā)者評價道,“GLM-5 可能真的是我第一次在前端任務(wù)上更傾向于選擇非 Gemini 模型。”


“價格簡直離譜”,有開發(fā)者算完后表示,GLM5 的輸入成本比 Opus 便宜 6 倍,輸出成本便宜 10 倍。


如果把 GLM-4.7 看作是開源代碼能力的達標(biāo),那 GLM-5 更像是第一次真正走進可用區(qū)間。

它開始具備完成大任務(wù)的耐心,也開始具備在復(fù)雜系統(tǒng)中維持一致性的能力。這種變化,對整個行業(yè)的意義非常大。

隨著 Agent 任務(wù)變長,Token 消耗不可避免地暴漲,模型的效率、成本和可部署性變得前所未有的重要。

GLM-5 在架構(gòu)上的一系列選擇,使它能夠在長上下文中保持穩(wěn)定表現(xiàn),同時降低實際運行成本。

這種平衡,是未來一段時間內(nèi)推動 Token 使用量增長的重要因素。


03.智譜GLM-5給新年起了個好頭

在我看來,無論是 Opus 4.6,還是 GPT-5.3 Codex,它們幾乎都不再強調(diào) One Shot,不再強調(diào)一句 Prompt 直接生成結(jié)果,也不再把“好看”“炸裂”放在最顯眼的位置。

相反,它們反復(fù)提到長任務(wù)、Agentic、多步驟規(guī)劃、持續(xù)執(zhí)行,甚至主動承認這些任務(wù)會跑很久,會消耗大量 Token。

這種變化背后,其實是一個非常清晰的判斷。

前端 Demo 的天花板已經(jīng)不低了,再繼續(xù)卷審美、卷生成速度,價值增量開始變小。

真正決定模型高度的,開始變成另一件事,它能不能在一個復(fù)雜目標(biāo)下持續(xù)工作,能不能在失敗之后修正路徑,能不能在沒有人盯著的情況下把一件工程意義上的事情完成。


從 Opus 到 GPT-5.3 Codex,再到 GLM-5,我看到的并不是誰替代誰,而是一條清晰的演進路徑。大模型正在從會寫,走向會完成,從好看,走向可靠,從短暫的對話,走向持續(xù)的工程。

如果你仍然只需要一個能快速生成前端頁面的工具,這一代變化與你關(guān)系不大。如果你需要一個能陪你跑完整個項目周期,愿意反復(fù)調(diào)試,最終把系統(tǒng)跑通的助手,GLM-5 已經(jīng)站在了這個位置上。

大模型的故事,終于開始認真了。


國產(chǎn)大模型的能力曲線正在整體上揚,也是很讓我們這些從業(yè)者樂觀的信號。

視頻生成,像Seedance 2.0這樣的模型,已經(jīng)在生成穩(wěn)定性、動態(tài)一致性和長時序控制上,拿出了接近全球第一梯隊的表現(xiàn)。


智譜GLM-5和Seedance 2.0,我愿看作國產(chǎn)大模型的雙子星

國內(nèi)頭部團隊,在多模態(tài)底層架構(gòu)與訓(xùn)練工程上,已經(jīng)具備了正面競爭的實力。

而這次GLM-5的發(fā)布,同樣帶來了一些超出行業(yè)預(yù)期的結(jié)果,尤其是在代碼理解、復(fù)雜邏輯生成和多輪推理場景中的表現(xiàn),已經(jīng)對齊了國際頭部模型。

這背后反映的,是國產(chǎn)模型訓(xùn)練范式、數(shù)據(jù)策略以及算力調(diào)度能力的整體成熟,也意味著在 AI coding 這個最能體現(xiàn)模型真實能力的賽道里,差距正在被持續(xù)壓縮。

智譜的卡現(xiàn)在已經(jīng)很難搶了,不少中型AI公司的老板,都在囤,覺得智譜的模型和算力接下來一定會漲價,趁早多買點備用……

馬年,一定是國內(nèi)AI玩家們,策馬奔騰的一年。

智譜GLM-5開了個好頭,我們都要加油跟上!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
5月29號午評:三大指數(shù)集體下挫,大盤下周將走向何方?

5月29號午評:三大指數(shù)集體下挫,大盤下周將走向何方?

春江財富
2026-05-29 11:56:25
廣州一商場空調(diào)不制冷似“蒸籠”,商戶叫苦連天,客人:來了就想走

廣州一商場空調(diào)不制冷似“蒸籠”,商戶叫苦連天,客人:來了就想走

新浪財經(jīng)
2026-05-29 19:06:05
64歲張玉卓履新中國工程院黨組書記,曾掌舵全球最大煤炭和煉油央企

64歲張玉卓履新中國工程院黨組書記,曾掌舵全球最大煤炭和煉油央企

澎湃新聞
2026-05-29 22:40:26
黃仁勛一句話評華為"韜定律":真相藏在"不是威脅"的潛臺詞里

黃仁勛一句話評華為"韜定律":真相藏在"不是威脅"的潛臺詞里

商悟社
2026-05-29 12:21:03
上海炒股冠軍肺腑之語:如果你有20萬資金,建議死磕這么一種股票

上海炒股冠軍肺腑之語:如果你有20萬資金,建議死磕這么一種股票

股經(jīng)縱橫談
2026-05-29 21:30:48
向太這回恐要翻車!曝49歲黃曉明曾當(dāng)眾給她下跪,同桌十幾人目睹

向太這回恐要翻車!曝49歲黃曉明曾當(dāng)眾給她下跪,同桌十幾人目睹

寒士之言本尊
2026-05-29 16:09:42
女子因兒子去世在高鐵靜音車廂痛哭,第4次看到這樣的哭法

女子因兒子去世在高鐵靜音車廂痛哭,第4次看到這樣的哭法

九方魚論
2026-05-29 23:43:51
近3個月跌超20%,黃金“猴市”下的眾生相:有投資者貸款百萬追高,有人清倉虧損離場

近3個月跌超20%,黃金“猴市”下的眾生相:有投資者貸款百萬追高,有人清倉虧損離場

時代周報
2026-05-29 16:00:39
竟然全勝,國羽6席闖入新加坡公開賽4強,大概能拿1冠

竟然全勝,國羽6席闖入新加坡公開賽4強,大概能拿1冠

真理是我親戚
2026-05-29 22:50:35
沙特博主:克洛普已同意執(zhí)教吉達聯(lián)合,計劃今年10月正式到隊

沙特博主:克洛普已同意執(zhí)教吉達聯(lián)合,計劃今年10月正式到隊

懂球帝
2026-05-29 10:33:41
封面:賽前訓(xùn)練結(jié)束后,羅慕洛身穿國足10號球衣與記者告別

封面:賽前訓(xùn)練結(jié)束后,羅慕洛身穿國足10號球衣與記者告別

懂球帝
2026-05-29 22:41:06
第31屆白玉蘭惹眾怒!趙麗穎再次陪跑,李庚希黃曉明全被無視

第31屆白玉蘭惹眾怒!趙麗穎再次陪跑,李庚希黃曉明全被無視

子芫伴你成長
2026-05-28 00:05:34
布倫特福德官方:內(nèi)爾森租借期滿,回歸阿森納

布倫特福德官方:內(nèi)爾森租借期滿,回歸阿森納

懂球帝
2026-05-29 21:47:09
三大指數(shù)重挫,滬指跌超1% 近4000家個股下跌

三大指數(shù)重挫,滬指跌超1% 近4000家個股下跌

財聞
2026-05-29 14:18:47
收評:創(chuàng)業(yè)板指跌2.11% 大消費板塊走強

收評:創(chuàng)業(yè)板指跌2.11% 大消費板塊走強

證券時報
2026-05-29 15:22:05
一群賭徒,比華爾街更早知道世界會發(fā)生什么

一群賭徒,比華爾街更早知道世界會發(fā)生什么

華爾街見聞官方
2026-05-29 10:06:41
最大的鐵飯碗要碎了嗎:轉(zhuǎn)崗、超編、過剩......

最大的鐵飯碗要碎了嗎:轉(zhuǎn)崗、超編、過剩......

黯泉
2026-05-29 15:10:09
郝劭文回臺灣定居原因曝光,直播帶貨曾月賺近億元,會賺更會做人

郝劭文回臺灣定居原因曝光,直播帶貨曾月賺近億元,會賺更會做人

以茶帶書
2026-05-29 15:26:31
你最接近生理極限的一次經(jīng)歷是什么?網(wǎng)友分享讓人目瞪口呆!

你最接近生理極限的一次經(jīng)歷是什么?網(wǎng)友分享讓人目瞪口呆!

夜深愛雜談
2026-04-09 19:39:13
穆里尼奧天降大禮!曼城王朝崩塌!皇馬 6000 萬撿漏世界第一中衛(wèi)

穆里尼奧天降大禮!曼城王朝崩塌!皇馬 6000 萬撿漏世界第一中衛(wèi)

瀾歸序
2026-05-29 05:48:38
2026-05-30 00:20:49
AI異類 incentive-icons
AI異類
從硅谷到中關(guān)村,AI信息與測評
188文章數(shù) 8關(guān)注度
往期回顧 全部

科技要聞

Claude Opus 4.8凌晨突發(fā)上線

頭條要聞

釋永信被判24年 中國佛教協(xié)會:完全是咎由自取

頭條要聞

釋永信被判24年 中國佛教協(xié)會:完全是咎由自取

體育要聞

即使是文班亞馬,也做不到這件事

娛樂要聞

奚夢瑤何猷君將于6月在法國舉行婚禮

財經(jīng)要聞

近3個月跌超20% 黃金"猴市"下的眾生相

汽車要聞

900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

態(tài)度原創(chuàng)

數(shù)碼
本地
親子
公開課
軍事航空

數(shù)碼要聞

Counterpoint報告:TCL加速追趕三星,電視行業(yè)格局面臨洗牌

本地新聞

用剪紙的方式,打開江蘇揚州

親子要聞

孫悟空“召喚”小英雄!深圳這所幼兒園“西游闖關(guān)”過六一

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

中方公布參加香會陣容 幾大議題受到關(guān)注

無障礙瀏覽 進入關(guān)懷版