智譜GLM-5.1發(fā)布,主打"代理式編程"(Agentic Coding)。但看完技術(shù)報(bào)告我有個(gè)疑問:這到底是真突破,還是把舊酒裝進(jìn)了新瓶子?
一、先搞清楚它在打什么牌
![]()
GLM-5.1的核心賣點(diǎn)是讓AI自主完成代碼任務(wù)——不是補(bǔ)全幾行,而是理解需求、拆解步驟、調(diào)用工具、調(diào)試運(yùn)行。
官方放出的demo里,AI能根據(jù)一句自然語言描述,生成完整項(xiàng)目結(jié)構(gòu)。聽起來很香,但"能跑"和"好用"之間,隔著十個(gè)產(chǎn)品經(jīng)理。
二、三個(gè)值得摳的細(xì)節(jié)
第一,上下文窗口。GLM-5.1支持128K token,比GPT-4 Turbo的128K持平,但實(shí)際有效利用率才是硬指標(biāo)。很多模型標(biāo)稱窗口很大,中間信息照樣丟失。
第二,工具調(diào)用穩(wěn)定性。代理編程的核心是AI自己決定什么時(shí)候查文檔、什么時(shí)候跑測(cè)試。智譜沒公布工具調(diào)用的成功率,只給了"支持"兩個(gè)字——這很曖昧。
第三,代碼生成后的迭代能力。寫代碼容易,改代碼難。GLM-5.1能否根據(jù)報(bào)錯(cuò)信息自主修復(fù)?修復(fù)幾次后會(huì)不會(huì)跑偏?這些才是日常開發(fā)的真實(shí)痛點(diǎn)。
三、對(duì)比之下更清醒
GitHub Copilot已經(jīng)卷了三年,Cursor最近靠Claude 3.7 Sonnet的代理模式殺瘋了。GLM-5.1的差異化在哪?
智譜的答案是"中文場(chǎng)景優(yōu)化"——理解中文需求描述、對(duì)接國(guó)內(nèi)云服務(wù)、符合本土合規(guī)要求。這個(gè)定位很聰明,但也意味著天花板肉眼可見。
四、一個(gè)被忽略的信號(hào)
GLM-5.1的發(fā)布時(shí)機(jī)很有意思。OpenAI剛把o3的代碼能力當(dāng)賣點(diǎn),Anthropic的Claude Code還在內(nèi)測(cè),智譜選擇這時(shí)候硬剛,說明國(guó)內(nèi)大廠的焦慮:再不做代理編程,程序員用戶就要被搶光了。
但焦慮歸焦慮,產(chǎn)品歸產(chǎn)品。代理編程的護(hù)城河不在模型本身,而在生態(tài)——IDE插件、企業(yè)代碼庫接入、團(tuán)隊(duì)協(xié)作流。這些智譜都沒講清楚。
我的判斷:GLM-5.1是一次必要的卡位,但要說"顛覆",先把工具調(diào)用成功率和多輪迭代穩(wěn)定性曬出來再說。程序員的錢不好騙,寫兩行代碼就知道深淺。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.