網易首頁 > 網易號 > 正文 申請入駐

全球首款龍蝦模型上線!Agent這波直接起飛了~(夾帶干貨)

0
分享至

先看看用GLM-5-Turbo開發的:一人公司-龍蝦團隊管理系統

可以跟你的龍蝦配對,一鍵把龍蝦中的所有Agent納入系統進行可視化管理,非常直觀,他們甚至還能去喝水,換工位,哈哈就像一個辦公室一樣。

另外,我還找到了讓龍蝦幫我全自動操縱claude code完成長任務(一整晚那種)的終極方案,再也不用守著電腦當claude code的監工了!

大家好,我是袋鼠帝。

我最近每天都會盯一眼 OpenClaw 的微信指數。

然而這兩天我發現openclaw(龍蝦)的熱度開始斷崖式下降了


這是為什么呢?

我跟幾位圈內大佬交流了一下,大家的看法出奇的一致:狂歡過后,是一地雞毛。。

很多人一開始都是看熱鬧,各路媒體鋪天蓋地地報道,大家聽說出了個能代替人干活的賽博員工,還能裝進手機里,覺得非常NB,然后紛紛產生了羊群效應,跟風去部署或者買現成的龍蝦。

但是,隨著新鮮感褪去,大家開始發現不對勁了:

臥槽,我花了大價錢、費了老勁搞的這個龍蝦,怎么用起來感覺也就是個普通的聊天AI?在某些日常對話上,甚至還沒免費的豆包好用!


有些執行力更強的朋友,給龍蝦裝了各種各樣的 Skills(技能插件),試圖讓它去執行一些自動化任務。

結果發現,龍蝦干活慢吞吞的,而且有時候干到一半就莫名其妙的罷工或者報錯,讓人血壓飆升。


真相是:跟 AI 聊天和讓 AI 干活,完全是兩碼事。

你讓通用大模型跟你嘮嗑、寫寫文章,它非常擅長。但是,你讓它去執行一個長鏈條的復雜任務,中間只要涉及多次工具調用、跨應用協同,很多模型不穩定,腦子容易亂。

問題出在哪?在于很多大模型并沒有專門針對龍蝦任務進行過訓練。

以及你的使用方式可能沒用對,好的工程化+強大的模型=好用的Agent,龍蝦也不例外。

就在今天,智譜扔出了一顆重磅炸彈:正式發布了全球首個專門為龍蝦優化的模型--GLM-5-Turbo。


這款模型是在他們原本就已經很能打的旗艦級代碼模型 GLM-5 的基礎上,再次回爐,專門針對龍蝦流進行了深度訓練,非常適合作為Agent的基座模型。

先給大家劃一下重點(省流版):

工具調用極穩:不再出現調錯接口、傳錯參數的低級失誤。

復雜任務規劃、拆解:你給它一個宏大的目標,它能像個項目經理、架構師一樣,有條不紊的拆解需求,設計架構,最終完成目標。甚至還能輕易開啟多Agent去并行執行。

長任務不中斷:它能處理那些需要掛機跑幾個小時的長線任務,中途不掉線、不失憶。

速度大幅提升:在處理邏輯鏈條長、吞吐量大的任務時,響應速度也肉眼可見的變快了。

而且在正式發布之前,它是以 Pony-Alpha-2 的匿名代號在智譜的 AutoClaw(澳龍)上進行了內測。


說實話,我原本是不太敢在自己這臺存了很多重要資料的主力辦公電腦上安裝開源的 OpenClaw 的,怕它權限太大亂動東西。

但智譜官方出的這個 AutoClaw 在安全合規上讓人更放心,我就直接裝了。

https://autoglm.zhipuai.cn/autoclaw/


裝完之后,它有一個一鍵接入飛書的操作,直接給我看呆了。

我只點了一下授權登錄飛書,剩下的創建機器人、配置權限、配置長連接、發布版本那些繁瑣的步驟,在我面前全自動幫我做了。

開箱即用,這個體驗,真的有點爽。

由于我是coding plan的Max會員,又是博主,所以我提前拿到了這個 Pony-Alpha-2(也就是現在的 GLM-5-Turbo)的內測資格,這幾天深度體驗下來,感覺非常驚艷!它確實對得起龍蝦專用模型這個稱號。

一、 耗時兩天,打造了OpenClaw可視化管理系統

用過原生 OpenClaw 的朋友都知道,它的web界面比較簡陋,如果有多個Agent在后臺干活,根本不直觀。

所以我決定直接OpenClaw結合GLM-5-Turbo,擼一套 OpenClaw 多 Agent 可視化管理系統。

把它當做我一人公司的賽博辦公室,每個Agent都是我的員工,有自己的工位。

大致功能如下:

新增員工,可以看到它是從大門進來找工位工作的,他們還會時不時的去喝水

這套系統就是靠 龍蝦 + GLM-5-Turbo 寫出來的。

花了兩天迭代,它幫我完成了包括 Vue 3 前端(帶有 Canvas 虛擬辦公室、深色 UI 和動畫系統)、Node.js 后端(包含 Express API 和 WebSocket 實時通信服務),還寫了一個準備發布的 npm 包。

生成了幾十個文件,幾千行代碼,代碼質量也非常穩定。

中間遇到跑不起來的情況,基本都是我本地的 Node 環境或者端口沖突問題,代碼本身的邏輯漏洞很少。

最讓我佩服的是它在長程對話中的上下文記憶能力。

在開發過程中,我遇到了一個頭疼的 Bug:我派發出去的子 Agent 執行完任務后,返回的結果總是空的。

這個問題有點復雜,需要模型同時理解 OpenClaw 的網關認證機制、后端降級架構,以及各種 Session Key 的讀取邏輯。


它沒有像無頭蒼蠅一樣瞎改,通過層層排查,最終精準地找到了病根:

原來是我代碼里讀取 Session Key 的函數,優先返回了子 Agent 的 Key,而不是主任務的 Key,導致權限不足被網關攔截了。

不過這個項目目前還有一些點小瑕疵,準備近期完善之后開源出來~

感興趣的朋友可以多多三連

二、AI監工:龍蝦全自動操縱Claude Code寫代碼

做過 AI coding 的朋友肯定都有過這樣的痛點:

你想讓 AI 幫你寫個復雜的項目,雖然它能寫,但你得時不時盯著它。

它可能會寫了一段就停下來了,你得讓它繼續;或者遇到報錯卡住了,你得趕緊幫它看看。

這就有點煩,自己成了一個寸步不離的監工...

而且,跟 AI 聊久了,上下文窗口一旦爆滿,它就會開始胡言亂語,忘了前面寫過什么。

然后,我最近看了 Anthropic 官方發布的一篇關于解決長時 AI 任務的博客。

https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents


核心思想是:建立一套標準的交接班機制。一個負責初始化的 Agent 把大任務拆成一個個小任務清單,然后負責寫代碼的 Agent 每次只領一個小任務去開發,寫完、測試通過、提交 Git,然后再領下一個。這樣每次的上下文都很干凈。

我把這套機制的規則發給了接入GLM-5-Turbo的Claude Code。

它理解得很好,并生成了一套規則文件,如下:


工作流程是這樣的(如圖):



然后我跟claude code進行了多輪對話,把我要開發的一個 API 中轉站項目(基于new-api做二次開發)需求對齊了,然后讓它寫了詳細的需求文檔和開發計劃。

并根據上面的全自動規則文件,幫我把任務,拆解成了詳細的feature_list.json任務清單。


但是,問題又來了。每次執行完一個小任務,還是得我手動去敲回車,讓它繼續去領下一個任務。

這不還是得當監工嗎?

這時候,龍蝦就派上用場了,讓龍蝦來當這個監工!去監督 Claude Code 干活~

我先讓龍蝦去學習了那套全自動管理的規則

然后我給龍蝦里的 GLM-5-Turbo 下達了指令,設置了定時任務:

每隔 5 分鐘去檢查一下任務清單里的任務狀態,如果發現上一個任務完成了,就自動通過命令行去喚醒 Claude Code 執行下一個任務。


確認計劃沒問題之后,它就開始了。

這下,徹底解放雙手了~


第一次測試是在凌晨 1 點 55 分,我把這倆 AI 掛在Mac Mini上,自己睡覺去了。


第二天早上醒來一看日志,凌晨 3點5分 的時候,第一版的 API中轉站二開任務已經全部執行完畢,并且測試通過。

后來,我又用同樣的方法,如法炮制,全自動重構了第二版

這個方案是每開發、驗證完一個小任務,就會提交一次commit到Github,所以有完整的git記錄,整個過程的完成情況都可追溯,有跡可循。


由于new-api已經是一個成熟的開源項目了,所以我對它的都是一些細小的改動,但即便經過這么多次的修改,功能也沒有任何影響,還是非常穩的。



GLM-5-Turbo 操控著龍蝦,龍蝦監督著 接入GLM-5-Turbo的Claude Code。真就是左腳踩右腳,直接螺旋升天...

那種徹底把重復性勞動甩給AI的爽快感,無法用語言形容。

目前我已經讓GLM-5-Turbo把這套全自動管理任務的方案開發成了Skills,叫task-harness


并讓它幫我上傳到了github、和clawhub,有需要的朋友可以自取。

如果覺得有幫助的話,記得點個星標哦,非常感謝~

https://clawhub.ai/kangarooking/task-harness

https://github.com/kangarooking/kangarooking-skills

「最后」

體驗下來,智譜這次發布的 GLM-5-Turbo干活能力非常強,而且很穩定,確實是專為龍蝦優化的模型。

畢竟,我們養龍蝦就是為了讓它幫忙干活的。

另外,智譜還推出了基于GLM-5-Turbo的龍蝦Claw套餐,包含個人版和Team版。

面向嚴肅的企業和個人辦公場景,這個套餐有嚴格的數據保護機制,配合國內合規環境和企業級API,敏感數據全程可控,適合企業內部AI系統無縫接入使用。

我作為coding plan深度體驗者,我想說,Agent時代,還得是套餐劃算啊。

這是我最近一個月在智譜花費的token,是2.15億(而且并不是天天用)。

Max套餐是按次來的,我用了2個月,就只觸發過一次限制。我買的是一個季度,算下來一個月160左右。


如果按照API的正常價格來算,2億多的token,感覺得上千了。


在大模型剛剛興起的時候,大家都在打價格戰,那時候覺得幾塊錢/100萬token的價格,簡直就是白菜價。但那時候的模型是玩具,你用它寫寫詩、聊聊天,免費的也湊合。

現在我們進入了 Agent 時代,各家又開始卷模型套餐價格了,雖然還沒到白菜價,但也就是你平時出去吃一頓的價格。并且你買的不再是那些虛無縹緲的 Token 數量,你是在雇傭一個 24 小時不知疲倦、不鬧情緒、還能不斷自我學習、進化的數字員工。

一個能幫你通宵寫完一個商業級應用,或者每天雷打不動幫你盯盤、做競品分析的員工,你愿意給他開多少工資?

我相信,在接下來的幾個月里,能用好龍蝦等Agent工具的人,將會和還在用手敲鍵盤的人,拉開難以逾越的效率鴻溝。

以及不管有沒有養上龍蝦,都可以去智譜領養一只澳龍體驗一下,一鍵安裝,開箱即用,而且非常強大。以下是來自朋友的肯定~


我是袋鼠帝,一個致力于幫你把AI變成生產力的博主。我們下期見~

能看到這里的都是鳳毛麟角的存在!

如果覺得不錯,隨手點個贊、在看、轉發三連吧~

如果想第一時間收到推送,也可以給我個星標?

謝謝你耐心看完我的文章~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
被斷供了,日本光刻膠突然喊“救命”,要向中國求救了?

被斷供了,日本光刻膠突然喊“救命”,要向中國求救了?

科技專家
2026-04-25 18:35:41
莫雷諾剛重返上海就進球!同時做出重要決定,直言申花就是他的家

莫雷諾剛重返上海就進球!同時做出重要決定,直言申花就是他的家

張麗說足球
2026-04-25 12:51:47
有多少人想偷塔斯汀的椅子?

有多少人想偷塔斯汀的椅子?

跳海大院
2026-04-08 11:59:41
長公主被家暴流產了

長公主被家暴流產了

毒舌扒姨太
2026-04-08 22:29:19
穆杰塔巴傷情曝光,比外界想象的更嚴重,他用了一招終結斬首戰術

穆杰塔巴傷情曝光,比外界想象的更嚴重,他用了一招終結斬首戰術

Ck的蜜糖
2026-04-25 17:42:28
以牙還牙,中國打響反制第一槍,一舉切斷美歐命脈,美歐坐立難安

以牙還牙,中國打響反制第一槍,一舉切斷美歐命脈,美歐坐立難安

古史青云啊
2026-04-25 08:46:23
火箭絕望的并非出局而是以下三件事!杜蘭特被孤立,烏度卡留隊

火箭絕望的并非出局而是以下三件事!杜蘭特被孤立,烏度卡留隊

羅納爾說個球
2026-04-25 18:11:49
0-3陷絕境!火箭離奇輸球,烏度卡下課呼聲炸鍋

0-3陷絕境!火箭離奇輸球,烏度卡下課呼聲炸鍋

軍武英雄
2026-04-25 18:35:37
美軍第二艘航母將參與封鎖伊朗

美軍第二艘航母將參與封鎖伊朗

財聯社
2026-04-24 20:30:07
長期遭受侮辱!忍無可忍的陳妍希再出手,她和趙麗穎做了同樣選擇

長期遭受侮辱!忍無可忍的陳妍希再出手,她和趙麗穎做了同樣選擇

阿纂看事
2026-04-25 16:44:04
翻臉真快!越南670億高鐵爛尾,剛簽德國就求中國,蘇林太精明

翻臉真快!越南670億高鐵爛尾,剛簽德國就求中國,蘇林太精明

洞見小能手
2026-04-25 12:26:40
麻生太郎后悔了,要對高市早苗發起“逼宮”,日本政壇或變天?

麻生太郎后悔了,要對高市早苗發起“逼宮”,日本政壇或變天?

石江月
2026-04-25 17:12:24
蘇州河岸又有人干這事 上海明確禁止過

蘇州河岸又有人干這事 上海明確禁止過

看看新聞Knews
2026-04-24 22:00:07
太狠了!3000元招保姆,要求承擔做飯、帶娃并無償試用,引發爭議

太狠了!3000元招保姆,要求承擔做飯、帶娃并無償試用,引發爭議

火山詩話
2026-04-25 16:38:17
川崎前鋒官方:原中國籍19歲后衛關德晴已正式取得日本國籍

川崎前鋒官方:原中國籍19歲后衛關德晴已正式取得日本國籍

懂球帝
2026-04-24 18:27:06
團播如何滿足1700萬“挪用姐”情緒:20級儀式專屬視頻、迪奧戒指

團播如何滿足1700萬“挪用姐”情緒:20級儀式專屬視頻、迪奧戒指

娛樂資本論
2026-04-23 23:01:00
紀委最頭疼的7種“隱性受賄”:不收禮也可能已犯法

紀委最頭疼的7種“隱性受賄”:不收禮也可能已犯法

細說職場
2026-04-25 17:58:11
何猷亨與新女友近照曝光,相互依偎笑得甜蜜,女方一頭長發好斯文

何猷亨與新女友近照曝光,相互依偎笑得甜蜜,女方一頭長發好斯文

八斗小先生
2026-04-25 16:54:22
軟件開發最后的一塊兒陣地,被AI攻克了......

軟件開發最后的一塊兒陣地,被AI攻克了......

碼農翻身
2026-04-23 08:59:23
男子在蔣介石故居對面別墅區,花214.19萬法拍下兩更衣室兩廁所,還有1100余平方米土地使用權,兩年來無法使用

男子在蔣介石故居對面別墅區,花214.19萬法拍下兩更衣室兩廁所,還有1100余平方米土地使用權,兩年來無法使用

大風新聞
2026-04-24 15:13:07
2026-04-25 19:28:49
袋鼠帝 incentive-icons
袋鼠帝
持續分享AI實踐干貨,走超級個體崛起之路
75文章數 71關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

男童7歲18斤被當腦癱治多年 父母查出生病歷發現大問題

頭條要聞

男童7歲18斤被當腦癱治多年 父母查出生病歷發現大問題

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

房產
健康
教育
本地
公開課

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

干細胞如何讓燒燙傷皮膚"再生"?

教育要聞

簡便計算 !

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版