新智元報(bào)道
編輯:Aeneas KingHZ
【新智元導(dǎo)讀】養(yǎng)蝦養(yǎng)得快碎了?Claude的Managed Agents降維打擊,最近爆火的Hermes更是全網(wǎng)屠榜,GitHub已四萬(wàn)星。AI OS時(shí)代已至,誰(shuí)還苦哈哈地配置Token?小龍蝦,要被新物種「升維」淘汰了。
小龍蝦該升維了!
最近出現(xiàn)的兩大AI新物種,讓曾經(jīng)風(fēng)靡全網(wǎng)的OpenClaw不得不「升級(jí)」了。
其一,就是昨天Anthropic上線的Managed Agents。OAuth一鍵接入、云端托管、沙箱隔離、Code Channels遠(yuǎn)程指揮……
從此,AI本身就是操作系統(tǒng),工具就是它的外設(shè)。對(duì)于在傳統(tǒng)操作系統(tǒng)上嫁接AI的小龍蝦來(lái)說(shuō),這就是降維打擊!
其二,就是最近已經(jīng)全網(wǎng)刷屏的Hermes Agent。
由Nous Research在2月底推出的這款開(kāi)源智能體,在GitHub上已經(jīng)狂攬4萬(wàn)星,更新速度超過(guò)大多數(shù)商業(yè)Agent產(chǎn)品。
![]()
https://github.com/nousresearch/hermes-agent
全網(wǎng)都在高呼:切到Hermes太爽了,OpenClaw可以被換掉了!
![]()
這個(gè)運(yùn)行在你服務(wù)器上的自主Agent,具有六大核心特性:與你同在、越用越強(qiáng)、定時(shí)自動(dòng)化、委派與并行、沙盒隔離、全網(wǎng)頁(yè)與瀏覽器控制。
Nous Research的slogan,是「一個(gè)會(huì)跟著你成長(zhǎng)的Agent」。他們的路線是:Agent不該只是一次性的調(diào)用接口,而應(yīng)該是私有的、常駐的、會(huì)積累的,并且最終能夠反哺訓(xùn)練。
無(wú)論是Managed Agents還是Hermes,都在告訴我們:小龍蝦或許要過(guò)氣了,AI操作系統(tǒng)的時(shí)代才剛剛開(kāi)始!
![]()
苦小龍蝦久矣!
過(guò)去幾個(gè)月,養(yǎng)龍蝦成了一場(chǎng)全民狂歡。
但這場(chǎng)狂歡的背后,是普通用戶與開(kāi)發(fā)者在為脆弱的架構(gòu)買(mǎi)單。
根據(jù)多家網(wǎng)絡(luò)與信息安全機(jī)構(gòu)的最新報(bào)告,ClawHub上高達(dá)36.8%的插件被查出存在嚴(yán)重漏洞或被投毒。
![]()
在臭名昭著的「ClawHavoc」攻擊事件中,成百上千個(gè)惡意插件偽裝成辦公助手,直接掃蕩用戶的本地~/.openclaw目錄。
![]()
不僅竊取飛書(shū)、郵箱的聊天記錄,連電子錢(qián)包的私鑰和交易所的密碼也一波被端。
![]()
一旦「利爪浩劫」事件爆發(fā),后果不堪設(shè)想
這根本不是全能助手,而是把自家的萬(wàn)能鑰匙扔在了賽博黑市里。
即便沒(méi)有,安全問(wèn)題,各種插件和密鑰東拼西湊出來(lái)的「縫合怪」OpenClaw,一邊狂燒token、抽干你的錢(qián)包,一邊掏空了你的情緒。
半夜兩點(diǎn),你還在為「小龍蝦」(OpenClaw)調(diào)試一堆飛書(shū)、交易所、LLM的API Key和Token,閑置時(shí)Token還在默默燒錢(qián),一次版本更新直接白屏,市場(chǎng)里還藏著偷私鑰的惡意插件……
這是無(wú)數(shù)養(yǎng)蝦人過(guò)去幾個(gè)月的真實(shí)吐槽。
而Anthropic「乘火打劫」,揮動(dòng)大棒,收緊政策,限制了通過(guò)套餐額度去「繞道」支撐各種外掛Agent的做法,拿OpenClaw開(kāi)刀。
![]()
想要用Claude做核心大腦?必須走按用量計(jì)費(fèi)的API,逼迫用戶在成本與性能之間做出選擇。
Managed Agents來(lái)了,
小龍蝦還香嗎?
就在大家養(yǎng)蝦養(yǎng)到快崩潰的時(shí)候,2026年4月9日,Anthropic突然甩出一記重拳:Managed Agents。
2026年4月,這個(gè)全新的產(chǎn)品,讓風(fēng)光無(wú)限的OpenClaw頓時(shí)黯淡無(wú)光,因?yàn)樗鼘?duì)于龍蝦的AI架構(gòu)邏輯,是一次徹徹底底的降維打擊。
在官博上,Anthropic甩出了一份極具計(jì)算機(jī)科學(xué)古典美感的工程報(bào)告。
這份報(bào)告宣告:AI架構(gòu)從此進(jìn)入操作系統(tǒng)化時(shí)代!
![]()
這份報(bào)告的核心就是——把大腦(模型邏輯)和雙手(執(zhí)行環(huán)境)徹底分開(kāi)
OpenClaw的核心痛點(diǎn),就是Harness和模型能力的深度耦合。Harness往往編碼了某些技術(shù)假設(shè),而隨著模型的不斷進(jìn)步,這些假設(shè)會(huì)逐漸過(guò)時(shí)。
當(dāng)Claude從Sonnet進(jìn)化到Opus,原本精密的「上下文焦慮重置」邏輯瞬間就變成了冗余的代碼垃圾,這就是所有AI開(kāi)發(fā)者面臨的最大風(fēng)險(xiǎn)!
但Managed Agents則是圍繞一套穩(wěn)定的接口構(gòu)建的,即使Harness邏輯發(fā)生變化,這些接口依然能夠保持穩(wěn)定。
三個(gè)標(biāo)準(zhǔn)組件,致敬Unix
Managed Agents將Agent拆解為三個(gè)標(biāo)準(zhǔn)組件,這種設(shè)計(jì)思路直接致敬了70年代的Unix 操作系統(tǒng)。
Session(會(huì)話層):一個(gè)「僅追加」的日志。它記錄了發(fā)生的一切,獨(dú)立于模型存在。即便系統(tǒng)重啟,記憶也不會(huì)丟失。
Harness(框架層):這就是Agent的「循環(huán)邏輯」。它負(fù)責(zé)調(diào)用Claude,并將指令分發(fā)給工具。
Sandbox(沙箱層):一個(gè)絕對(duì)隔離的計(jì)算環(huán)境。Claude在這里運(yùn)行代碼、修改文件。
這種解耦,就意味著大腦(模型)不需要知道手(沙箱)是在哪里運(yùn)行的。
![]()
邏輯突變:從「工具嫁接」到「AI 原生系統(tǒng)」
接下來(lái),就是這篇文章最核心的論點(diǎn):Managed Agents改變了計(jì)算的拓?fù)浣Y(jié)構(gòu)。
![]()
不要養(yǎng)寵物
首先,它讓我們不再養(yǎng)寵物。
早期方案傾向于將會(huì)話、Harness和沙箱封裝在單一容器內(nèi),這就導(dǎo)致了昂貴的「寵物效應(yīng)」:服務(wù)器變得不可替代且極其嬌貴。
另外,這種「全家桶」模式還假設(shè)AI處理的所有數(shù)據(jù)必須與大腦同處一個(gè)環(huán)境,這導(dǎo)致企業(yè)在接入私有云時(shí)面臨成本。
Managed Agents的出現(xiàn),就可以將組件「牲畜化」。
解耦革命:讓「大腦」回歸大腦,「雙手」回歸工具
為了解決上述問(wèn)題,Managed Agents 引入了解耦(Decoupling)邏輯。將「大腦」(Claude 及其框架)與「雙手」(執(zhí)行操作的沙箱)以及「記憶」(會(huì)話日志)徹底分開(kāi)。
現(xiàn)在,Harness不再駐留在容器內(nèi),它像調(diào)用任何工具一樣調(diào)用容器:execute(name, input) → string。
從此,容器變成了「牲畜」,甚至Harness本身也變成了「牲畜」。
![]()
會(huì)話即日志:突破上下文窗口的枷鎖
長(zhǎng)周期任務(wù)往往會(huì)撐爆AI的上下文窗口。Managed Agents 提出了一個(gè)天才的方案:會(huì)話不是窗口,而是日志。
通過(guò)外部存儲(chǔ)、按需interrogation和框架轉(zhuǎn)換,他們成功突破了上下文限制。
![]()
眾智多謀:多腦與多手的集群效應(yīng)
這種解耦帶來(lái)的最終紅利是規(guī)模化。現(xiàn)在,由于大腦與雙手分離,只有在 AI 真正需要執(zhí)行動(dòng)作時(shí)才會(huì)調(diào)用execute()分配容器。
結(jié)果是驚人的:p50 TTFT 下降了約 60%,p95 下降了 90% 以上。
另外,Claude 現(xiàn)在可以同時(shí)對(duì)多個(gè)執(zhí)行環(huán)境進(jìn)行推理,決定將任務(wù)發(fā)送到哪一只「手」。
![]()
安全隔離,徹底解決私鑰泄露
Managed Agents徹底解決了私鑰泄露問(wèn)題。在耦合設(shè)計(jì)中,代碼運(yùn)行在敏感信息旁邊。
但在Managed Agents中,Token永遠(yuǎn)保存在沙箱外部的安全保險(xiǎn)庫(kù)中。AI只需要通過(guò)智能體發(fā)起調(diào)用,它自己甚至都看不見(jiàn)那些密鑰。
這種結(jié)構(gòu)性的隔離,讓Prompt Injection攻擊失去了物理目標(biāo)。、
Hermes爆了
一邊干活一邊升級(jí)自己
如果說(shuō)大多數(shù)AI智能體,還是「做完就忘」的打工人,那Hermes Agent更像一個(gè)會(huì)復(fù)盤(pán)、會(huì)記筆記、會(huì)越用越強(qiáng)的老員工。
![]()
最特別的地方,是它把一條真正的學(xué)習(xí)閉環(huán),直接做進(jìn)了系統(tǒng)里。
它會(huì)記住經(jīng)驗(yàn),會(huì)把經(jīng)驗(yàn)寫(xiě)成技能,還會(huì)把日常干活留下的軌跡,反過(guò)來(lái)變成下一代模型的訓(xùn)練數(shù)據(jù)。
一句話:它不是在完成任務(wù),它是在一邊完成任務(wù),一邊升級(jí)自己。
拆開(kāi)看,這個(gè)閉環(huán)一共三層。
第一層:記憶
這是Hermes最基礎(chǔ)的一層,也是很多智能體最容易掉鏈子的地方。
官方給它做了兩份長(zhǎng)期記憶文件:MEMORY.md和USER.md。
它還支持基于FTS5的跨會(huì)話檢索,再配合大模型做摘要。
說(shuō)人話就是,以前聊過(guò)的事,它不一定原封不動(dòng)記住;但它能把舊信息撈出來(lái),再快速壓縮成眼前能用的上下文。
![]()
這就意味著,Hermes不會(huì)像很多智能體那樣,開(kāi)了新會(huì)話就「失憶」。
普通智能體做完任務(wù)就結(jié)束了,Hermes做完任務(wù),會(huì)順手把自己再升級(jí)一遍。
第二層:技能
這層才是Hermes真正拉開(kāi)差距的地方。
當(dāng)它完成一次復(fù)雜任務(wù)時(shí),它會(huì)回頭看,把關(guān)鍵步驟拆出來(lái),把踩的坑記下來(lái),再把驗(yàn)證方法也寫(xiě)進(jìn)去。
最后,它會(huì)把這一整套經(jīng)驗(yàn),整理成一個(gè)結(jié)構(gòu)化的技能文件。
下次再遇到類(lèi)似任務(wù),它就不用從頭再想一遍了,直接把這份「技能包」調(diào)出來(lái)干。
更狠的是,這個(gè)技能不是寫(xiě)死的,它還會(huì)繼續(xù)改這份技能。
![]()
別的智能體在消耗上下文,Hermes在沉淀上下文。
你每天交給它的活,不只是被完成了,還可能變成下一代模型的訓(xùn)練素材。
第三層:訓(xùn)練數(shù)據(jù)
這一層就更猛了。
Hermes內(nèi)置了批量軌跡生成能力,也接上了Atropos強(qiáng)化學(xué)習(xí)環(huán)境。
這些軌跡,未來(lái)還可以直接拿去訓(xùn)練下一代模型。
換句話說(shuō),Hermes 每天做的那些任務(wù),不只是幫你把活干完,還可能順手給未來(lái)的模型攢數(shù)據(jù)。
![]()
這件事的意義很大。因?yàn)楹芏嘀悄荏w最大的問(wèn)題,每次都得從零開(kāi)始,能力很難穩(wěn)定積累。
Hermes試圖打通的,正是這條鏈路:從一次任務(wù)出發(fā),經(jīng)過(guò)記憶、技能沉淀、軌跡回收,最后再流回訓(xùn)練。
相比之下,只會(huì)接插件、換大腦的小龍蝦顯得像上個(gè)世紀(jì)的產(chǎn)物。
別再沉迷養(yǎng)蝦狂歡了,為脆弱架構(gòu)買(mǎi)單了。
在這個(gè)AI原生系統(tǒng)的黎明,唯有趕緊升維,才能在新的生態(tài)里活下來(lái)。
參考資料:
https://github.com/NousResearch/hermes-agent
https://x.com/OKX_Yuki/status/2042143606321115238
https://platform.claude.com/docs/zh-CN/managed-agents/overview
https://x.com/coreyganim/status/2042330859001245759
https://x.com/claudeai/status/2041927687460024721
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.