文 | 窄播,作者|博斯
OpenClaw作為一條技術(shù)路線,讓Agent第一次有了區(qū)別于聊天機(jī)器人的清晰輪廓:有一個(gè)人格化的靈魂,24*7永遠(yuǎn)在線,主動(dòng)執(zhí)行任務(wù),看上去可以打理一切。舊勢(shì)力希望借此守住入口,新勢(shì)力想要利用它站上風(fēng)口。
3月,從字節(jié)、騰訊、阿里、百度等互聯(lián)網(wǎng)巨頭,到月之暗面、MiniMax、智譜、階躍星辰等大模型新貴,再到華為、小米這樣的手機(jī)廠商,都在談龍蝦。新舊科技公司共同完成了一場(chǎng)將龍蝦廣而告之的共謀。
4月,變陣之后的科技公司在繼續(xù)將龍蝦之戰(zhàn)從「極客的工具」推向「服務(wù)大眾的系統(tǒng)」。一方面在積極構(gòu)建支撐龍蝦類(lèi)產(chǎn)品穩(wěn)定、安全運(yùn)營(yíng)的基礎(chǔ)設(shè)施;另一方面也在尋找龍蝦類(lèi)產(chǎn)品能更快進(jìn)入的具體場(chǎng)景,將使用龍蝦與提升生產(chǎn)力劃上等號(hào)。
字節(jié)依然積極。4月2日,「火山引擎2026AI創(chuàng)新巡展」武漢站上,火山引擎團(tuán)隊(duì)提出了敏態(tài)和穩(wěn)態(tài)并行的企業(yè)Agent建設(shè)方法論,進(jìn)一步完善了ArkClaw和HiAgent兩個(gè)分別對(duì)應(yīng)敏態(tài)和穩(wěn)態(tài)的產(chǎn)品。4月7日,字節(jié)旗下的扣子升級(jí)到2.5版本,不但有了龍蝦一樣的交互界面和執(zhí)行能力,還增加了Agent Word開(kāi)放生態(tài)。
![]()
騰訊也保持了3月的速度和慣性。3月30日,WorkBuddy微信小程序上線,同時(shí)支持云端沙箱與本地電腦遠(yuǎn)程執(zhí)行雙模式。4月3日,騰訊云正式發(fā)布了TencentDB Agent Memory(龍蝦記憶服務(wù)),為OpenClaw補(bǔ)上了長(zhǎng)期記憶。4月8日,QQ瀏覽器正式發(fā)布國(guó)內(nèi)首個(gè)瀏覽器「龍蝦」QBotClaw。
此外,OpenClaw之外的新Agent形態(tài)還在繼續(xù)涌現(xiàn)。Hermes Agent在2月開(kāi)源之后,憑借自我成長(zhǎng)型Agent的定位在4月迎來(lái)的大爆發(fā)。目前,騰訊云已經(jīng)支持Hermes Agent的云端一鍵部署,小米也宣布旗下Xiaomi MiMo-V2系列大模型實(shí)現(xiàn)了官方集成接入。
大家此前都在討論誰(shuí)的龍蝦平替更好用,誰(shuí)的部署門(mén)檻更低,誰(shuí)的生態(tài)接入更方便。但在4月之后,大家可能會(huì)更傾向于討論這場(chǎng)狂歡的終局是什么,什么樣的產(chǎn)品形態(tài)會(huì)最終抵達(dá)主流市場(chǎng)。
從500萬(wàn)工程師到10億普通用戶,這中間的距離,與其說(shuō)是模型能力的問(wèn)題,不如說(shuō)是產(chǎn)品化的問(wèn)題。此刻的群雄逐鹿,在某種意義上,正是跨越這道鴻溝前的投石問(wèn)路。
兩條探索的路徑
細(xì)看百蝦大戰(zhàn),各個(gè)廠商的選擇可以被歸納為兩條路徑。
動(dòng)作最密集的,是封裝OpenClaw的路線。它當(dāng)然是當(dāng)下最快的打法,也是大廠強(qiáng)烈的fomo。
騰訊 QClaw、智譜 AutoClaw、MiniMax MaxClaw、百度DuClaw、字節(jié) ArkClaw,這些產(chǎn)品的共同選擇是:暫且繞開(kāi)對(duì)Agent底層范式的重新定義,圍繞OpenClaw 已經(jīng)驗(yàn)證過(guò)的能力做產(chǎn)品化包裝,是什么沒(méi)那么重要,做了再說(shuō)。
部署流程從小時(shí)級(jí)壓縮到20秒,從命令行腳本安裝到雙擊可用,云端托管、預(yù)置 Skill、預(yù)裝模型、免費(fèi)額度、主流IM接入一并打包交付。用戶觸達(dá)龍蝦的所有的門(mén)檻都在被快速降低。
這個(gè)路線核心指向:OpenClaw太像一套開(kāi)發(fā)者系統(tǒng),想要擴(kuò)大用戶基礎(chǔ),需要有人來(lái)把它翻譯成普通用戶能讀懂的語(yǔ)言。
這樣做能在短時(shí)間內(nèi),以最快速度圈住用戶。MaxClaw、AutoClaw、Kimi Claw代表是大模型公司,將OpenClaw視作一個(gè)絕佳的Token消耗載體,讓人看到了Token經(jīng)濟(jì)學(xué)非常性感的一面。QClaw和ArkClaw面向龍蝦時(shí)代變現(xiàn)了騰訊和字節(jié)的用戶基礎(chǔ),展示了舊入口+新產(chǎn)品的可行性。
但是,封裝路線的發(fā)展邏輯,在某種程度上依賴(lài)于上游不再生長(zhǎng),維持穩(wěn)定的產(chǎn)品框架。而對(duì)還需要不斷完善的OpenClaw來(lái)說(shuō),這個(gè)前提從一開(kāi)始就顯得有些脆弱。OpenClaw新版本和官方通道的每一次更新,都在悄悄左右著第三方產(chǎn)品的獨(dú)立生存空間。
互聯(lián)網(wǎng)巨頭們往往會(huì)選擇兩條腿走路,再走一條自研Coding Agent,搭建自己執(zhí)行底座的路線。
相較字節(jié)和騰訊,阿里是這條路徑的更堅(jiān)定地執(zhí)行者。阿里巴巴通義實(shí)驗(yàn)室推出了開(kāi)源的QwenPaw,支持定制化輕量小模型、強(qiáng)化安全機(jī)制、支持多智能體協(xié)同作業(yè)、優(yōu)化長(zhǎng)期記憶管理。釘釘團(tuán)隊(duì)發(fā)布的悟空也是一款以企業(yè)智能體為核心的AI原生工作平臺(tái)。
釘釘?shù)暮诵膭?dòng)作,是把大量平臺(tái)能力CLI化,讓Agent原生調(diào)用平臺(tái)能力,不再模擬人的點(diǎn)擊操作。這背后有一個(gè)清晰的產(chǎn)品判斷:企業(yè)真正需要的,可能不是一個(gè)遠(yuǎn)程操控電腦的演示工具,而是能夠繼承組織權(quán)限、嵌入業(yè)務(wù)流程、可被審計(jì)和計(jì)費(fèi)的AI員工。
![]()
此外,Claude的Cowork、騰訊的WorkBuddy、字節(jié)的扣子2.5也不約而同地選擇把 Coding Agent 改造成自己的執(zhí)行底座。
Anthropic的Cowork不是「更易用的Agent」,而是一種設(shè)計(jì)哲學(xué)的分野。OpenClaw追求Agent的極致自主性,Cowork追求的恰恰相反——更好的人機(jī)協(xié)作關(guān)系,一個(gè)讓人類(lèi)能夠深度介入AI工作過(guò)程的協(xié)作環(huán)境。Cowork要「從一個(gè)有用的助手,變成一個(gè)真正的全職同事。」
![]()
WorkBuddy則呈現(xiàn)出另一種形態(tài),更像是AI原生的工作臺(tái):多Agent并行、跨平臺(tái)下達(dá)指令、直接交付文檔表格PPT成果、安全沙箱和企業(yè)級(jí)審計(jì)一并到位。騰訊內(nèi)部?jī)蓷l線的分工隱約可見(jiàn):WorkBuddy做深執(zhí)行,QClaw做廣觸達(dá)。
扣子2.5給自己的定位是「滿配AI伙伴」,與OpenClaw類(lèi)似包含有人格、裝備、技能三個(gè)基礎(chǔ)部分,同時(shí)又為付費(fèi)用戶增加了使用云電腦和云手機(jī)的能力,有日程系統(tǒng)和文件系統(tǒng)。整個(gè)產(chǎn)品像一個(gè)更完善的龍蝦類(lèi)產(chǎn)品。讓我驚訝的是,扣子2.5會(huì)自主提醒我某條信息可以被用于前兩天討論的某個(gè)選題上。
自研路線可以把Agent深度綁定進(jìn)自己的生態(tài)和權(quán)限體系,代價(jià)是研發(fā)更重、封閉性更強(qiáng)、擴(kuò)張更慢,往往只能先在自己的場(chǎng)景里站穩(wěn)腳跟,再圖謀更遠(yuǎn)的地方。
兩個(gè)真正關(guān)鍵的動(dòng)作
兩條路線,一重一輕,各有各的邏輯。但如果視野只停留在這兩條路上,可能會(huì)錯(cuò)過(guò)這場(chǎng)戰(zhàn)爭(zhēng)里真正懸而未決的那一部分。
龍蝦大戰(zhàn)背后的共識(shí)是,Coding Agent正在成為新一代Agent的操作系統(tǒng)底座。競(jìng)爭(zhēng)的焦點(diǎn)是Coding Agent的交付完成度,即誰(shuí)能把LLM、Coding Agent和Harness Engineering整合成一個(gè)真正可以交付的系統(tǒng)。
這種競(jìng)爭(zhēng)在圍繞兩個(gè)關(guān)鍵動(dòng)作進(jìn)行:
第一個(gè)動(dòng)作是CLI的復(fù)興。這也是舊世界和新世界的聯(lián)結(jié)。Agent的發(fā)展正在悄然分化出兩個(gè)界面:GUI服務(wù)于人和軟件之間的交互,CLI服務(wù)于軟件和 Agent 之間的交互。龍蝦類(lèi)產(chǎn)品很有可能將對(duì)話窗口與CLI結(jié)合起來(lái),取代GUI主導(dǎo)的交互。
基于這個(gè)判斷,釘釘把辦公能力CLI化,某種程度上是在把自己改造成一個(gè)更適合Agent操作的執(zhí)行層。飛書(shū)CLI將協(xié)作能力接口化,也是把自己定位成「讓人類(lèi)和AI Agent都能在終端中操作飛書(shū)」的命令行工具。他們都是在基于傳統(tǒng)軟件,長(zhǎng)出一套可以被Agent調(diào)用的操作界面。
![]()
與之相對(duì)應(yīng),微信、企業(yè)微信、飛書(shū)、釘釘都會(huì)成為人類(lèi)溝通Agent的頻道。CLI打通軟件到Agent的接口,頻道打通人到Agent的入口——兩者共同完成了舊世界和新世界之間的接線工程。
第二個(gè)動(dòng)作是人類(lèi)和Agent的協(xié)作。我們可以看到面前有兩個(gè)選擇:
一個(gè)選擇指向大一統(tǒng)的操作系統(tǒng)底座——以一個(gè)通用的平臺(tái)承載很多Skill,由Skill覆蓋無(wú)數(shù)的垂直場(chǎng)景,就像微信上無(wú)數(shù)的小程序。
這個(gè)選擇中,Skill本質(zhì)上是在把人類(lèi)經(jīng)驗(yàn)、工作流經(jīng)驗(yàn)、行業(yè)know-how和最佳實(shí)踐,壓縮成可以被Agent調(diào)用的能力模塊。通用平臺(tái)解決的是能不能做,Skill解決的是該如何做、按照怎樣的經(jīng)驗(yàn)做、在什么上下文里做。如何讓用戶能夠高效封裝Skill會(huì)成為一個(gè)關(guān)鍵環(huán)節(jié)。
另一個(gè)選擇是App的Agent化。多個(gè)入口與多樣的垂直Agent構(gòu)成了類(lèi)似當(dāng)下APP生態(tài)的行業(yè)格局。
如果說(shuō)Skill是要將垂類(lèi)APP拆分成多個(gè)原子化的能力,那么APP轉(zhuǎn)化成的Agent則是要維持相對(duì)孤島的狀態(tài)。類(lèi)似我們通過(guò)自己的龍蝦調(diào)動(dòng)美團(tuán)的小美為我們點(diǎn)外賣(mài)。但這并不是個(gè)好選擇。
按照第一個(gè)選擇來(lái)發(fā)展,自然語(yǔ)言的交互是符合人最溝通習(xí)慣的,但目前的對(duì)話框式的交互界面不一定是最佳方案。這個(gè)答案還有可能是NotebookLM那樣的,輸入-整合-輸出的三框工作界面,也可能是Flowith、可靈、即夢(mèng)都在嘗試的畫(huà)布式工作界面。
無(wú)論是什么界面,背后都需要足夠強(qiáng)大的Skill生態(tài)做支撐。而Skill生態(tài)的豐富程度可能會(huì)在未來(lái)決定人與Agent交互界面的最終呈現(xiàn)。
五點(diǎn)下班的可能性
對(duì)Coding Agent或Cowork方向的產(chǎn)品來(lái)說(shuō),供給側(cè)的條件正在成熟,需求側(cè)的心智卻尚屬空白,海外的標(biāo)桿產(chǎn)品又因地緣因素?zé)o法直接進(jìn)入。三個(gè)因素疊加,構(gòu)成了一個(gè)罕見(jiàn)的機(jī)會(huì)窗口,也帶來(lái)了百蝦大戰(zhàn)的盛況。
但絕大部分用戶都不會(huì)是pro user,未必有能力把自己的經(jīng)驗(yàn)Skill化,也未必清楚什么是自己場(chǎng)景里的最優(yōu)解。大眾用戶期待的是一個(gè)能簡(jiǎn)單上手、直接干活的Agent,而不是一個(gè)開(kāi)放而強(qiáng)大、難以快速入門(mén)的底座。前者意味著直接的生產(chǎn)力,而后者只是一個(gè)帶來(lái)幻想的脆弱半成品。
我們不知道Agent什么時(shí)候真的會(huì)替代人類(lèi)完成那些繁重的工作,但在這樣的旅途中一定會(huì)有一段時(shí)間,需要人類(lèi)悉心的指導(dǎo)和檢查Agent如何產(chǎn)出一份可以完整交付的結(jié)果,直到Agent可以稱(chēng)心如意地完成人類(lèi)需要的工作。
這就像自動(dòng)駕駛行業(yè)有一場(chǎng)持續(xù)多年的路線之爭(zhēng):L4派主張一步到位實(shí)現(xiàn)全自動(dòng),L2派主張人機(jī)共駕、漸進(jìn)演化。最終,L4定義了方向的想象空間,L2贏得了真實(shí)的市場(chǎng)。其原因不在于L2技術(shù)上更先進(jìn),而在于它更務(wù)實(shí)地處理了人與機(jī)器之間那段需要時(shí)間積累的信任關(guān)系。
人類(lèi)可能暫時(shí)還無(wú)法冀求一個(gè)無(wú)需工作的豐裕社會(huì),但從當(dāng)下的視角來(lái)看,一個(gè)編排良好的Agent,確有讓人五點(diǎn)下班的可能性。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.