P人的工作狀態是這樣的,你很難講此時此刻我真正在做什么。
一段時間,可能是各個平臺翻選題,過一會兒沒準是開始看看今天開盤之后哪些行業熱點來了可以追一追,又或者是把幾天前定好的選題完成,AI確實是P人友好型工作輔助。
我自己以往的工作流是Claude co-work+kimi雙開,基本可以滿足我除了手搓稿件以外的所有工作需求。互相核實信源、補盲,這個流程已經持續幾個月了,直到......我也被Claude封號了。
![]()
今天已經是被封號的第五天,我的產出效率直線下降。
除了手工搓稿以外,我幾乎用AI搭建了之前所有的工作流,現在完全卡住,空虛,十分空虛。只能每天打開郵箱看看Claude的封號有沒有可能申訴成功。
P人的執念是這樣的:工具不順手,活兒就一定要拖。磨刀,是不誤砍柴工的。
但是活兒還是要干的,恰好趕上了Kimi推出的Kimi work桌面端,有分頭并行的工作模式。
或許申訴Claude賬號的事情,可以先放一放?
然Vibe,但我還得work
AI當然能給現在的工作提效。但chatbot的那種提效,是單維度的、易推翻的、不可靠的。
道理不復雜。一來一回的交互,中間模型怎么推理你看不見,是個黑箱;串行的工作流里,任何一步出岔子,上一步都得推倒重來。結果就是上下文長,交互麻煩。
想真正把工作vibe起來,得先把維度立起來:第一步是agent——盯著目標、自己調工具;第二步是多agent——有東西在中間統籌流程、讓它們并行干活。
Kimi管這個叫「Agent集群」,從今年1月的K2.5起就有,一次最多能拉起上百個分身。
拿我自己的行業來說,一條像樣的內容,背后是好幾條工作流:多平臺扒選題、收資料、核信源、列提綱,最后才輪到落筆。純手搓的年代不提了,尤其做現在科技和AI選題,單收集消息,就已經耗掉大半精力,更別說挨個核實信源真假、把零散的事串成一條線。前面這些備齊了,寫本身并不是難事。
這也是我為啥Cluade倒了之后很空虛,因為找選題這種高重復度低刺激感的工作又重新回到我自己頭上了。
我把以前Claude用的skill調整之后平移過來,開始跑選題。它打開我登錄態下的幾個信源,同時派出幾個分身并行去扒,最后收斂回一摞提綱級別的選題。
![]()
有點尷尬的是,我的X賬號死活沒能在它的web工具里登上,這一塊搜集就卡住了;好在小紅書、和其他科技類熱點網站都完成了搜索。不過后面配合webbridge去抓X上的消息,就很順利了。順帶一提,Codex配合瀏覽器端的Kimi webbridge效果也不錯,貌似其他模型有可以直接調用Webbridge。
這個任務其實是個復合動作:跨平臺搜信息——判斷每個選題的價值和時效、篩掉不能用的——再把能用的寫成提綱。每個分身負責一段專業活,而段與段之間,還得有一個統籌的agent把信息接住,整件事才算真做完。
選題和提綱只是上半場,東西做出來,還得交到團隊手里——我的活兒到這一步,比如每天選題的日報、以及熱點信息的分析,一定要落成Word、PPT這類能直接傳給同事的文件。
![]()
Kimi這版正好把這一截補上了:一次自主運行,文檔、表格、網頁、幻燈片整套吐出來,要哪種形態給哪種。展示路徑之后,可以直接跟Kimi對話說“打開文檔所在的文件夾”,就不必根據路徑去翻文件了。(文件管理災難者福音)
換個場景也是一樣的邏輯。一份研報大綱扔進去,數據拉取、建模、排版、撰寫幾個分身分頭并行,最后研報PDF、財務測算Excel、匯報PPT一次交齊——對我這種工作中隨時還要看看盤的人來說,省掉的正是來回導數據、套模板那些最磨人的環節。
![]()
我讓Kimi通過同花順數據庫跑了一下AI各個板塊的估值位置,大概看了一下。
直接調取數據庫是一個很方便的能力,之前我擺弄過用API接入Wind,但是最后因為接口太貴確實沒舍得持續用。Kimi配合同花順數據庫基本可以做到當日的數據調取,并且配合多agent模式可以直接生成多個數據口徑的直接對比,顯示效果非常直觀。
![]()
這樣的金融數據庫調用+多agents并行工作的模式,可以實現多維度、多公司的一個高效數據分析模式,其實也可以前期在做公司分析的時候避免數據口徑的問題并且節省大筆時間。
更重要的是,自己快速實現財務數據分析可以避免被各種投研機構的報告牽著鼻子走,形成屬于自己的獨立判斷,形成比較獨特的視角,這對媒體人來說,是一個非常有效的視角增量。
產出的內容我是滿意的,但是當我讓Kimi把報告轉成PDF的時候,這個巨大的底部留白屬實有點無語,希望Kimi的朋友們千萬看看這點。
![]()
免責聲明:只做財務分析,工作絕不炒股!說到這里,我從年初開始埋伏的某只光纜概念翻三倍了,但我在4月就清倉了,誰來給我兩拳。
![]()
經歷了這么一系列實測,我發現,所謂「300個分身」其實也不可能是300個agent同時跑,主要是根據不同場景切換不同的skill配合工具實現在該領域比較專業的工作處理效果。所以這個數字很嚇人,但實際使用的時候肯定沒法次次做到。
但這其實提供了一種有效的思路,讓專用agent通過集群調度最終完成整個項目,遠比一個agent從頭走到黑效果好得多。
我們常說:把專業的事情交給專業的人做。以后可能就是:把專業的事情交給專業的agent去做。
的通用Agent必須來自模型公司?
其實Agent這個事兒現在已經不新鮮了,把模型接進一套工具里,給它瀏覽器、給它文件系統、讓它能聯網,一堆中轉站玩的明明白白。如果只是輕度使用AI,可能幾乎感受不到原生與第三方的區別。
龍蝦熱已經快速消散,后繼者Hermes現在也鮮有聲量。大家在用三方Harness配合模型的時候一定會出現各種問題,比如上下文實際上很短,總有些功能實現不到,說白了,這就是模型與harness的兼容性問題。而解法其實也很簡單,模型廠商自己下場做腳手架。
Codex是一個非常典型的案例,它是龍蝦創始人奧地利程序員彼得·斯坦伯格加入OpenAI后的產物。當模型和harness都是自己人在做的時候,封裝好的產品注定效果更好。
Claude其實做的也是同樣的事情,只是他們選擇從API層面直接禁止龍蝦接入,然后推自己的Claude code和Claude work。倒不是Claude擔心龍蝦會搶走屬于自己的份額,而是三方智能體的不兼容性,天生就導致模型的token消耗增加,上下文能力下降,長久開放,大家只會罵Claude模型,畢竟用戶不能聲討一個免費的龍蝦,但會大罵自己交了昂貴月費的Claude。
這也是為什么模型大廠幾乎都在走同樣的路:OpenAI的Codex、Claude的Cowork、Kimi的Work+agent集群。
而當編程能力溢出之后,Co-work+agents就成為一個模型廠商合理的發展方向。
廠商們已經花了大價錢練出來的本事,如果只停留在技術能力層面,多少有點浪費。而GUI和CLI配合適當的工具,就把人們更高效使用AI的門檻打了下去。如果說CLI對普通人來說還有些困難,那么GUI則幾乎把學習成本降到了0。代價嘛,無非就是廠商們確實需要做更多工具,需要多花一些token。
而好處就在于,一旦它在代碼上跨過“真能干活”那條線,模型能產生的價值就實現了破圈。從技術專業工作者,一下擴散到知識工作領域了。
而這身本事是長在模型里的。誰訓的模型,誰才最清楚它的腳手架該往哪搭、哪兒使得上勁、哪兒容易掉鏈子。這步棋,到頭來還是模型公司自己走得最穩。
最好的通用Agent,注定長在模型公司自己身上。
Vibe Working或許近在眼前
前兩天,OpenAI自己發了份報告說:Codex早就不只是個"寫代碼的AI"了。按它給的數字,Codex周活已經到了幾百萬的量級,桌面版上線之后數據漲得很猛,而影響最大的那批人并不是程序員,而是做報告、做表、做研究的知識工作者,他們的占比已經上到20%。
這說明,適當的工具,完全可以擴展模型的邊界。
想起之前看到的一條內容:有人問AI,哪些行業受到AI的影響比較大,大多數模型答的都是辦公室白領那一套,只有DeepSeek沒按套路出牌,它的回答是水電工、裝修工——這些活又重復又流程化,本來就是AI的主場,缺的不過是一件趁手的家伙。加入具身智能作為工具,這些工作甚至會更早受到影響。
![]()
圖像由AI生成
而對于泛知識類的工作環境,這樣的變化其實已經發生了:以前做一套跨平臺的估值分析,得花大價錢接Wind、還不一定跑得通;現在同花順數據庫至少能完成,雖然效果還有待加強;過去得一個資深專家帶一整支執行團隊才交得出的東西——一份研報、一套模型、一摞匯報材料——如今一個人領著一屋子分身,一下午也能湊齊。環境和工具都ready了,全流程的vibe working,可能真就在眼前。
工具一就位,就產生了另一個問題。當誰都能拉起一支隊伍、誰都能一口氣吐出整套企業級的東西,“做得出來”就不再是門檻了。那時候值錢的,是你知道自己要什么,說白了,是一種“工作審美”。分身能替你干活,替不了你拍板。完成的所有案頭內容,最終肯定還需要一個“我”來拍板。
封號第五天,我沒把Claude等回來。但那臺一直亮著、替我連夜把選題扒完的電腦,讓我品出點別的味道:工具斷了可以再換,真正變了的,是我開始習慣把活兒撒出去,自己只盯著最后那個結果。
那個一個人對著屏幕死磕的我,好像也不太需要了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.