從去年年底開始,越來越多的人,開始研究“多Agent協作”。
2025年,Google推出A2A協議,讓不同Agent用一套語言溝通。Anthropic的研究表示,多AI智能體團隊,在復雜任務上的表現,較單體實現了90.2%的提升。2026年,OpenAI也發布了Symphony,用于編排Agent工作流。
我非常關注這件事。為此,還手搓了一個粗糙的AI系統,讓AI主筆、AI研究員、AI編輯“吵架”,給內容團隊寫研究報告。
而最近,騰訊也在AI軟件WorkBuddy里,上線了“專家團”功能,通過多Agent協作完成復雜任務。于是,聽到消息,我也抓緊體驗了一下。體驗之后,感受非常強烈:
“個體崛起”的時代,可能真的要來了。
為什么?這得從一個詞開始說起:馬具工程(Harness Engineering)。
01
馬具工程:給AI這匹烈馬,套上組織的韁繩
什么是馬具工程?
從2023年開始,AI公司在發布大模型時,最先強調的永遠是:參數多少,跑分多少。大家比的,是誰家模型更聰明。就像比誰家的馬更強壯。
可有個問題,始終沒有解決:這匹馬,野性難馴。
具體來說,就是:它會不可避免地出現幻覺。
幻覺,就是一本正經地胡說八道。你問它論文出處,它可能會給你作者名、年份、期刊,但你真去查,會發現根本不存在。
為什么?
因為大模型的底層機制,是通過概率,猜下一個詞。這是統計意義的智能,而非人類意義的理解。這種機制,就必然帶來幻覺。而幻覺最可怕的,不是“錯了”,是“錯了,但自信”。以至于問它10次,它可能會給你10個信心滿滿的答案。
太嚇人了。所以,想讓它干活,就得讓它更可靠。
怎么辦?很多人想到了:把AI包裝成Agent。
我給它明確身份、明確任務,甚至接上工具權限。然后,讓它做財報分析師,讓它做產品經理,讓它做研究員。總可以了吧?
是,靠譜多了。可新的問題,也出現了。
因為,當規則開始沖突,AI就開始內耗。你要求才華橫溢,它就事實不準。你要求事實為先,它又枯燥無味。最終,交給你一個面面俱到的平庸之作。
怎么辦?問題,其實不在“馬”,而在“馬具”。
一匹好馬,強壯有耐力,但野性難馴。你必須套上馬具,才能駕馭它。今天的AI,就是一匹充滿力量、但野性難馴的烈馬。想讓它真正發揮作用,需要一套:馬具工程。
馬具工程的本質,就是給AI這匹烈馬,套上名為“組織”的韁繩。
這次,WorkBuddy推出的專家團,就是一個很具體的例子。它把原本抽象的方法論,變成了普通人可以直接使用的產品能力。所謂“專家團”,就是把不同分工的Agent,組織起來,解決復雜任務。看圖。
![]()
一個Agent開發軟件,容易邏輯混亂,改動頻繁。讓不同Agent,分別捋清產品,架構,開發,測試,最終,就大概率是一個直接可用的頁面。
![]()
一個Agent處理財報,頁數一多,就容易忽略數據。幾個Agent,分別負責數據,風險,寫報告,準確率就會大幅增加。
而當AI套上馬具,很多之前實現不了的事情,就有了可能。
比如,對有繁雜流程的大公司來說,部門協作可以逐漸自動化。比如,對預算有限的小公司來說,可以擁有隨叫隨到的外包團隊。對于想要自己銷售、產品、交付的“一人公司”,這更是一支“千軍萬馬”。
于是,個體崛起的可能,由此打開。
那怎么才能把“馬具工程”用好?至少包括三個要點:
角色、規則、流程。
02
角色:把任務分開執行,AI才能追求極致
什么是角色?
角色,不只是“職位名稱”,還是一個Agent的能力清單。
比如,主筆Agent的能力清單,是:選題、寫作、潤色。不管風險控制,事實核查。比如,編輯Agent的能力清單,是:審核、把關、修改建議。它不管怎么寫得好,只管怎么不出錯。
為什么要這么干?
因為,要求越多,內耗越重。約束越全,產出越差。
如果你讓一個Agent,同時扮演:才華橫溢的主筆和謹小慎微的編輯。那才華就會和風險沖突,戲說會和嚴謹沖突。面對互相打架的規則,Agent只能產出60分的平庸報告。
那怎么辦?把角色拆開。
讓主筆一開始,就追求極致質量。這樣,初稿就有80分的水準。在編輯身上,就定義好把關的能力,讓文稿不出紅線問題。最終呈現的稿子,既有80分的創造力,也有80分的穩定性。
舉個例子。WorkBuddy里的“內容創作專家團”。
當我給了它一個“創作數碼視頻腳本”的任務,它沒有直接寫測評文案,而是先“組團”,拉起了三個完全不同的Agent。看圖。
![]()
具體,是這么三個角色:
行業產品調研員,平臺內容研究員,人文思考研究員。
行業產品,就只負責市場格局、真實體驗,不用懂B站生態。人文思考,就只負責琢磨“AI眼鏡是科技玩具,還是生活方式入口”一類的問題,不需要查市場數據。
最后,把他們的輸出匯總,讓另一個寫作Agent,整理成了完整的腳本。看圖。
![]()
有意思。它想的很細致,先是行業全景,再是真實體驗,然后逐漸追問,由淺到深,最后還來了個哲學思考。整個邏輯鏈條很順。再稍微修改,就基本可用了。
這就是多Agent協作的厲害之處。它不在于單個Agent多聰明,而在于調用多個Agent,打透專一任務,獲得普通高手水平以上的交付結果。
一個Agent,當然也能研究AI眼鏡,但很容易沿著單一路徑,越想越窄。一旦你優先選“科技硬核”角度,后面就全是參數、芯片、續航。人文那一塊,就不太容易進來了。
借助AI,一個人,第一次有了“像一支團隊思考”的能力。
但角色一多,也會打架。主筆想有沖擊力,編輯想不被讀者質疑。顧問想有創新,風控又想保守。如果都按自己邏輯來,只會浪費大量token。
所以,你還需要設置:規則。
03
規則:確定“把事干對”的標準,AI才能穩定產出
什么是規則?
規則,就是AI做事的標準。比如,什么不能做,什么是好答案。
比如,主筆Agent的規則,可能是:必須有認知差、必須走情緒動線、必須避開雞湯套路。編輯Agent的規則,可能是:引用有出處、數據能追溯。
為什么要這么干?
同樣5個人,在不同的團隊,產出可能天差地別。因為一個團隊,壓根就沒有“好文章”的標準。另一個團隊,對好文章的標準,是:讓人轉發,有認知差,是讀者好奇的話題……
規則,是崗位的標準。有了標準,AI才能保持產出穩定。
舉個例子:WorkBuddy里的“法律咨詢團”。
如果說有什么工種最需要規則,法律一定算一個。因為法律工作的核心,是:基于規則,做專業判斷。法律建議,最怕感覺。感覺這條沒事。感覺對方應該不會真這么干。一旦出了問題,代價巨大。
那,WorkBuddy如何解決法律問題?我試著問它:
我是一家AI落地的小咨詢公司,幫企業把AI接進業務流程。我們最近接了個大單子,對方甩過來份標準合同,你幫我研究研究,要不要簽?
過去,小老板最怕這種時刻。大公司甩來份合同,自己不夠專業看不懂,找律師麻煩。硬著頭皮簽,又怕踩坑。
好。WorkBuddy,很快就開始干活了。
![]()
讓我印象最深刻的,是它干活的“專業”程度。
比如,它不會一上來就告訴你能簽不能簽。它先采集信息。
為什么?因為信息不完整,不能下結論。
于是,負責案情采集的方助理,先定了一個信息清單。你讓我研究合同?行。那我得先搞清楚,付款條款怎么說,知識產權、交付驗收、保密條款……
![]()
接著,它開始花大力氣,研究法律依據。
為什么?因為所有判斷,必須有依據。
我說這條危險,不是因為“我覺得危險”。而是因為它可能對應哪條法規。所以,你就能看到,周法官在吭哧吭哧地挨個查閱具體條款。很多條款,文本只是原則。法院怎么理解怎么判,也很重要。所以,沈判官就發力,找之前的類似判例。
![]()
好了。大概半小時,他們就完成了最終的咨詢報告。
![]()
我點開一看,嚯。挺像那么回事的。而讓我驚喜的是,它并不是簡單地說這條有危險,而是說清楚了,它對我這家小公司為什么危險。
比如,質量保證條款苛刻。這對剛起步的小公司,可能是毀滅性打擊。因為驗收標準模糊,完全由甲方主觀判斷,決定給不給項目款。所以,很有可能活干了,但錢拿不到。
發現沒?
讓AI變專業的,不是模型更聰明,而是規則更清楚。
信息不完整,不能下結論。沒有法律依據,不能亂給建議。看法條不夠,得看現實判例。建議,得對客戶真正有用。這就是規則。
但有了規則,也還不足夠。因為規則,畢竟不會自己執行。如果信息還沒采集完,法條還沒查完,就開始寫最終報告,也會翻車。
所以,光知道“什么叫對”還不夠。你還得知道:誰先干,誰后干。
這就是:流程。
04
流程:讓AI,循環逼近正確答案
什么是流程?
流程,就是把復雜任務拆成接力賽。
因為復雜任務,不是一口氣做完的,本就是一環扣一環。給建議,需要先等信息采集。寫報告,要先等判例研究。沒有流程,大家就會憑猜測開工。前面的信息稍有變化,后面全部推倒重來。
但只是機械交棒,還不夠。因為高質量的產出,核心來自:挑戰。
團隊之所以比單兵更強,不是因為人多。是因為不同的人,會從不同角度不停挑刺。好產品,是產品、研發、測試,多輪溝通修改出來的。好文章,是作者、編輯、研究員,反復推敲潤色出來的。
所以流程,還應該是一張讓AI吵架的路線圖。
好的AI協作系統,不只是安排好“誰先干、誰后干”。還要設計好,誰來挑戰誰。讓不同Agent,用各自最擅長的能力,互相校正,循環往復,才能讓產出逼近高質量。
舉個例子。WorkBuddy里的“軟件開發團隊”。
如果說有什么工作,最依賴流程。軟件開發,一定算一個。
總不能產品經理還沒把需求講明白,工程師已經開始寫代碼。也不能代碼還沒寫完,測試先開始報Bug。這么干的結果,是所有人拼命返工。
于是,我打開聊天框提問:
我是一個AI提效咨詢公司的創業者。每天有很多潛在客戶咨詢,但大量溝通都重復低效。幫我開發個網頁,完成前期客戶篩選和初步溝通。
這是很多小公司和超級個體都頭疼的事:來咨詢的人太多、太雜。有人只想白嫖建議,有人都沒想清楚要解決什么問題。一個個聊下去,真正客戶,反而沒時間交付了。
怎么辦?經過幾次交互,WorkBuddy很快就領會了需求。
它建議,不做展示型官網,而是做一個客戶初篩系統。讓客戶了解服務內容,再通過引導問答,初步判斷他適合什么業務。
![]()
嗯,有道理。那就開始吧。
前邊幾步,中規中矩。產品經理,把業務描述翻成了產品定義。架構師,也拍板了技術方案。工程師,一口氣完成了代碼。
真正讓我感到驚訝的,是接下來這步:它居然自己找出了Bug。
工程師寫完代碼之后,測試工程師,居然真的發現了問題。推薦算法,在最后一個對話節點出錯,推薦異常。看圖。
![]()
找出來之后,還沒完。測試把流程打回,工程師重新上線,修復Bug,再交給測試驗收。最后給到我的,是已經Debug完成的代碼。
這就是流程。流程,是一條讓AI團隊循環工作,從而逼近正確答案的路徑。
![]()
所以,它最終交給我的,不是一個粗糙的、點開就運行失敗的Demo,而是一個真的可以跑的MVP。整個頁面打開,大概長這樣。
![]()
而當你點擊免費咨詢,它就真的會跳轉對話。只需要引導,做一些選擇,你就能快速完成這次售前咨詢。
![]()
真不錯。一個非技術背景的小老板,可能就這樣,真的拿到了一個可以上線的售前網站。
過去,你想把一個業務想法變成產品。哪怕有AI幫忙,你至少也得學一點AI編程。但今天,這層門檻,可能也開始消失了。
我不由得感慨,這個世界,變化實在太快。
因為前段時間,我還說:拉開AI編程應用差距的,是你的Debug能力。但到了今天,初級Bug,可能已經不會出現到你面前了。
最后的話
過去兩年,很多人一直講:AI會重塑很多行業。
但坦白說,這對大多數普通創業者、普通管理者、普通職場人來說,基本沒什么感覺。因為你打開AI對話框,輸入幾句話,它返回一段文字,跟“重塑”距離實在太遠。
但今天,不太一樣。WorkBuddy,確實讓我感受到了“重塑”。
比如,面對一份大公司合同時,“要不要簽”的無助感,突然有了一份專業詳實的報告,供你參考。比如,是想做一個客戶咨詢系統時,那種“找外包貴、自己不會”的兩難,突然變成了一句話就能跑通的MVP。
而重塑的底層邏輯,不是AI更聰明了,是AI能組織工作了。
過去幾十年,組織的故事,是大公司的故事。一個商業機會要被抓住,必須先有一支團隊。而一支團隊,又必須先有一家公司去養它。
個體,是組織的附屬品。
但今天的AI,讓另一種可能浮現了出來。一個人,也可以擁有一支團隊。一個人,也可以完成整個組織才能完成的事。
個體,開始擁有組織的能力了。
當組織能力不再是大公司專屬,個體崛起,就只剩時間問題。
觀點/ 劉潤主筆/ 景九編輯/ 歌平版面/ 黃靜
這是劉潤公眾號第2940篇原創文章。未經授權,禁止任何機構或個人抓取本文內容,用于訓練AI大模型等用途
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.