網易首頁 > 網易號 > 正文 申請入駐

比DeepSeek更香的,是今年爆火的Agent,外包工作的含金量懂不懂

0
分享至

今年WAIC昨天已經結束了,以黑馬所知的情況來看,今年大家最關注的毫無疑問還是機器人。

雖然這群硅基生命在經歷了一年的沉淀之后,依舊保留著碳基人類所缺少的那種小腦缺失的美感。(bushi)

相對而言,其實工業機械臂的表現好了不止一星半點,但大家討論最多的依舊是人形機器人。

我覺得吧,人類可能還是對類人形態更感興趣一點。

在大部分機器人展位還停留在“看個熱鬧”的情況下,黑馬明顯對那些當下已經可以服務于人類(尤其是黑馬這種搬磚人)的東西更感興趣。

科技既然是造福人類的,請讓我率先享受。(bushi)

去年橫空出世的DeepSeek將大模型的實用性拔高到了一個新的層次,到了今年,將大模型與場景綁定更深的、生產力落地的Agent,就成為了兵家必爭之地。

盲猜應該有朋友還不知道Agent是什么,簡單來說就是一個基于AI大模型構建的,能夠完成具體事情的智能體。

相比于大模型需要我們主動去輸入指令,一步一步獲取信息達到目的,Agent的好處在于你只用給出一個目標,過程它會自己去琢磨,你只用坐等一個結果就好了。

是不是感覺很眼熟,這不就外包嘛!

作為天天一線搬磚的牛馬,Agent代表的生產力解放是黑馬最饞的,而當下市面上的Agent產品,雖然不能說很多,但頭部的廠商基本都已經下場。

目前市面上體量比較大的通用Agent像Manus(已經退出中國市場)、通義千問、kimi、MinMax Agent(面向海外)、扣子空間、夸克AI、納米AI都已經趨于成熟。

黑馬今天就淺撈了扣子空間、通義千問和kimi智能體三個Agent來試試,看看能不能幫我完成日常工作。

首先聲明,測試結果僅為黑馬以特定目的為前提的純主觀感受,并不代表Agent的綜合能力,建議大家親自體驗之后再做判斷。

以及還有更多諸如Manus、MinMax Agent、Genspark等優秀的Agent,但考慮到成本問題這次暫時擱置,如果大家想看我們之后再測。

PPT制作

作為最容易出“成果”的工作內容,各位牛馬估計對PPT又愛又恨。

如果給“最想外包出去的活”做個排名,黑馬大概會把PPT放在第一個。

于是,黑馬首先讓三個Agent給我做了一個“理想i8發布會PPT”,直接來看效果。

表現最好的是扣子空間,在我提出要求之后,扣子有明顯的步驟思考,比如先確定理想i8的產品信息;

然后又搜索了i8的設計細節、競品情況等;

最后給到一個大綱讓我確認。

因為是測試,所以我沒有做任何調整,扣子給我的PPT風格確認中,也直接選擇了智能選擇。

大概等了9分鐘之后,扣子給到了一份理想i8發布會PPT。

說實話,扣子輸出的PPT和真正的發布會PPT還是有一定差距的。

但考慮到全程我只給了一句話,其余什么干涉都沒有,全靠扣子自己扒拉素材,甚至用有限的素材給我整了個配色方案和車內空間設計。

就這效果,日常拿來糊弄應該問題不大的。(扣子也是三個里面唯一自己找了i8相關配圖的Agent)

不過理想發布會昨晚就已經開過了,扣子搜到的素材還是早期的爆料圖,信息檢索方面還有待進步啊。

接下來是通義千問。(PS:通義千問也有自己的PPT智能體)

在我提出要求之后,千問非常快速(不超過5s)的生成了一個大綱,我們可以在大綱里自行刪減。

下方可以選擇PPT風格,但沒有扣子空間那樣的智能選擇,必須自己確定模板。

等都確定好之后點擊下一步就可以生成得到一個PPT。

從結果來看,通義千問生成的PPT更加模板化,黑馬感覺就是將生成的大綱直接塞進了PPT模板里。

模板和內容之間沒有邏輯關系,產品細節也缺失,圖片只能選擇自己上傳或者AI生成,相比扣子有點呆。

如果要使用通義生成的內容,黑馬感覺少不了自己返工。

Kimi的表現和通義千問差不太多,都是根據要求直接生成大綱,但不支持修改,模板也需要自己確定。

成品也是PPT模板+大綱的拼接,但相比通義千問,有著更濃郁的毛坯房的味道。

PPT這一趴,扣子完勝。

內容檢索和總結

做完PPT,黑馬決定讓三位幫我進行內容信息檢索和總結。

我提出的要求是:檢索微信公眾號上關于WAIC 2025熱門話題,總結主要觀點并輸出成PDF文件。

扣子在經過了7輪思考之后,期間自主調動了LinkReaderPlugin等工具輔助驗證,終于確定沒有辦法鎖定公眾號來源。

最終扣子給了我一份不限平臺的WAIC熱點總結。

從內容來看,扣子輸出的內容只能說中規中矩,內容是完備的,但有點過于簡潔了,在大眾反饋上有一些信息缺失。

另外純文字看著有點難受,不過額外發出指令就能夠重新生成補充圖表。

通義千問直接告訴我沒有辦法檢索微信公眾號的內容,然后根據官方消息和媒體報道生成了一個熱點總結。

但從輸出的內容來看,通義千問相對扣子來說邏輯要更清晰一點,總結的點也更到位。(完整內容見連接:

https://lxblog.com/qianwen/share?shareId=bf507481-667f-468d-8f5d-476b81c3caae&type=agentChat)

不過通義不支持圖表輸出,看著有點抽象。

到了Kimi就更抽象了,kimi大概只用了2s時間就檢索完了所有信息,并給到了一個PDF下載鏈接。

但遺憾的是這個鏈接點進去是空的,啥也沒有。

而我們只得到了一個很簡略的摘要,簡短到讓我摳腦殼。

Emmmm……只能說進步空間還很大吧。

對了,我還嘗試了Kimi的學術搜索智能體,但最開始因為無法檢索公眾號,所以任務直接中斷,第二次我沒有要求平臺了,但檢索結果也不理想,甚至很多信源是前幾年的。

總的來說,內容檢索和總結上,扣子在多形態信息輸出上更有優勢,但個人感覺如果只需要簡短的文字總結,通義千問的檢索和總結能力更厲害。

Kimi的話……未來可期,嗯。

寫文章

最后,黑馬把爪子伸向了我的老本行,寫文章。

自從AI搜索普及之后,黑馬在寫作過程中通常都少不了AI幫忙檢索信息,但至今還沒找到一個能直接幫我寫文章的。

于是黑馬又提出一個要求:我的公眾號面向手機汽車泛科技圈新聞等受眾,我的文章內容要求:文章生動有趣,深入淺出,有自己的觀點,內容來源有事實依據,生成一篇公眾號文章。

這個要求定位主打一個寬泛,像極了黑馬領導給黑馬布置任務時候的要求,需要Agent發揮極致的自主能動性。

還是先來看扣子,扣子依舊邏輯清晰的開始思考,在我圈定的手機汽車泛科技范圍內進行熱點檢索。

不過扣子在理解最終需求的時候還是比較保守,選擇了手機汽車生態交叉的地方為切入點。

思考過程這里就不詳細放圖了,淺放一下扣子生成的文章:

扣子確實給到了一個觀點:手機和汽車的生態綁定逐漸加深。但不妨礙文章整體還是單純的素材羅列。

看來在寫文章方面,目前的AI還是無法一步到位完成工作,需要更細致的調教,比如直接給出大綱。

壞消息:工作外包失敗。

好消息:還沒被AI替代。(bushi)

因為我沒在通義千問找到官方的寫作智能體(非官方的很難用可以忽略),所以這趴通義缺席。

直接來看kimi。

Kimi依舊缺少思考過程,在檢索了7個網站后,就給出了一個手機和汽車的“黑科技”的文章。

可能也是我給的范圍太寬泛的原因,kimi的文章看著沒有重點,分別寫了手機拍照、折疊屏、智能駕駛、新能源環保等事情。

個人感覺文章是通過關鍵詞檢索后直接將內容組合而成,不管是時效性還是文章整體脈絡都存在很大的問題。

如果把這趴和上一趴結合來看,扣子通過更清晰的指令和多次修正,應該能夠創作出不錯的文章,但在創作力方面可能還有所欠缺。

按照黑馬的過往經驗,豆包和deepseek在這方面應該更有優勢。(感興趣的可以測測)

好了,以上就是這次的測試內容,再次提醒:測試項目和內容是黑馬從自身需求出發隨機出的,僅供參考。

扣子空間給我的驚喜比較大,它有一套完整的項目邏輯,是符合我認知里Agent的定義的,相對而言,kimi和通義千問距離Agent其實還有一點距離。

但說實話,這次的對比其實不是很明顯,幾個產品效果相差有點大了,搞得像在恰米。(真沒恰)

但其他比較好用的Agent要么只面向海外,要么需要付費,扣子相對而言是我們能接觸到的門檻比較低的Agent。

其實我還是很期待國內能有更多好用的Agent產品出現的。

如果大家有好用的Agent推薦,可以在評論區分享。

我可太想進步了。

撰文:柯然

編輯:小馬哥

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
失蹤足足5天后,美軍終于承認:價值16億的最強無人機在中東沒了

失蹤足足5天后,美軍終于承認:價值16億的最強無人機在中東沒了

混沌錄
2026-04-20 20:32:11
你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
心外科主任救回無數心臟,自己心梗卻倒在食堂。他瞞了兩年胸痛

心外科主任救回無數心臟,自己心梗卻倒在食堂。他瞞了兩年胸痛

白宸侃片
2026-04-21 16:26:58
大力出奇跡!Intel終于拿出對付3D緩存的絕招:288MB bLLC大平層緩存暴力碾壓AMD

大力出奇跡!Intel終于拿出對付3D緩存的絕招:288MB bLLC大平層緩存暴力碾壓AMD

快科技
2026-04-19 17:17:30
香港樓市被投下了一枚“核彈”

香港樓市被投下了一枚“核彈”

林子說事
2026-04-21 11:41:26
倒計時1天!賴清德要跑,蔡英文復出,解放軍立馬按住了日本

倒計時1天!賴清德要跑,蔡英文復出,解放軍立馬按住了日本

花寒弦絮
2026-04-21 05:02:01
值40萬元!甘肅農民為報仇套住一只殺了吃,5年后轉手賣出皮和骨

值40萬元!甘肅農民為報仇套住一只殺了吃,5年后轉手賣出皮和骨

米果說識
2026-04-05 16:43:44
局勢生變,全球接到消息,美軍全部撤離,所有軍事基地被敘國接管

局勢生變,全球接到消息,美軍全部撤離,所有軍事基地被敘國接管

領略快樂真諦
2026-04-21 13:00:02
哈登破紀錄!單場轟28+5+5,騎士2-0領先,完爆加蘭,這次沒選錯

哈登破紀錄!單場轟28+5+5,騎士2-0領先,完爆加蘭,這次沒選錯

去山野間追風
2026-04-21 17:03:30
老婆沒穿內褲引人取笑,丈夫一怒之下拔刀亂捅,整整逃亡二十多年

老婆沒穿內褲引人取笑,丈夫一怒之下拔刀亂捅,整整逃亡二十多年

長安一孤客
2026-03-12 16:00:24
尾盤突發!002342,收盤前4分鐘垂直漲停!商業航天,集體爆發!

尾盤突發!002342,收盤前4分鐘垂直漲停!商業航天,集體爆發!

證券時報e公司
2026-04-21 16:57:22
男子網上偶遇多年前婚禮后消失的新娘 討還錢款不成將其殺害 一審被判死刑

男子網上偶遇多年前婚禮后消失的新娘 討還錢款不成將其殺害 一審被判死刑

紅星新聞
2024-08-04 15:19:07
美媒:中國在臺灣海峽部署航母,回應日本驅逐艦的“挑釁”行為

美媒:中國在臺灣海峽部署航母,回應日本驅逐艦的“挑釁”行為

零度Military
2026-04-21 07:12:38
國產頂級神劇,只可惜,央視播完就禁了

國產頂級神劇,只可惜,央視播完就禁了

獨立魚
2026-03-23 21:22:17
全力爭勝!廣東迎來新援首秀,薩姆納回歸助陣

全力爭勝!廣東迎來新援首秀,薩姆納回歸助陣

林子說事
2026-04-21 10:39:48
這場中東沖突的最大意外:一直上躥下跳的印度,已是徹底涼涼了

這場中東沖突的最大意外:一直上躥下跳的印度,已是徹底涼涼了

流史歲月
2026-04-20 16:00:06
瑞典電視臺世乒賽前爆驚雷,主教練厭倦巨星莫雷加德與隊友沖突

瑞典電視臺世乒賽前爆驚雷,主教練厭倦巨星莫雷加德與隊友沖突

冥王星與一只碗
2026-04-21 10:00:24
瑞麗市藍天救援隊副隊長陳延壽因公犧牲,年僅39歲,其在搜救一名比利時失蹤男子時突發急性高反

瑞麗市藍天救援隊副隊長陳延壽因公犧牲,年僅39歲,其在搜救一名比利時失蹤男子時突發急性高反

極目新聞
2026-04-21 11:25:38
46歲高圓圓近照,沒美顏濾鏡,暴露真實狀態,網友:原諒趙又廷了

46歲高圓圓近照,沒美顏濾鏡,暴露真實狀態,網友:原諒趙又廷了

阿纂看事
2026-04-20 18:40:37
臺灣突然宣布重磅決定,島內數萬人聯名反對,鄭麗文成眾望所歸

臺灣突然宣布重磅決定,島內數萬人聯名反對,鄭麗文成眾望所歸

心靈的觸動a
2026-04-21 15:49:07
2026-04-21 17:43:00
黑馬公社 incentive-icons
黑馬公社
解讀、體驗你關心的科技
2632文章數 80475關注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

"武漢高啟強"黃大發一審被判死刑 涉多起暴力強拆事件

頭條要聞

"武漢高啟強"黃大發一審被判死刑 涉多起暴力強拆事件

體育要聞

62歲,成為中國足壇最火的人

娛樂要聞

周潤發時隔16年再賣樓,變現數億資產

財經要聞

現實是最大的荒誕:千億平臺的沖突始末

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態度原創

本地
旅游
房產
公開課
軍事航空

本地新聞

春色滿城關不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

旅游要聞

恐高人群福音!四川一景區推出“凌波微步”版低空纜車 景區回應

房產要聞

年薪40-50萬!海南地產圈還在猛招人

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普公開對伊開戰真正原因

無障礙瀏覽 進入關懷版