網易首頁 > 網易號 > 正文 申請入駐

前百度大佬“放下”AI搜索,轉做Agent瀏覽器,評分超越Manus

0
分享至

一次自我革命的轉型,能成嗎?

前百度集團副總裁、小度科技CEO景鯤離職創業的GenSpark,最近從AI搜索向AI Agent轉型,看來是想脫離AI搜索的競爭紅海,向更智能的Agents服務領域進發,推特上很多網友評價,此次新產品比較有看點。

他們宣稱Genspark Super Agent是一個綜合性的AI助手(AI Search+Browse+Agents ),可以協調多個AI工具高效地執行各項任務。鯨哥測試下來,GenSpark在AI搜索、Agent、Deepsearch幾方面,都做了比較好的融合。

有多厲害呢, 在“GAIA Benchmark”(通用人工智能基準測試 )圖表中,Genspark在三個不同級別(Level 1、Level 2、Level 3 )測試中的表現,都超越了Manus、OpenAI Deep Research 等產品。

但對于剛剛正式海外上線的Manus而言,GenSpark顯然并沒有瞄準它作為競爭對手,而是選擇Perplexity、秘塔AI以及過去的自己,顛覆AI搜索顯然是個更大的市場。

如今的AI搜索有幾個痛點:

  1. 問題思考的時長,回答的長短不好控制,受限于模型能力,回答效果也不一定。這點很影響用戶體驗,等了半天回答的不盡如人意,那用戶可能用一次就走。

  2. 沒有多維信息處理,也沒有Agent能力,這意味著想法到工具服務的路徑沒法打通。這個是百度多少年的夢想,搜索始終局限在文字信息中心。

  3. 沒有Deep Research能力,很多深度思考的問題,只是調用AI回答了,不夠深入。

Manus一定程度上,解決了2、3問題。但是也付出了代價,就是程序比較重,內置虛擬機操作瀏覽器,結合AI大模型深度處理問題,結果在VSC中查看,給出的效果確實不錯。

也造成大家日常問題不能麻煩Manus,畢竟沒有網頁服務可隨時用,只能下載端側應用,而且一思考就20分鐘,還十分消耗Tokens,費時費錢。更具難度的問題,還是ChatGPT的DeepResearch更靠譜。

GenSpark使用門檻比較低,但是每次使用感覺都有驚喜。

這源于它的解決思路,是在日常和中等任務這段區域,快速且高效回答問題,并且完成度不錯。

在官網上,GenSpark給出了典型問題『去哪旅游』的回答Case。

可以看到GenSpark搜集了衣食住行的各項問題,比較驚喜的是,它還搜索了圖片等多維信息,調用了地圖等工具。

而且還在最后,給出了餐廳等預訂鏈接,你可以直接點擊打電話預訂。

GenSpark還有個打電話功能,和豆包通話是AI對話能力不同,你對他說“預訂明天晚上7點在西餐廳的兩人座位”,Genspark 就會撥打電話并完成預訂。

這個功能比較西方化,國內好多人用APP習慣了,電話都不怎么打了,我們是大眾點評團購是主要服務場景。

相比智譜等AutoGLM等直接實現了點咖啡,GenSpark確實還沒Agent到這一地步。但從使用效果而言,一句話直接買咖啡場景,適合的環境需要非常理想的環境,以及你要全部授權調用能力給AI。

簡單說發布會看看就得了,實際操作很難落地。

而GenSpark選擇調用Agent但是不全部執行的策略,查看了很多網頁以及工具,涉及到購買等步驟就停止了,最后一公里不只是技術問題,還是隱私保護等問題。當下階段不去觸碰,還是挺明智。

官方給出的案例很多有濾鏡,以下是我測試的第一個問題,也是我近期在思考的AI兼職創業問題,大家可以看看效果幾何。

設計下如何利用Gen-4、GPT-4o、Trae等最新工具,做AI短劇、AI表情包、AI海報以及AI PPT(AI Coding 生成SVGPPT)爆款出圈。 然后分析哪個技術實現了行業轉折點能力的突破,構建月入百萬的實現路徑,分析下哪個路徑好!

GenSpark深度分析了幾個領域目前的進展,捋順了行業從生產到售賣的過程,并提出了優劣分析。以下是其中AI短劇一個領域的分析截圖,制作流程的分解,收益模式的分析,盈利數據的預測等等,挺面面俱到分析。

最優秀的是,他直接生成了比較精美的PPT。而且這個PPT不是套模板,很多分布圖和邏輯圖,都是按照生成的內容配比。

一份相當具有可用性的分析報告,一度讓我十分驚艷。

當然,相比Deep Research來說,他的思考水平還是有一點差距,我調用O3-mini-high模型的Deep Research同樣做了這份分析報告。

Deep Research沒有生成更容易瀏覽的PPT,但是內容更深刻點,每個項目需要的工具,以及啟動成本,還有潛在收益估算,都有貼近實際的分析和呈現。(報告鏈接:https://chatgpt.com/share/67ee1d0c-d7f8-8005-af20-4cff30eb6fbe)

在第二個測試中,我測試了電商購買場景中的思考問題:

幫我比較電商渠道的兩款產品:

我在考慮購買 和 <華為鴻蒙最新款> 。 需求:- 我經常出差,需要 <影視剪輯> 、 <續航長> 的筆記本,也關注 <不要太重> 。 請從性價比、生態產品服務、用戶評價等方面比較A和B,列出各自的優缺點,并根據我的需求給出推薦國內外等電商渠道的購買鏈接。

從生成的報告看,并僅用了三四十秒鐘就完成了。而且查看了電商品臺的網頁,給出了購買鏈接,將一些國補等優惠信息也分析了出來。這就有點實用了。

實現以上能力,他們提到了GenSpark產品背后的幾項技術突破。

1、世界上第一個混合代理系統,利用最佳模型、工具和數據集來完成不同的任務

它的LLM可以使用 o 1、o3-mini-high、Claude 3. 7。圖像生成可以使用 FLUX、ogram、Recraft,視頻可以用 Kling 和 Luma。

不知GenSpark是不是利用CoE(Collaboration-of-Experts,專家協同)架構,實現了思維鏈+多系統協同,每個問題能找最適合的大模型回答。這個GenSpark不算是第一個實現。

2、內部構建的各種可靠的工具集,經過精心構建和測試,以確保效率和穩健性

調用工具集是否順暢,Google genmini有先天優勢,它在移動互聯網時代做了比較多的工具。

現在AI時代,預計MCP協議有助于讓大模型調用工具更順暢。這點短期有差距,長期大家應該都能順暢使用很多工具。

3、內部構建的各種可靠數據集,預先構建并從網絡上提取,以確保質量、新鮮度和數量。

估計這是Genspark對傳統搜索更理解的優勢所在,自己從頭清洗數據。從生成的內容看,鯨哥認為比目前的AI搜索效果更好一些。

當然,也不是說Genspark沒有劣勢。目前來說Genspark也是套殼應用,它卡在AI搜索和純粹Agent應用兩種形態中間,大家是否會習慣這種AI形態,就比較難說。

而且在AI搜索市場并未建立起優勢,就徹底轉變為Agent形態,還好是大廠高管背景出身,剛剛融資了1億美金,作為初創企業有一定的容錯率。

Dia看起來極簡,實際也是在走夸克的『超級搜索框』思路,AI對搜索的內容分析精細度和徹底融入了Agent能力方面,都號稱更強。

相比Dia,Genspark沒這么AI Native,它更像是Chatbot形態的AI瀏覽器。比Dia更易用,未來潛力也許比不過。

從使用成本來看,Genspark也只是比Manus略低,每個月24.99美元。當下階段,對內容有深入要求的用戶,可能付費ChatGPT的DeepResearch更有效果。

當然,Genspark還有AI圖片、AI視頻等功能,公告說正在自己訓練模型。這樣看每個月25美金還值得。

目前,Genspark也支持制作解釋烹飪食譜的視頻或根據新聞主題制作簡短的動畫視頻。AI會自動處理從腳本創建、視頻生成到語音合成的所有事情。

鯨哥看效果并不出眾,這些流程沒必要Agent化。視頻肯定是效果有限,不是效率優先。

客觀說,Genspark這次轉型還比較有眼光,如果沿著AI搜索的路徑走,大概率下輪融資也比較難,且不說ChatGPT和Perplexity這些巨頭對其威脅,Google這些掌握搜索數據的企業,還有底層模型的優勢,未來等AI搜索的產品形態穩定,想超越也是分分鐘的事情。

Genspark向著更Agent能力發展,就走出了差異化競爭路線,有助于培養用戶的新AI使用習慣,提升付費率。

作為初創企業,也許給自己找到了短期活下去的出路。長期競爭還是很難,Agent瀏覽器預計是2025年最受關注的AI應用賽道,大廠預計都會下場競爭。

視頻內容推薦:

主理人交流:

加入AI鯨英社群,和上千CEO、投資人和行業大牛一起共話未來!

這些職業正在被摧毀:實測10個GPT-4o繪圖最火的案例

OpenAI和Google同日地震級更新:人間一夜,AGI 臨近!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
脫掉衣服才看清:女人之間真正的差距,其實藏在這3處,不是容貌

脫掉衣服才看清:女人之間真正的差距,其實藏在這3處,不是容貌

周哥一影視
2026-03-15 14:30:11
夾斷總局骨頭,細節公布!

夾斷總局骨頭,細節公布!

家傳編輯部
2026-04-21 08:46:06
一個消息震動中東,阿聯酋突然爆出大數字,美以這下捅了馬蜂窩

一個消息震動中東,阿聯酋突然爆出大數字,美以這下捅了馬蜂窩

斷翼的鳥兒
2026-04-22 03:27:26
吉姆·法利叫囂:美貿易保護丑態畢露

吉姆·法利叫囂:美貿易保護丑態畢露

烽火瞭望者
2026-04-21 19:22:28
特朗普延長對伊停火,稱伊朗政府 “嚴重分裂”

特朗普延長對伊停火,稱伊朗政府 “嚴重分裂”

新浪財經
2026-04-22 04:23:36
現實是最大的荒誕:千億平臺的沖突始末

現實是最大的荒誕:千億平臺的沖突始末

晚點LatePost
2026-04-21 15:05:32
被逮捕的四位央視主持人,個個都淪為了階下囚,最嚴重者出賣國家

被逮捕的四位央視主持人,個個都淪為了階下囚,最嚴重者出賣國家

閱微札記
2026-04-18 16:46:59
俄朝圖們江公路大橋,直接鎖死吉林出海口,東北出海夢徹底被堵死

俄朝圖們江公路大橋,直接鎖死吉林出海口,東北出海夢徹底被堵死

老馬拉車莫少裝
2026-04-22 00:26:17
羅塞尼爾:許爾策勒帶得很好,布萊頓的排名并不令我驚訝

羅塞尼爾:許爾策勒帶得很好,布萊頓的排名并不令我驚訝

懂球帝
2026-04-22 02:39:05
許家印吃住14條:男性不準靠近房間,吃日本進口水果喝皇家禮炮

許家印吃住14條:男性不準靠近房間,吃日本進口水果喝皇家禮炮

蘭亭墨未干
2026-04-21 10:43:33
無頭蒼蠅,切爾西上半場的預期進球數僅0.04粒

無頭蒼蠅,切爾西上半場的預期進球數僅0.04粒

懂球帝
2026-04-22 04:04:18
OPPO Find X9 Ultra問世 頂級哈蘇五攝系統 1TB售9299元

OPPO Find X9 Ultra問世 頂級哈蘇五攝系統 1TB售9299元

CNMO科技
2026-04-21 21:01:30
萬斯據稱暫時擱置前往巴基斯坦同伊朗談判計劃

萬斯據稱暫時擱置前往巴基斯坦同伊朗談判計劃

財聯社
2026-04-22 04:12:09
穆斯卡特:球隊上下半場表現涇渭分明,過高期待會給楊希壓力

穆斯卡特:球隊上下半場表現涇渭分明,過高期待會給楊希壓力

懂球帝
2026-04-21 23:06:08
一夜被吞!四川27家銀行集體解散,釋放啥信號?

一夜被吞!四川27家銀行集體解散,釋放啥信號?

說故事的阿襲
2026-04-22 03:09:09
巴薩鋒線連環局:一個37歲老將如何卡住兩名前鋒的命運

巴薩鋒線連環局:一個37歲老將如何卡住兩名前鋒的命運

賽場速報局
2026-04-21 02:40:08
越南跌倒,老撾吃飽?中老高鐵如何讓老撾超越越南完成華麗轉身?

越南跌倒,老撾吃飽?中老高鐵如何讓老撾超越越南完成華麗轉身?

靜夜史君
2026-04-20 23:55:43
50歲,俯臥撐每天多少組為宜?

50歲,俯臥撐每天多少組為宜?

解說阿洎
2026-04-19 01:44:44
伊朗國家電視臺:伊美停火協議將于“午夜到期”

伊朗國家電視臺:伊美停火協議將于“午夜到期”

財聯社
2026-04-22 01:10:27
普京想好了,一旦臺海出大事,俄羅斯將徹底撕毀協議拉中國一把

普京想好了,一旦臺海出大事,俄羅斯將徹底撕毀協議拉中國一把

激情與榮耀并存
2026-04-21 16:24:45
2026-04-22 04:59:00
鯨選AI incentive-icons
鯨選AI
最新AI產品化與商業化案例速遞
149文章數 38關注度
往期回顧 全部

科技要聞

創造4萬億帝國、訪華20次,庫克留下了什么

頭條要聞

三國取消飛航許可 賴清德無法竄訪斯威士蘭

頭條要聞

三國取消飛航許可 賴清德無法竄訪斯威士蘭

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

宋承炫曬寶寶B超照,宣布老婆懷孕

財經要聞

現實是最大的荒誕:千億平臺的沖突始末

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態度原創

房產
旅游
親子
教育
公開課

房產要聞

年薪40-50萬!海南地產圈還在猛招人

旅游要聞

京城今春“濱水+”玩法迭代

親子要聞

為什么幼兒園里,很多小朋友會做不好的事?

教育要聞

對不起,我有點“摳”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版