![]()
參考圖片來(lái)自騰訊產(chǎn)品Marvis
?有界UnKnown原創(chuàng)
作者丨錢江
編輯|山茶
最近,騰訊又推出了一款新的AI產(chǎn)品——Marvis,并在行業(yè)里引起大范圍的討論。
Marvis,聽這個(gè)名字,就知道這是在致敬Jarvis——這個(gè)人是鋼鐵俠的親密助理,也是人工智能領(lǐng)域最經(jīng)典的熒幕形象。
對(duì)鋼鐵俠或者漫威有過(guò)了解的朋友肯定都知道,Jarvis是一個(gè)多么強(qiáng)大的AI助理。
它會(huì)在鋼鐵俠實(shí)驗(yàn)著火的時(shí)候主動(dòng)拿來(lái)滅火器滅火(日常應(yīng)變);能夠在鋼鐵俠僅僅給出一個(gè)指引的情況下,自動(dòng)測(cè)算出用蟲洞穿越時(shí)間的方法(科研能力),以及在鋼鐵俠遇到危險(xiǎn)、性命垂危的時(shí)候,主動(dòng)幫鋼鐵俠撥通愛人的電話(情感陪伴)......
它是一個(gè)真正的全能助理,從生活到工作;它也真正理解并懂得主人的需求,并在適當(dāng)?shù)臅r(shí)候主動(dòng)幫助主人做出選擇。
可以說(shuō),沒(méi)有人會(huì)在了解Jarvis之后,不想擁有一個(gè)Jarvis;因此這個(gè)形象也成為人工智能助理最完美的預(yù)設(shè)。
所以,騰訊給自己的AI產(chǎn)品取這么一個(gè)名字,其想法其實(shí)已經(jīng)昭然若揭——想要打造類似Jarvis一樣,全能的、真正如人類助理一樣角色的AI產(chǎn)品。
這個(gè)想法肯定是好的,但,騰訊這個(gè)目標(biāo)能實(shí)現(xiàn)嗎?或者說(shuō),騰訊實(shí)現(xiàn)這個(gè)目標(biāo)的第一步,走穩(wěn)了嗎?
Marvis,刻意經(jīng)營(yíng)的“活人”形象
為了了解實(shí)際情況,我們?nèi)腆w驗(yàn)了Marvis這款產(chǎn)品。
可能是為了讓Marvis與Jarvis更接近,反正從進(jìn)入Marvis的產(chǎn)品頁(yè)面,到真正將其安裝到電腦上,這個(gè)過(guò)程中的每一步,都有騰訊刻意營(yíng)造的,一種撲面而來(lái)的“活人感”。
首先是Marvis的形象,一匹帶著紅圍脖的馬,馬年、騰訊馬化騰,以及現(xiàn)在無(wú)數(shù)打工人都自稱“牛馬”,這種設(shè)定一開始就在想拉近與用戶的距離。
其次,在Marvis初始界面,Marvis一邊給自己補(bǔ)充Token,一邊辦理“入職手續(xù)”。
這個(gè)畫面也很“騰訊”。因?yàn)楝F(xiàn)實(shí)中,騰訊員工完成入職時(shí),也會(huì)進(jìn)入一套名為“紅圍脖”的服務(wù)平臺(tái)。所謂“戴上紅圍脖,成為鵝廠人”,到了Marvis這里,也有了類似的入職儀式。
![]()
但Marvis的“活人感”不只來(lái)自這匹小馬,還來(lái)自它為Agent搭出的整套辦公室。
在這個(gè)虛擬辦公區(qū)里,“老板”Marvis坐在前排,后面是五個(gè)組員:App Agent、File Agent、Computer Agent、Browser Agent和Search Agent。
它們各自負(fù)責(zé)不同任務(wù),但呈現(xiàn)出來(lái)的不是功能模塊,而是一群正在上班的“同事”,它們有人去茶水間吃零食,有人去健身房活動(dòng),有人能在廁所里蹲著刷手機(jī)、自由抽紙。
偶爾,它們還能互相竄工位,看“同事”打王者榮耀,順便交流幾句,整個(gè)辦公室明亮、整潔,員工穿得整齊體面,像是一個(gè)真正的企業(yè)環(huán)境。
![]()
從外部的視角來(lái)看,這像是產(chǎn)品經(jīng)理將騰訊的企業(yè)文化和辦公日常搬到了線上,Marvis這匹小馬,就像是一位真正的騰訊員工一樣。
但我們和騰訊的朋友討論,他們卻說(shuō),這顯然不是真正的騰訊,因?yàn)檎嬲拇蚬と藳](méi)有這么松弛。
他們開玩笑地講,這或許是騰訊老板眼中的騰訊,也或許,是一些騰訊打工人心中理想的騰訊。
但玩笑歸玩笑,無(wú)論產(chǎn)品宣傳的氛圍多么有“活人感”,Agent產(chǎn)品最終還是要回到一個(gè)最樸素的問(wèn)題:它到底能不能把活兒干好。
給Marvis做個(gè)上崗測(cè)試
那么,Marvis的實(shí)際能力如何呢?
在正式使用之前,我們看了許多宣傳,基于其系統(tǒng)級(jí)AI助手的定位,我們對(duì)Marvis的能力有著很高的預(yù)期。
因此我們的第一個(gè)任務(wù)是:讓其調(diào)用電腦端已經(jīng)存儲(chǔ)好的圖片,然后用PS完成公眾號(hào)文章封面的制作。
我們?cè)O(shè)定了一個(gè)提示詞:
幫我打開已提供的 PSD 文件,將其中的底圖圖層替換為我提供的新圖片,保持原 PSD 的畫布尺寸、圖層結(jié)構(gòu)、文字、特效與排版不變。替換后,檢查圖片位置、比例與裁切是否正確,避免變形或錯(cuò)位。最后導(dǎo)出高質(zhì)量 JPG 文件,并保存到電腦【下載】文件夾。
我們期待的結(jié)果是這樣的,這是我們?nèi)粘J褂玫姆饷妫?/p>
![]()
而Marvis實(shí)際給到的結(jié)果是這樣的:
![]()
按理來(lái)說(shuō),作為系統(tǒng)級(jí)的AI助理,Marvis應(yīng)該用Computer Agent直接打開PSD文件,用我給它的圖片替換掉原來(lái)的圖片,并重新導(dǎo)出一個(gè)圖片。
但在實(shí)際執(zhí)行過(guò)程中,Marvis選擇的卻是File Agent,并且運(yùn)行了很久。
為此,我還特意和Marvis確認(rèn)了一下,但它堅(jiān)持應(yīng)該使用File Agent,而實(shí)際輸出的結(jié)果,卻始終不盡如人意。
![]()
如果說(shuō)PSD測(cè)試考驗(yàn)的是本地軟件調(diào)用能力,那么接下來(lái)的測(cè)試,就看它能不能在網(wǎng)頁(yè)環(huán)境里完成一組連續(xù)操作。
我嘗試要求搜索并打開SpaceX的招股書,重點(diǎn)提煉其股權(quán)結(jié)構(gòu)、收入結(jié)構(gòu)、核心業(yè)務(wù)占比,以及近年?duì)I收、利潤(rùn)和主要增長(zhǎng)業(yè)務(wù)。
Marvis派出了Browser Agent聯(lián)網(wǎng)搜索,交付了一份表格,列出每一項(xiàng),但仔細(xì)看,出現(xiàn)了一個(gè)很離譜的錯(cuò)誤,本地表格中的關(guān)鍵數(shù)據(jù)都被抹去了一個(gè)“開頭”:
![]()
比如Space X在2025年的全年?duì)I收是187億美金,而Excel表格寫成“87億”美金。
Marvis算是基本完成了任務(wù),但是交付的結(jié)果卻存在重大問(wèn)題…
但在這個(gè)過(guò)程中,我其實(shí)也在反思,是不是我提出的要求本身就超出了這個(gè)產(chǎn)品的能力?
所以在后續(xù)的測(cè)試中,我不再?gòu)摹拔蚁胱屗鍪裁础钡慕嵌瘸霭l(fā),而是從“它能做什么”的角度出發(fā)。
從Marvis給出的引導(dǎo)功能來(lái)看,它默認(rèn)強(qiáng)調(diào)的操作系統(tǒng)級(jí)能力,主要集中在三個(gè)方向。
第一類是電腦設(shè)置和系統(tǒng)檢查,比如檢查電池健康狀況、查看電腦中App的狀態(tài)、提醒哪些軟件可能需要更新。
![]()
第二類是本地文檔和圖庫(kù)的歸類處理。比如,它可以嘗試識(shí)別電腦里的文件類型,把資料按照用途重新整理。但這部分體驗(yàn)里也會(huì)出現(xiàn)一些“謎之操作”,例如把一些大摩的研究報(bào)告歸類成“簡(jiǎn)歷”。
![]()
第三類是定時(shí)處理一些標(biāo)準(zhǔn)化任務(wù)。比如,設(shè)置每天17:00自動(dòng)查看GitHub當(dāng)日熱門項(xiàng)目,或者訂閱《哈哈哈哈哈6》的更新提醒。這類任務(wù)本質(zhì)上更像“提醒 + 固定流程”,路徑清楚、動(dòng)作明確,比較適合交給Agent執(zhí)行。
那么,在這個(gè)范疇內(nèi),Marvis的完成度如何?
先試試系統(tǒng)設(shè)定好的【記不住Mac快捷鍵】任務(wù),點(diǎn)擊后,數(shù)秒鐘就完成了任務(wù),并生成了速查圖片:
![]()
系統(tǒng)設(shè)定好的任務(wù)欠缺挑戰(zhàn)性,那么,在這個(gè)范疇內(nèi)新建的任務(wù)呢?
我讓Marvis幫我檢查電腦上已安裝的辦公類 App,找出哪些還沒(méi)有更新到最新版本,并試著讓它幫我完成一部分App更新。
我給出提示詞:
請(qǐng)檢查我電腦上已安裝的辦公類 App,找出哪些還沒(méi)有更新到最新版本。重點(diǎn)包括 Office、WPS、飛書、釘釘、企業(yè)微信、騰訊會(huì)議、Zoom、Notion、Obsidian、Adobe Acrobat、OneDrive、Google Drive、Dropbox 等辦公、協(xié)作、文檔和效率類軟件。請(qǐng)只檢查版本,不要自動(dòng)更新、卸載或修改設(shè)置。最后用表格列出 App 名稱、當(dāng)前版本、最新版本、是否需要更新、檢查渠道和備注;無(wú)法確認(rèn)的請(qǐng)標(biāo)注“待人工確認(rèn)”。
很快,Marvis給出了一份診斷報(bào)告:
![]()
它提示了我6月12日之前需要更新ChatGPT,于是我要求Marvis幫我下載,但結(jié)果不如人意,Marvis幾乎沒(méi)有任何瀏覽器的調(diào)用權(quán)。
在多番嘗試失敗后,給了我一份手動(dòng)下載建議:
![]()
從這幾個(gè)任務(wù)來(lái)看,Marvis的能力需要分兩個(gè)維度來(lái)看:
一方面是在系統(tǒng)設(shè)定的固定任務(wù)中,Marvis的完成度較高;但另一方面,一旦任務(wù)進(jìn)入開放環(huán)境,它的表現(xiàn)就差強(qiáng)人意。
也可以理解為,Marvis和市場(chǎng)上的龍蝦產(chǎn)品本質(zhì)差不多,需要結(jié)合一些skill或workflow封裝流程,來(lái)完成任務(wù)。
從我們的結(jié)果來(lái)看,Marvis給我們帶來(lái)的問(wèn)題是,一開始的宣傳拔高了我們的預(yù)期,而實(shí)際能力又無(wú)法兌現(xiàn)宣傳的結(jié)果,因此讓我們?cè)跍y(cè)試的過(guò)程中有了一個(gè)明顯的心理落差。
但除此之外,即便拋開這種心理落差,Marvis能夠給用戶提供的價(jià)值其實(shí)也十分基礎(chǔ),甚至有些雞肋:
比如文檔檢索、資料整理,現(xiàn)在市面上有非常多的資料管理和檢索工具,效率和結(jié)果都要比Marvis好很多;再比如任務(wù)拆解和內(nèi)容生成就更不用提了,都不需要拿國(guó)際上的其他產(chǎn)品做對(duì)比,僅僅是騰訊自家的Workbuddy,其完成度就要比Marvis高很多。
Marvis和市場(chǎng)上同類龍蝦產(chǎn)品的不同之處,更多在于它把這項(xiàng)能力單獨(dú)拎出來(lái),包裝成了一個(gè)更明確的產(chǎn)品賣點(diǎn),但實(shí)際體驗(yàn)還沒(méi)有證明它比別人干得更好。
所以,體驗(yàn)到這里,我其實(shí)有個(gè)疑問(wèn),騰訊起這么一個(gè)高調(diào),但給出這樣一個(gè)產(chǎn)品,Marvis的意義又是什么呢?
Marvis,產(chǎn)品化的OpenClaw?
從宣傳口徑上,Marvis是操作系統(tǒng)層級(jí)AI助手,這意味著它可以根據(jù)指令,直接操作用戶的電腦,幫助用戶完成一些工作。
怎么樣,這個(gè)形容是不是聽起來(lái)很耳熟?沒(méi)錯(cuò),之前風(fēng)靡全網(wǎng)的OpenClaw(龍蝦)也是這么宣傳的。
事實(shí)上,從產(chǎn)品層面目標(biāo)的角度來(lái)講,Marvis和龍蝦是一致的,所以他們的很多能力/功能也非常相似,比如都可以直接操作用戶電腦,都可以直接幫助用戶完成一些工作等等。
它們的差異點(diǎn)在于,OpenClaw是一種框架,它把更多的選擇權(quán)和控制權(quán)都交給了用戶,比如需要用戶自己部署Gateway,連接各種聊天通道,再配置模型、工具、插件和權(quán)限。
而Marvis則更像是一個(gè)完全產(chǎn)品化的龍蝦,真正的開箱即用。
比如,Marvis弱化了模型的概念。
界面里看不到模型選項(xiàng),用戶也不用在GPT、Claude、通義千問(wèn)、MiniMax之間來(lái)回切換。它更像是默認(rèn)替你選好了底座,大概率是騰訊自家的混元大模型。相比之下,很多龍蝦產(chǎn)品會(huì)把模型選擇放在前臺(tái),甚至把“支持多少模型”本身當(dāng)成賣點(diǎn)。
![]()
比如,Marvis做了一個(gè)skill合集社區(qū),但和龍蝦產(chǎn)品一板一眼的skill列表式呈現(xiàn)不同,Marvis界面就像小紅書筆記一樣。標(biāo)題要足夠抓人,封面要足夠夸張,每個(gè)skill都被包裝成一個(gè)看起來(lái)很有用、很適合收藏的“經(jīng)驗(yàn)帖”。
每個(gè)skill下方還會(huì)標(biāo)注來(lái)源,看上去像是一個(gè)允許用戶上傳、分享skill的UGC社區(qū)。但目前在Marvis里,并沒(méi)有看到上傳skill的入口。所以這些skill更可能還處在官方篩選或定向邀請(qǐng)階段,也就是說(shuō),它看起來(lái)像社區(qū),但暫時(shí)還不是一個(gè)真正開放的社區(qū)。
![]()
總的來(lái)說(shuō),使用Marvis,用戶不需要知道什么是Agent、Gateway、Plugin、API Key,只要像微信一樣下載,安裝,然后就可以給Marvis下達(dá)指令,比如:根據(jù)電腦中的論文資料,幫我擬定一個(gè)開題報(bào)告。
所以,Marvis目前最核心的價(jià)值,或許是先把“AI模擬真人操作電腦系統(tǒng)”這個(gè)概念做成了一個(gè)可體驗(yàn)的產(chǎn)品。
它讓用戶看到了一種方向:未來(lái)的AI助手不只是在聊天框里回答問(wèn)題,而是可以進(jìn)入電腦、理解資料、執(zhí)行任務(wù)。但就當(dāng)前體驗(yàn)來(lái)說(shuō),它更像是把這個(gè)方向先占住了,而真正的能力突破,還沒(méi)有完全發(fā)生。
Marvis為什么沒(méi)變成“Jarvis”?
最后,我們來(lái)反思一下Marvis的體驗(yàn)過(guò)程。
說(shuō)實(shí)話,上手之前,Marvis “操作系統(tǒng)級(jí)”的宣傳確實(shí)抬高了我們的預(yù)期。
在還沒(méi)使用之前,我和朋友討論時(shí)都覺(jué)得,這才是Agent產(chǎn)品真正應(yīng)該做的方向,把OpenClaw沒(méi)有做好的工作做好,封裝成產(chǎn)品,降低用戶使用門檻,讓AI不只是聊天、調(diào)用工具或執(zhí)行封裝流程,而是能真正進(jìn)入電腦環(huán)境,替人打開軟件、處理文件、操作網(wǎng)頁(yè),像真人一樣連續(xù)完成任務(wù)。
也正因?yàn)槿绱耍覀兤诖牟皇怯忠粋€(gè)AI助手,而是它能在“模擬人類操作電腦”這件事上,比市場(chǎng)上現(xiàn)有產(chǎn)品更進(jìn)一步。
但實(shí)際體驗(yàn)下來(lái),期待越高,落差也越明顯。
當(dāng)然,這不只是Marvis的問(wèn)題。它遇到的難點(diǎn),也是整個(gè)Agent市場(chǎng)正在攻克的方向:如何讓AI不只是會(huì)回答、會(huì)調(diào)用工具,而是真的能在真實(shí)操作環(huán)境里把活兒干好。
第一個(gè)難點(diǎn),是應(yīng)用權(quán)限。
Marvis能當(dāng)電腦的“二房東”,前提是用戶把本地權(quán)限交給了它,所以它可以管理本地文件、檢查系統(tǒng)狀態(tài)、整理桌面資料。
但今天很多資料并不在本地,而是在微信、印象筆記、飛書、騰訊文檔、網(wǎng)盤和郵箱里。真正有用的Agent,應(yīng)該能進(jìn)入這些日常應(yīng)用,把分散的信息找出來(lái)、讀進(jìn)去、再整理出來(lái)。
現(xiàn)實(shí)是,微信不在Marvis的權(quán)限列表里。
![]()
印象筆記也不在可操作范圍內(nèi)。
![]()
但有意思的是,Marvis有一種契而不舍的“牛馬精神”,它雖然沒(méi)有權(quán)限接入App,但它給了我一個(gè)“小相機(jī)”,讓我把相關(guān)頁(yè)面拍給它看,再繼續(xù)識(shí)別和處理。
![]()
這很像兩點(diǎn)之間本來(lái)直線最短,但中間每個(gè)路口都有人收費(fèi),于是只能不斷繞路。最后事情也許能做成,但效率和體驗(yàn)都打了折扣。
Agent要真正好用,本質(zhì)上要把用戶常用應(yīng)用都做成tools接進(jìn)去。但問(wèn)題是,接口掌握在各個(gè)平臺(tái)手里。微信未必開放,印象筆記未必開放,淘寶、支付寶更不可能輕易開放。各大平臺(tái)更愿意自己做生態(tài),而不是把入口交出去。
第二個(gè)難點(diǎn),是技術(shù)本身。
Agent在電腦里操作,和人形機(jī)器人進(jìn)家庭干家務(wù)很像:標(biāo)準(zhǔn)化環(huán)境里能做,泛化環(huán)境里就會(huì)遇到無(wú)數(shù)卡點(diǎn)。
電腦界面本身不是結(jié)構(gòu)化數(shù)據(jù)。人看屏幕時(shí),天然知道哪里是按鈕、哪里是輸入框、哪個(gè)彈窗必須處理、哪個(gè)文件像論文;但AI看到的首先只是截圖。它必須先把截圖理解成可操作的界面結(jié)構(gòu),再判斷下一步點(diǎn)哪里、輸什么、打開哪個(gè)文件。
所以,單次點(diǎn)擊成功不難,難的是連續(xù)幾十步都不出錯(cuò)。搜索文件、篩選日期、判斷主題、復(fù)制資料、閱讀內(nèi)容、生成文檔、保存到桌面,任何一步出錯(cuò),后面都會(huì)累積偏差。
Marvis提出了一個(gè)很美好的未來(lái):AI進(jìn)入電腦,成為用戶和操作系統(tǒng)之間的新中介。但要真正變成電腦里的“Jarvis”,還要跨過(guò)應(yīng)用權(quán)限、生態(tài)接口和長(zhǎng)任務(wù)穩(wěn)定性這幾道坎。
結(jié)語(yǔ)
AI時(shí)代,騰訊一直被寄予更高的期待。
馬化騰在2023年5月的股東大會(huì)上稱:“對(duì)于工業(yè)革命級(jí)的機(jī)遇來(lái)講,早一個(gè)月還是晚一個(gè)月把電燈泡拿出來(lái),在長(zhǎng)的時(shí)間跨度上來(lái)看,是不那么重要的。”
到了2026年5月的股東大會(huì),馬化騰再次回應(yīng)外界關(guān)于騰訊AI“落后”的說(shuō)法:“原來(lái)一年前我們以為上了船,后來(lái)發(fā)現(xiàn)那個(gè)船漏水了,現(xiàn)在感覺(jué)站上去了,還坐不下去,還是希望船速能快一點(diǎn)。”
他同時(shí)提到:“公司曾盲目跟風(fēng)涉足非優(yōu)勢(shì)領(lǐng)域,跟風(fēng)布局各類熱門賽道,最終大多以失利告終。面對(duì)本輪人工智能發(fā)展浪潮,我們時(shí)刻保持理性清醒,堅(jiān)決規(guī)避過(guò)往發(fā)展誤區(qū)。”
從這幾次發(fā)言來(lái)看,騰訊對(duì)AI的態(tài)度一直以“穩(wěn)”為主:不急著搶第一時(shí)間的聲量,而是希望AI成為業(yè)務(wù)的“增倍器”,結(jié)合具體場(chǎng)景解決問(wèn)題。
但進(jìn)入2026年,騰訊在AI C端上的動(dòng)作明顯變得頻繁:2月春節(jié)期間,“元寶”上線AI社交;3月推出“龍蝦陣”,微信開放ClawBot接口;4月上線AI影游產(chǎn)品探夢(mèng)DreamNow;5月上線Marvis。
所以,面對(duì)AI,騰訊并不是不焦慮。它只是把焦慮包裝得更克制。
這種焦慮并不難理解。現(xiàn)實(shí)情況是,整個(gè)AI行業(yè)都在面對(duì)同一個(gè)問(wèn)題:產(chǎn)品越來(lái)越多,入口越來(lái)越多,但真正能夠改變用戶習(xí)慣的殺手級(jí)應(yīng)用,還沒(méi)有完全出現(xiàn)。就像Marvis產(chǎn)品經(jīng)理直言,“坦白說(shuō),我們當(dāng)下真沒(méi)有殺手锏”。
這句話也解釋了Marvis的位置。它并不是騰訊已經(jīng)找到答案之后推出的產(chǎn)品,而更像是在答案尚未清晰之前,先把一個(gè)可能的方向推到用戶面前:讓AI從聊天框里走出來(lái),進(jìn)入電腦,接管文件、應(yīng)用和任務(wù)。
* 文中配圖來(lái)源于網(wǎng)絡(luò)
歡迎添加微信:cyxx-z
加入「有界UnKnown」科技交流群
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.