![]()
馬維斯形象照。圖片經(jīng)過AI處理
5月12日,應(yīng)用寶的Marvis團(tuán)隊(duì)介紹了中文名叫作“馬維斯”的Agent產(chǎn)品。
“它叫Marvis,蹭了一下Jarvis的概念。”產(chǎn)品負(fù)責(zé)人王秋陽說,“由于沒有牛馬這種動(dòng)物,我們就畫了一個(gè),去掉了馬的鬃毛,換成小牛角,它戴著騰訊系的紅圍脖兒,還蠻可愛。”
根據(jù)介紹,馬維斯可以歸類、解析文檔,智能分類識(shí)別、處理圖片,能修電腦(操作系統(tǒng)),市面上Agent能做的,馬維斯基本都能做,比如它能做的:對(duì)操作系統(tǒng)架構(gòu)、文件所有的理解,依據(jù)任務(wù)來調(diào)度模型、桌面操控手機(jī)應(yīng)用、移動(dòng)端“云監(jiān)工”等能力,其他Agent產(chǎn)品不一定現(xiàn)在就有。
![]()
馬維斯產(chǎn)品能力介紹
溝通會(huì)上提及最多的詞就是“操作系統(tǒng)層級(jí)AI助手”,我覺得它可以用來概括馬維斯的核心能力。
“我們是一個(gè)貫穿于操作系統(tǒng)層級(jí)的AI、個(gè)性化的 AI 助手,而不是一個(gè)像 AI PPT,或者像類似于做一個(gè)龍蝦(Openclaw)一樣的產(chǎn)品。”馬維斯業(yè)務(wù)負(fù)責(zé)人蔡建濤說。
演示各種電腦操控的時(shí)候,我的感受是:哦,原來這是一個(gè)可以“修電腦”的Agent。
但準(zhǔn)確一些的說,可以把馬維斯看做是一個(gè)掌握系統(tǒng)“資源管理器”的AI助手——用戶能夠直接用它管理文件、理解文檔、修改設(shè)置、執(zhí)行任務(wù),甚至操作Android應(yīng)用。
可能有不少朋友用過NAS,現(xiàn)在很多NAS也有一些基礎(chǔ)的智能引擎來管理存儲(chǔ)里面的圖片、文件了,馬維斯就像這樣一個(gè)產(chǎn)品,但它可以直接“套”在你的電腦上,而且裝上就能干活,無需費(fèi)勁去找skills。
01 馬維斯能做的事情
一個(gè)對(duì)話框,一個(gè)工具列表,一個(gè)會(huì)話歷史,就是馬維斯的產(chǎn)品輪廓,你要強(qiáng)行從“長相”上找出它與其他Agent助手有什么分別,不一定有答案。
馬維斯業(yè)務(wù)負(fù)責(zé)人蔡建濤說:“可能讓大家覺得就像很多AI產(chǎn)品都是一個(gè)框,Chatbot是一種類型,編程工具IDE是一種類型,這些都可以不要,希望用戶將來在某一個(gè)設(shè)備里,通過簡單的語音對(duì)話,它就可以完成你需要的大部分的操作。”
這是蔡建濤的遠(yuǎn)期目標(biāo),但現(xiàn)階段馬維斯能做的,是一個(gè)成為Agent版“資源管理器”——接入系統(tǒng)來管理文檔、圖片、生成內(nèi)容、執(zhí)行任務(wù)。其中,文檔分成課件數(shù)據(jù)、簡歷報(bào)告、合同書籍、票據(jù)證明等,圖庫可根據(jù)圖像的Meta信息、圖像含義、OCR文字等進(jìn)行主題歸類。
客觀地說,這些能力其他Agent現(xiàn)在也都能做。
不過,馬維斯有一點(diǎn)不同:它可以利用路由機(jī)制,自動(dòng)分配不同重量級(jí)的任務(wù)給不同的模型,一部分模型在本地,拔網(wǎng)線也可以用。
我在很多稿子里都提到過“燒Token”的困擾,馬維斯試圖從產(chǎn)品層面解決“Token消耗”問題,當(dāng)然,這也要求硬件足夠“硬”,因?yàn)樗A(yù)裝了很多本地模型。
問題是,為什么馬維斯要這么做?
還是前面說的“系統(tǒng)級(jí)”這個(gè)原因——應(yīng)用寶與操作系統(tǒng)、底層硬件提供商保持著長期的合作,即便是小模型都能夠得到快速的適配,并且能夠獲得訪問系統(tǒng)底層的授權(quán)。
所以,馬維斯像一個(gè)能“修電腦”的Agent,但又與市面上的產(chǎn)品不同,由于Windows系統(tǒng)、硬件對(duì)馬維斯開放了訪問權(quán)限,它可以讀到軟、硬件的信息。
![]()
馬維斯核查電腦配置演示
產(chǎn)品負(fù)責(zé)人王秋陽演示了一個(gè)Demo,用戶想玩“黑猴”,但不知道硬件能否帶得動(dòng),馬維斯可以感知電腦硬件配置,然后聯(lián)網(wǎng)搜索游戲的配置要求,再向用戶反饋結(jié)果。
還有一個(gè)我覺得不錯(cuò),王秋陽在現(xiàn)場一再強(qiáng)調(diào)不是很高頻,但又很有效的能力——關(guān)Windows廣告。
![]()
通過馬維斯關(guān)閉Windows系統(tǒng)廣告
同樣的問題,你問聊天機(jī)器人,它會(huì)給你一步步的文字指南,但不會(huì)替你去做;其他Agent類產(chǎn)品,可能也會(huì)去做這件事,但中間可能會(huì)要很多授權(quán),有些模型還會(huì)一頓表演性輸出,給你提供小作文,最后索要權(quán)限,或者是提供一行代碼讓你自己“終端”執(zhí)行。
馬維斯在接到指令之后,是真的去把這個(gè)“關(guān)廣告”任務(wù)給做了。
還有一個(gè)不錯(cuò)的能力:針對(duì)存在隱私需求偏好的用戶,馬維斯提供了“隱私模式”,完全將任務(wù)固定在端側(cè)模型上運(yùn)行,就像前面說的,不需要聯(lián)網(wǎng)。
“一些組織內(nèi)部,特別是財(cái)務(wù),處理數(shù)據(jù)的時(shí)候要拔網(wǎng)線, HR也不方便直接用云。”產(chǎn)品負(fù)責(zé)人王秋陽解釋推出基于端側(cè)模型的“隱私模式”的初衷。
另外,桌面端操作手機(jī)應(yīng)用,也是馬維斯的亮點(diǎn)之一,這也是應(yīng)用寶的老“藝能”。
在桌面端跑Android應(yīng)用,意味著很多任務(wù)用戶不再需要切回移動(dòng)端,比如簽到打卡。甚至如果未來一些內(nèi)置打卡領(lǐng)豆子的游戲,馬維斯也能替你去做這件事。至于此前習(xí)慣被拿出來做案例展示的在外賣、小程序上點(diǎn)飲料這種操作,就更加容易了。
根據(jù)產(chǎn)品團(tuán)隊(duì)介紹,馬維斯在桌面端操作移動(dòng)應(yīng)用,不會(huì)和用戶搶鍵盤鼠標(biāo),而且可以多開,所以只要你的硬件性能夠強(qiáng),應(yīng)用接口足夠豐富,馬維斯這種桌面Agent,很有可能幫助PC產(chǎn)業(yè),從移動(dòng)設(shè)備手中,“搶”回一部分用戶使用時(shí)長。
02 它有什么不一樣?
前面雖然說馬維斯的界面和市面上的產(chǎn)品差不多,但其實(shí)從這款產(chǎn)品上,還是可以看到一些新穎的元素——一個(gè)卡通風(fēng)格的Agent工作室,根據(jù)Agent的角色、工作狀態(tài)不同,設(shè)置了不同的動(dòng)效。
![]()
馬維斯和它的Agent小伙伴
Demo演示的時(shí)候,官方演示了一個(gè)“團(tuán)戰(zhàn)”的畫面——預(yù)設(shè)的6個(gè)Agent組成了一個(gè)小團(tuán)隊(duì),包括戴紅圍脖的團(tuán)隊(duì)主Agent,戴綠圍脖的電腦操作Agent等等,甚至還有Agent在“閑聊”。
“他沒有什么正事兒干,一會(huì)兒可能會(huì)去上廁所,或者是喝咖啡,或者跑步,有時(shí)候他會(huì)交流一些實(shí)操的經(jīng)驗(yàn)。”
介紹到這個(gè)點(diǎn)時(shí),現(xiàn)場哄堂大笑,當(dāng)時(shí)我就在想,能讓大家都笑起來,說明這就是一個(gè)能夠引起用戶關(guān)注的特色。
“我們知道具備執(zhí)行能力的AI Agent是完成大量長程或者中長程任務(wù),時(shí)間稍微長一點(diǎn),比如分鐘級(jí)別的任務(wù),用戶就是會(huì)等待,這個(gè)時(shí)候就需要有一些信息呈現(xiàn)。”馬維斯團(tuán)隊(duì)這樣解釋給Agent畫了一間卡通風(fēng)格的辦公室,設(shè)置不同的角色和狀態(tài)的思考。
視覺差異和用戶體驗(yàn)不強(qiáng)相關(guān),真正的差異還是一直提及的“操作系統(tǒng)層級(jí)Agent助手”概念。
“我們天然是一個(gè)貼近硬件,貼近生態(tài)的團(tuán)隊(duì)。馬維斯不是一個(gè)拍腦袋想出來的概念產(chǎn)品,它是團(tuán)隊(duì)在既有基因和生態(tài)位上‘長’出來的。”產(chǎn)品團(tuán)隊(duì)如此介紹。
據(jù)了解,馬維斯背后的應(yīng)用寶團(tuán)隊(duì),與微軟、英特爾和高通產(chǎn)研團(tuán)隊(duì)深度協(xié)作,專門優(yōu)化端側(cè)模型的推理效率。
大家使用聊天機(jī)器人,Agent助手,最常用的功能就是給他上傳文檔,對(duì)吧,在馬維斯這個(gè)產(chǎn)品里面,不需要上傳這個(gè)動(dòng)作,因?yàn)樗旧砭褪且粋€(gè)“資源管理器”,所以整個(gè)操作系統(tǒng)對(duì)它來說,就是一個(gè)分門別類的知識(shí)庫,而這就是得益于馬維斯團(tuán)隊(duì)與合作伙伴協(xié)同研發(fā)的動(dòng)作。
這也是為什么我會(huì)認(rèn)為馬維斯是一個(gè)“占領(lǐng)”資源管理器的Agent,有機(jī)會(huì)收割一部分移動(dòng)產(chǎn)品的使用時(shí)長。
按照產(chǎn)品團(tuán)隊(duì)的說法,馬維斯的能力自底向上,先做文件(解析、轉(zhuǎn)換、搜索、索引),再做應(yīng)用(把商店做成一個(gè)MCP,支持查詢、安裝、下載、卸載、打開、退出),再做系統(tǒng)操作(可以直接修改系統(tǒng)設(shè)置、診斷問題、修復(fù)故障),最后搭A(yù)gent框架。
“整套系統(tǒng)沿著大概規(guī)劃的路徑推進(jìn),到了25年12月份,我們已經(jīng)回不了頭了,不會(huì)再去切成Hermes、OpenClaw這樣的框架。”王秋陽說。
03 一個(gè)選Marvis的理由
前有蝦、后有馬,為什么還要再裝馬維斯這個(gè)“牛馬”?
在溝通會(huì)上被問到這個(gè)問題時(shí),馬維斯團(tuán)隊(duì)坦誠地表示,他們也沒有“殺手锏”式的一句話答案來告訴用戶必選馬維斯。
就如同我們前面所說,從用戶界面、功能上,大家看上去沒有什么本質(zhì)的不同,同類型的功能不存在A能做,B做不了的問題。比如現(xiàn)在的電腦操控(Computer Use)、瀏覽器操控(Browser Use),各家其實(shí)都在做,常規(guī)的能力大同小異。
用戶在體感上很難感受到大家技術(shù)路線的差異,或者說不需要知道這種差異。
各種Agent產(chǎn)品,最后PK的無非就是同一種功能的前提下,誰能操作更準(zhǔn)確、交付結(jié)果更快,以及現(xiàn)在大家最關(guān)心的:誰最省Token。
站在馬維斯產(chǎn)品團(tuán)隊(duì)的視角,他們考慮的除了提供一個(gè)“殺手功能”之外,更傾向于提供一個(gè)長鏈條的場景化能力來吸引用戶。
“比如電腦上的證件照目錄,你點(diǎn)進(jìn)這個(gè)目錄來能干嘛?要辦簽證?辦駕照,或者是你要裁這個(gè)圖,換黑白底變藍(lán)底?那我就把相關(guān)的能力放在這個(gè)入口,你點(diǎn)進(jìn)來的時(shí)候大概率就是需要它,這其實(shí)就是場景化的滲到你原有的使用習(xí)慣當(dāng)中。”
另外,關(guān)于馬維斯的生產(chǎn)力屬性,問到的也比較多。
前面提到了很多文檔相關(guān)的能力,這其實(shí)就是生產(chǎn)力的一部分,所以我認(rèn)為大家這么問,是想了解馬維斯在編程方面的生產(chǎn)力表現(xiàn),畢竟,這也是目前AI工具提效最有共識(shí)的領(lǐng)域。
“在辦公這個(gè)分支我們投了很多精力,包括說可能文檔的格式轉(zhuǎn)換、編輯總結(jié)這一系列的東西,編碼這塊我們就不怎么花精力。”馬維斯業(yè)務(wù)負(fù)責(zé)人蔡建濤在現(xiàn)場告訴大家,“我們文檔能力絕對(duì)比市面上 95% 的都好很多,不會(huì)把辦公所有東西做全,因?yàn)樽鋈珜?shí)在是太難了。”
馬維斯的端側(cè)隱私模式,也是現(xiàn)場大家重點(diǎn)“圍觀”的能力,所以也收到了很多追問。
如前面提到,開啟這個(gè)功能可以在不聯(lián)網(wǎng)的情況下使用模型,有人問這和效率模式有什么差別,我的第一感受就是,模型的尺寸不同,能力肯定有差異,本地端側(cè)模型肯定無法和云端大模型直接對(duì)比,但端側(cè)模型到底能做什么,特定的能力項(xiàng)有哪些,我認(rèn)為需要在產(chǎn)品中,明確告訴用戶,方便用戶在實(shí)操中對(duì)應(yīng)選擇。
除了能力差別,端側(cè)模型“零token消耗”,也是優(yōu)勢項(xiàng),就意味著省成本嘛。
04 寫在最后
舊時(shí)代做產(chǎn)品,要做得足夠好才發(fā)布;但AI時(shí)代節(jié)奏太快了,做不到完美再發(fā)布,產(chǎn)品要邊做邊迭代。
按照馬維斯團(tuán)隊(duì)的說法:2025年12月,他們從上到下、從下到上兩頭搭好框架之后,判斷這個(gè)東西“是時(shí)候面向用戶了”,于是選擇在2026年5月把這個(gè)產(chǎn)品推出來。
所以,現(xiàn)在大家看到的,只是馬維斯的一個(gè)雛形,未來還會(huì)有很多新能力。
只不過,從“操作系統(tǒng)層級(jí)的AI助手”這個(gè)角度來看,未來的能力都將集中在這個(gè)定位上。就像我們前面概括的:它是一個(gè)掌握了資源管理器的AI Agent——不止能對(duì)話,還能操作;不止能回答,還能執(zhí)行;不止在云端,還在你的電腦里。
來源 | 騰訊科技(ID:qqtech)
作者 | 蘇揚(yáng) ; 編輯 | 呼呼大睡
內(nèi)容僅代表作者獨(dú)立觀點(diǎn),不代表早讀課立場
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.