![]()
通過(guò) HDMI 接口來(lái) “看” 屏幕,通過(guò) Type C 接口來(lái) “操作” 鼠標(biāo)和鍵盤(pán)。
文丨祝穎麗
編輯丨趙磊
或許很多創(chuàng)業(yè)公司都該感謝 OpenClaw,它以一己之力,在不到 3 個(gè)月的時(shí)間里就快速完成了對(duì)用戶和投資人的關(guān)于 Agent 的市場(chǎng)教育。
Violoop 也趕上了這個(gè)風(fēng)口,這家 Agent 硬件公司去年底開(kāi)始融資,元旦開(kāi)始啟動(dòng),一個(gè)月的時(shí)間里就走到了第三輪,目前已經(jīng)在接觸最頭部的投資機(jī)構(gòu)。
Violoop 是一個(gè)形似縮小版臺(tái)式機(jī)的硬件,插在電腦上就可以通過(guò)對(duì)話遠(yuǎn)程指揮里面的 Agent 在你的電腦里干活——從結(jié)果上的確很像一個(gè)有了身體的 “龍蝦”。
![]()
但這家創(chuàng)業(yè)公司走到今天,并不是一個(gè)趕風(fēng)口的結(jié)果;他們也不打算講跟 OpenClaw 類似的故事。
Violoop 的兩位合伙人結(jié)識(shí)于 2019 年。當(dāng)時(shí)還在做留學(xué)生長(zhǎng)租公寓生意的何佳霖對(duì)于朱賢楨的印象是,“這哥們兒智商太高、技術(shù)太深了”,他一直想等一個(gè)跟朱賢楨合作的機(jī)會(huì)。
2022 年因?yàn)橐咔椋渭蚜卦诿绹?guó)的業(yè)務(wù)被迫結(jié)束;彼時(shí),朱賢楨也在不停試錯(cuò)、換項(xiàng)目的過(guò)程中,進(jìn)入一個(gè)空窗期。兩人一拍即合,決定合伙做些什么事情。
那是 ChatGPT 已經(jīng)出現(xiàn)并火爆的時(shí)間點(diǎn)。他們一邊探索做各種 AI 應(yīng)用(諸如用 AI 減肥、面試、做筆記和畫(huà)布等產(chǎn)品),一邊接下一家世界五百?gòu)?qiáng)的 AI 項(xiàng)目。
有了大客戶的錢(qián),還有實(shí)際的業(yè)務(wù)場(chǎng)景,他們比大多數(shù)的創(chuàng)業(yè)者幸運(yùn)。而更幸運(yùn)的是,正是這段給大客戶做項(xiàng)目的過(guò)程中,他們從自己的需求和實(shí)踐中發(fā)現(xiàn)了個(gè)人 Agent 的創(chuàng)業(yè)機(jī)會(huì)。一個(gè)如今他們看來(lái),可能是萬(wàn)億級(jí)別的市場(chǎng)機(jī)會(huì)。
為什么 Agent 要做成硬件?
Violoop 的起點(diǎn)也是一個(gè)跑在電腦里的軟件,正如如今的 Openclaw,只不過(guò)是通過(guò)郵件連接電腦——當(dāng)時(shí)兩位合伙人在給大客戶提供 AI 技術(shù)服務(wù)時(shí),經(jīng)常需要人工熬夜加班到凌晨,為了能讓大家少熬夜,他們開(kāi)始著手研發(fā)各種終端 Agent ,希望通過(guò)遠(yuǎn)程控制來(lái)實(shí)現(xiàn)工作的自動(dòng)化。
但產(chǎn)品做出來(lái)后,他們意識(shí)到,純軟件的 Agent 服務(wù),在安全上始終存在問(wèn)題;而且每一個(gè)任務(wù)都要推送到云端讓大模型理解,這在長(zhǎng)期使用上成本也會(huì)更貴;面對(duì)沒(méi)有開(kāi)放接口的產(chǎn)品和服務(wù),純軟件 Agent 可以用的辦法也更少。
硬件則在上述諸多問(wèn)題上都有更好的解決方案。
比如安全上,把 Agent 放在硬件里,可以通過(guò)芯片來(lái)做最后的攔截;執(zhí)行任務(wù)時(shí),硬件先完成一部分簡(jiǎn)單的事情——比如圖像識(shí)別——再把更難的事情交給云端模型,也能省很多錢(qián);至于那些沒(méi)有開(kāi)放接口的軟件操作,硬件 Agent 也可以模擬人的眼和手,來(lái)查看和操作你的電腦。
2025 年 6 月,他們正式從軟件 Agent 轉(zhuǎn)向做硬件類的 Agent。最終確立的硬件技術(shù)框架是:通過(guò) HDMI 接口連接電腦來(lái) “看” 屏幕畫(huà)面,通過(guò) Type-C 接口連接來(lái) “控制” 鼠標(biāo)和鍵盤(pán)的操作。
桌面版的 Violoop,定位為 “工作助手”——插上電腦(或者同一個(gè) wifi 下連接),它就能實(shí)時(shí) “看” 到并且學(xué)習(xí)你使用電腦的習(xí)慣、你的工作流程,持續(xù)學(xué)習(xí)后,它能夠幫你操作電腦,甚至在觀察后,主動(dòng)幫你工作。通過(guò)內(nèi)置軟件的連接,你還能在手機(jī)上隨時(shí)遙控它。
![]()
Violoop 工作原理
不同于如今市場(chǎng)上的一些 Agent 電腦, Violoop 并不想取代 Mac 或者是 Macmini;何佳霖說(shuō),它們最大的特點(diǎn)是跟主電腦配合,是讓一個(gè)實(shí)體 Agent 去操作工作電腦。
盡管思路不一樣,但給 Mac mini 裝上 OpenClaw 仍然是大多數(shù)用戶的選擇,也是他們必須面臨的競(jìng)爭(zhēng)。要賣出去,首先就得比 Mac mini 便宜。
為了將產(chǎn)品價(jià)格控制在 Mac mini 售價(jià)一半的水平,他們沒(méi)有采用市面上昂貴的直連 HDMI 芯片,而是自研了一款轉(zhuǎn)接芯片,在不犧牲算力的前提下將核心成本降到了 100 元人民幣左右。
其次,為了能讓用戶用得起,他們又找到了端云結(jié)合的方案,自己訓(xùn)練了本地模型,讓它可以識(shí)別不同軟件的圖標(biāo)、快捷鍵,以及判斷電腦目前所處的工作狀態(tài);處理完畢后只將提煉出的核心文本發(fā)給云端大模型,這樣可以大大降低 Token 成本。
在產(chǎn)品設(shè)計(jì)上,為了解決存儲(chǔ)焦慮,他們的硬件還設(shè)計(jì)了一個(gè)可拆卸的后蓋,允許用戶直接插入標(biāo)準(zhǔn)的固態(tài)硬盤(pán),最大可擴(kuò)展到 4TB,甚至比很多主電腦的容量還要大。
今年以來(lái),Openclaw 以開(kāi)源的形式爆火讓他們意識(shí)到,純軟件層的 Agent 更沒(méi)有機(jī)會(huì)了,就像當(dāng)開(kāi)源的 Linux 統(tǒng)一了操作系統(tǒng)后,只有裝到了 IBM 和戴爾里面的 Windows 以及本身就是賣硬件的 MacOS 才可以與之匹敵,“沒(méi)有其他的 OS 是以純軟件的形式挑戰(zhàn) linux 的。”
連續(xù)創(chuàng)業(yè)者,找到了一個(gè)大機(jī)會(huì)
何佳霖和朱賢楨成長(zhǎng)于完全不一樣的環(huán)境:何佳霖初高中隨父母來(lái)到非洲津巴布韋,12 歲起就在叢林環(huán)境中住校;朱賢楨則在上海長(zhǎng)大,一路都在最好的學(xué)校里當(dāng)天才學(xué)生。
但在底層追求上,兩人又出奇地一致,他們幾乎從第一天就覺(jué)得 “上班打工” 極其無(wú)趣,是天生的創(chuàng)業(yè)者。
何佳霖去美國(guó)讀大學(xué)時(shí),就成了加州最大的線下招聘會(huì)承包商;2015 年前后,他敏銳地捕捉到留學(xué)生租房需求,創(chuàng)辦了長(zhǎng)租公寓業(yè)務(wù),管理規(guī)模曾達(dá)到 2.5 億美金。
朱賢楨在 MIT 讀完芯片設(shè)計(jì)碩士后,只在微軟工作了一年,就發(fā)現(xiàn)自己無(wú)法忍受大公司每個(gè)人螺絲釘一樣的位置,辭職創(chuàng)業(yè),做過(guò)高效率的創(chuàng)業(yè)者工具、線下交友 App,甚至做過(guò) AI 芯片和區(qū)塊鏈業(yè)務(wù)。
但過(guò)去的折騰里,兩個(gè) 90 后都沒(méi)有抓住移動(dòng)互聯(lián)網(wǎng)最頂峰的機(jī)會(huì),只能在在一些被稱為 “生意” 和 “項(xiàng)目” 的事情里不斷地切換,直到 AI 的到來(lái),“這份遺憾,正好可以在這個(gè)最好的時(shí)代去付諸實(shí)踐了”,何佳霖說(shuō)。
過(guò)去的三年里,他們嘗試過(guò)很多 AI 相關(guān)的項(xiàng)目,直到找到了現(xiàn)在這個(gè)方向,他們才確定這是一個(gè)屬于自己的最大機(jī)會(huì)、一個(gè)萬(wàn)億級(jí)別的市場(chǎng)。
僅從硬件看,目前全球 20 億臺(tái)電腦中,他們推測(cè),哪怕只有二十分之一的人配備個(gè)人 Agent 硬件,他們的規(guī)模也能到達(dá) 1 億臺(tái)。
但賣硬件也并不是他們能想到的終局,他們看到的一個(gè)更有想象力的未來(lái)是結(jié)合個(gè)人化端側(cè)模型,做成一個(gè)模型 + Agent 軟件 + 硬件一體的公司。
具體推演邏輯是,他們可以先通過(guò)硬件采集個(gè)人的工作流和習(xí)慣,并在端側(cè)建立起專屬的邏輯記憶體。
當(dāng)累積了足夠多的數(shù)據(jù)后,他們會(huì)在端側(cè)設(shè)備上為用戶訓(xùn)練一個(gè)屬于自己的個(gè)人化小模型,這個(gè)模型會(huì)把用戶所有的記憶、習(xí)慣甚至性格都封裝在本地設(shè)備里。
他們堅(jiān)信,未來(lái)的操作系統(tǒng)一定是由這種結(jié)合了個(gè)人記憶、世界知識(shí)并且極其了解用戶的 “個(gè)人專屬 AI 模型” 來(lái)構(gòu)成的——就如同每個(gè)人擁有專屬的 Mac 電腦和 macOS 操作系統(tǒng)一樣。
不過(guò)在遠(yuǎn)景到來(lái)之前,首要的是先把產(chǎn)品賣出去。
Violoop 的產(chǎn)品目前已經(jīng)成型,接下來(lái)的一個(gè)月,他們會(huì)在 Kickstarter 開(kāi)始眾籌。
團(tuán)隊(duì)員工現(xiàn)在已經(jīng)是自家產(chǎn)品第一批用戶:他們的工程師用它寫(xiě)代碼,運(yùn)營(yíng)用來(lái)自動(dòng)篩選公眾號(hào)流量、抓取調(diào)研數(shù)據(jù),兩位創(chuàng)始人則利用 Violoop 自動(dòng)生成團(tuán)隊(duì)周報(bào),把十幾個(gè)人的任務(wù)進(jìn)展總結(jié)提煉,省去了冗長(zhǎng)的對(duì)齊會(huì)議。
除了桌面版的,他們目前還在研發(fā)一款帶磁吸功能的卡片版 Agent,可以單獨(dú)使用,成為配合手機(jī)的 Agent 助手;也可以與桌面版配合,通過(guò)這個(gè)硬件直接控制電腦。
雖然面臨的是一個(gè)大機(jī)會(huì),兩位合伙人都認(rèn)為自己并不追求在商業(yè)上成為最有影響力的那類人,對(duì)他們而言,更重要的是做一件前人沒(méi)做過(guò)、能突破對(duì)世界理解極限的 “酷” 事。
說(shuō)到這里,何佳霖?cái)]起袖子,露出他手上的一個(gè)圓形紋身,他說(shuō)自己曾經(jīng)覺(jué)得在地球這個(gè)圓里可以獲得無(wú)限的體驗(yàn),但后來(lái)意識(shí)到體驗(yàn)世界也可以是另外一種方式,“就是真的是找到一個(gè)前人沒(méi)有走過(guò)的路,或者在前人的肩膀上,去突破對(duì)這個(gè)世界理解的極限。”
以下是篩選后的部分問(wèn)答,與正文互為補(bǔ)充。
晚點(diǎn):你們的 Agent 跟 Openclaw 在 Agent 的技術(shù)框架上有什么不一樣嗎?
何佳霖:接入外部 IM 這種其實(shí)都是通用的,本身也都是開(kāi)放的接口,區(qū)別不大。
但我們主動(dòng)介入用戶工作生活,是有一套我們自己的基于視覺(jué)的機(jī)制,這個(gè)跟龍蝦的定時(shí)還是不太一樣,當(dāng)然定時(shí)我們其實(shí)也有。
然后記憶的實(shí)現(xiàn)方式我們跟龍蝦也不太一樣,他更多是基于文檔與向量數(shù)據(jù)庫(kù),我們是多了很多圖形數(shù)據(jù)庫(kù)的能力。
我們走 HDMI 線,可以實(shí)時(shí)捕捉用戶的電腦屏幕的變化,然后通過(guò)本地的視覺(jué)識(shí)別與 VLM 進(jìn)行理解與分析,在理解用戶正在使用電腦完成不同任務(wù)的意圖后,主動(dòng)向用戶提示我們可以為用戶自動(dòng)化完成與優(yōu)化。
例如用戶正在整理報(bào)銷截圖到飛書(shū),我們的 Agent 會(huì)告訴用戶,這件事兒我們看到了,要不要我們來(lái)幫用戶自動(dòng)化?或者看到用戶正在查詢某些類型的新聞或資料,我們會(huì)主動(dòng)告訴用戶,我可以為用戶去搜集更多相關(guān)的報(bào)道與調(diào)研報(bào)告。
晚點(diǎn):現(xiàn)在 Openclaw 大火,對(duì)你們的影響是什么?
何佳霖:其實(shí)在 Openclaw 出之前,我們就已經(jīng)寫(xiě)過(guò)一個(gè)文章,當(dāng)時(shí)定義的 Agent 的三大核心能力:一個(gè)就是主動(dòng)性,一個(gè)是記憶,然后一個(gè)就是這種跨平臺(tái)、跨軟件的交互,跟它的執(zhí)行能力幾乎一模一樣。所以它出來(lái)之后,我天吶服了……
晚點(diǎn):是覺(jué)得你們沒(méi)有先出,讓他們先火了嗎?
何佳霖:人家先火這倒不是太大的問(wèn)題,我還蠻認(rèn)可 Peter (Paypal 創(chuàng)始人)的一句話,就是 competition is for losers。就是我們選這個(gè)方向的時(shí)候,當(dāng)時(shí)就想說(shuō)挑一個(gè)沒(méi)人在干的事兒……但它火了之后,未來(lái)肯定會(huì)出現(xiàn)更多想要去跟我們競(jìng)爭(zhēng)的人,這個(gè)是一定的。
晚點(diǎn):那你們的產(chǎn)品跟 Openclaw 的關(guān)系是什么?
何佳霖:我們理解 Openclaw 可能就是這個(gè)時(shí)代的 linux,它是所有操作系統(tǒng)的底層。Windows、mac、安卓其實(shí)都是基于 linux 進(jìn)行二次開(kāi)發(fā)。只不過(guò)回顧那個(gè)時(shí)代,沒(méi)有其他的 OS 是以純軟件的形式挑戰(zhàn) linux,Windows 是封裝了 linux 之后,以 toB 協(xié)作的方式,把我的軟系統(tǒng)裝到 IBM 里面去,裝到戴爾里面,讓他們?nèi)?Windows 去做分發(fā)。而蘋(píng)果是我做一體,硬件自己做、軟件自己做,我的系統(tǒng)自己做。然后我去打造一個(gè)完整獨(dú)立的產(chǎn)品去賣給市場(chǎng)。
所以我們認(rèn)為 OpenClaw 出來(lái)之后,一定還是會(huì)有類似于像 Windows 或者像 Mac 這樣的一個(gè)機(jī)會(huì),他們一定是基于某種程度上依托于硬件,而純軟件的部分我認(rèn)為無(wú)法挑戰(zhàn)。
晚點(diǎn):一開(kāi)始你們應(yīng)該不知道 “軟件的部分無(wú)法挑戰(zhàn)”,為什么還去做了 Agent 硬件?
何佳霖:安全性、主動(dòng)參與到用戶生活跟工作當(dāng)中的感知力,外加上這種跨開(kāi)源閉源軟件端到端的處理能力,這些是我們認(rèn)為如果沒(méi)有硬件其實(shí)做不到的。
晚點(diǎn):除了安全,你們的 Agent 硬件還有什么比較核心的壁壘?
何佳霖:記憶能力。當(dāng)時(shí)給大客戶去做本地的這個(gè)知識(shí)庫(kù),一開(kāi)始用的就是那個(gè)向量數(shù)據(jù)庫(kù),但是他們數(shù)據(jù)量太大了,完全靠向量數(shù)據(jù)庫(kù)質(zhì)量也沒(méi)有那么高,所以我們又給配了圖形數(shù)據(jù)庫(kù)。
這樣的記憶方式,相當(dāng)于是把整個(gè)邏輯鏈條整理出來(lái),檢索的 Token 消耗量也會(huì)更少,因?yàn)樗呛芫劢沟摹?/p>
晚點(diǎn):現(xiàn)在也有一類是做 Agent 電腦的產(chǎn)品,想要未來(lái)可以取代現(xiàn)在的電腦,你們跟這類產(chǎn)品的區(qū)別是什么?
何佳霖:我們沒(méi)有想做一個(gè)獨(dú)立的 mac 是因?yàn)槲覀冋J(rèn)為更高價(jià)值的工作跟更高價(jià)值的軟件或者是文件,其實(shí)還都是在用戶的主電腦上。
所以我們當(dāng)時(shí)設(shè)計(jì)的就是怎么讓他去控制用戶的主電腦,這個(gè)是我們當(dāng)時(shí)設(shè)計(jì)的一個(gè)核心。這也是為什么我們給他設(shè)計(jì)了這個(gè) HDMI 的接口,以及這個(gè) Type C 的接口。
晚點(diǎn):為什么蘋(píng)果這樣擁有端側(cè)算力優(yōu)勢(shì)的巨頭,目前還沒(méi)有推出類似的 Agent 服務(wù)?
何佳霖: 理論上最得天獨(dú)厚的其實(shí)就是蘋(píng)果,但是蘋(píng)果有兩大戰(zhàn)略上的考量 。第一層就是安全性,如果蘋(píng)果提供一個(gè)服務(wù)并做了一些用戶沒(méi)想到的操作,對(duì)于蘋(píng)果的品牌是有很大影響的 。第二層是蘋(píng)果如果這么去做,某種意義上是在跟它的開(kāi)發(fā)者生態(tài)決裂 。它現(xiàn)在最大的無(wú)形資產(chǎn)是數(shù)以百萬(wàn)計(jì)的開(kāi)發(fā)者在免費(fèi)寫(xiě) App,如果它做一個(gè)統(tǒng)一接口讓 Siri 控制微信、控制 Photoshop,騰訊和 Adobe 肯定不會(huì)同意。
題圖來(lái)源:Violoop 創(chuàng)始人、CEO 何佳霖
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.