![]()
OpenClaw 是 AI 時(shí)代的 Linux,Violoop 想成為 Mac。
作者|蘇子華
編輯|鄭玄
如果你對(duì)最近火熱的「龍蝦」(OpenClaw)感興趣,那你可能會(huì)知道它依舊存在安裝門檻高、難用、安全存在巨大隱患的問題。
而 Violoop 是一個(gè)各方面加強(qiáng)版的存在。
簡(jiǎn)單講,Violoop 是一款巴掌大小的硬件,有一塊觸屏屏幕,用來顯示它當(dāng)前正在處理的任務(wù)。
這是一款即插即用的產(chǎn)品,不擠占電腦的 CPU/GPU資源,無需安裝任何軟件,一臺(tái)普通電腦通過一根 HDMI 線連上 Violoop,就能秒變「AI 電腦」,成為升級(jí)版「龍蝦」。
![]()
左下角為 Violoop,可以放置在桌面|圖片來源:Violoop
它內(nèi)置了常用的 Skills,沒有任何門檻,你可以指揮它 7x24 小時(shí)工作。當(dāng)然,它的特色不止如此,下文會(huì)詳細(xì)介紹。
Violoop 并非一個(gè)追逐風(fēng)口的項(xiàng)目。我們最早和他們交流的時(shí)候是在 2025 年的 11 月初,那時(shí) OpenClaw 還沒有誕生。而 Violoop 的起步也在更早的時(shí)候。
2 個(gè)月之后,OpenClaw 爆火,Violoop 也「意外」站上了風(fēng)口,火速完成了種子輪和天使輪的數(shù)千萬元的融資。
據(jù)悉,本輪融資將主要用于產(chǎn)品量產(chǎn)落地、全球市場(chǎng)推廣以及 Action Model 數(shù)據(jù)集的持續(xù)構(gòu)建。Violoop 產(chǎn)品即將于 4 月登陸 Kickstarter 開啟全球眾籌。
毫無疑問,它成為了當(dāng)下最為搶手的 AI 硬件項(xiàng)目之一。
Violoop 有兩位創(chuàng)始人。CEO Jaylen He 是一位連續(xù)創(chuàng)業(yè)者,畢業(yè)于 UC San Diego 的 CS 專業(yè),他的上一個(gè)項(xiàng)目,為留學(xué)生提供長(zhǎng)租公寓管理的服務(wù),曾入選過 YC 創(chuàng)業(yè)營(yíng)。
CTO King Zhu 是一位天才學(xué)霸,曾在 MIT 的 EECS 專業(yè)用 3.5 年完成本碩,同屆最快畢業(yè),后來在微軟的 Xbox、HoloLens、Surface 等多個(gè)業(yè)務(wù)線擔(dān)任核心工程師。
Violoop 的出現(xiàn),代表著 AI OS 的軟硬件形態(tài)遠(yuǎn)未定格,競(jìng)爭(zhēng)才剛剛開始。
01
只要一跟線,無需下載軟件,
讓普通電腦秒變升級(jí)版「龍蝦」
Violoop 要通過 HDMI 物理接入電腦的目的在于,可以無損、全量獲取「視頻流+操作系統(tǒng) API+HID 操作」完整數(shù)據(jù)鏈。
在設(shè)備聯(lián)動(dòng)上,支持 Telegram、飛書接入,團(tuán)隊(duì)也開發(fā)了專屬 APP,專屬 APP 的優(yōu)勢(shì)的是,能實(shí)現(xiàn) IM 工具無法實(shí)現(xiàn)的功能——實(shí)時(shí)查看接入電腦的畫面,觀察 AI 的操作過程。
![]()
通過手機(jī)發(fā)號(hào)指令,Violoop 的屏幕上可以顯示電腦上在運(yùn)行的任務(wù)|圖片來源:Violoop
「比如讓 AI 編寫前端代碼,HTML 文件在手機(jī)上無法預(yù)覽,用戶就能通過實(shí)時(shí)視頻流,直接查看效果是否符合需求。」
Violoop 的一個(gè)亮點(diǎn)是,它更有主動(dòng)性,真的「眼里有活」。
Jaylen He 介紹,「在確保安全性、具備控制主機(jī)能力以及感知用戶屏幕狀態(tài)的基礎(chǔ)上,主動(dòng)為用戶提供服務(wù)。」
比如,當(dāng) AI 看到用戶在電腦上整理發(fā)票,即便用戶不知道 AI 能做什么,AI 也會(huì)主動(dòng)推送詢問:「檢測(cè)到您在整理發(fā)票,是否需要接手幫您做自動(dòng)化?」或者看到用戶在 Bilibili 或 YouTube 上學(xué)習(xí) AI 相關(guān)視頻,它會(huì)詢問:「您對(duì)這個(gè)方向感興趣嗎?我們可以為您提供相關(guān)報(bào)告或收集其他視頻鏈接。」
Violoop 能看到用戶的操作,主要是基于他們自研的視覺模型,來識(shí)別屏幕內(nèi)容,并像人一樣操作電腦上的軟件。
這一設(shè)計(jì)主要是考慮到有很多軟件不提供 API、命令行接口,「我們一直遵循「能走命令行就走命令行」的原則。只有當(dāng)軟件沒有命令行接口時(shí),我們才通過視覺接管。」
作為對(duì)比,即便是一些 OpenClaw 沒有辦法操作的很古早的軟件系統(tǒng),Violoop 也能夠操作,大大擴(kuò)展了行動(dòng)范圍。
![]()
Violoop 的硬件參數(shù)|圖片來源:Violoop
在安全方面,Violoop 在設(shè)備里設(shè)計(jì)了一套雙芯片架構(gòu)。
主控芯片負(fù)責(zé)運(yùn)行 AI 和系統(tǒng)。而另一顆獨(dú)立的安全芯片,則專門負(fù)責(zé)權(quán)限審查。
比如:AI 想讀取文件,安全芯片可以自動(dòng)放行。但如果 AI 想刪除文件、發(fā)送信息、或者訪問敏感數(shù)據(jù),就必須經(jīng)過用戶確認(rèn)。
用戶可以通過手機(jī) App 或設(shè)備上的觸屏進(jìn)行審批。
這種設(shè)計(jì),本質(zhì)上是在 AI 和系統(tǒng)之間增加了一層「護(hù)欄」。
前段時(shí)間,Meta 安全部門的一位負(fù)責(zé)人在 Mac mini 上運(yùn)行 OpenClaw 時(shí),AI 誤刪了 2000 多封郵件。
這類問題在 Agent 時(shí)代可能會(huì)越來越常見。
而 Violoop 希望通過硬件層的設(shè)計(jì),把風(fēng)險(xiǎn)控制在更可控的范圍內(nèi)。
02
無需 prompt,看一遍就學(xué)會(huì)
另一個(gè)很有意思的設(shè)計(jì)是 Violoop 的技能學(xué)習(xí)系統(tǒng)。
它不需要用戶輸入任何 prompt,能夠看一遍用戶的操作、工作流,就學(xué)會(huì),然后自行升級(jí)。
方法很簡(jiǎn)單:用戶只需要在設(shè)備的觸控屏上向左滑動(dòng),即可進(jìn)入錄屏狀態(tài)。AI 會(huì)記錄整個(gè)操作過程,并提煉出一條完整的行為證據(jù)鏈:
用戶輸入了什么
操作系統(tǒng)做了什么響應(yīng)
GUI 界面發(fā)生了什么變化
這些數(shù)據(jù)會(huì)被打包發(fā)送到云端進(jìn)行分析。
隨后系統(tǒng)會(huì)把任務(wù)拆解成一系列步驟,并通過強(qiáng)化學(xué)習(xí)尋找更優(yōu)的執(zhí)行路徑。
值得注意的是,AI 并不會(huì)完全復(fù)刻用戶的操作。因?yàn)樵诤芏嗲闆r下,人類的操作并不是最高效的。系統(tǒng)會(huì)嘗試找到成本最低、成功率最高的執(zhí)行方式。
比如,「當(dāng) AI 知道了起點(diǎn)是『尋找文件』,終點(diǎn)是『發(fā)給微信好友』,它會(huì)學(xué)習(xí)如何以最低成本、最快速度、最高成功率完成任務(wù)。」
Jaylen He 說,「我們會(huì)設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù),鼓勵(lì) AI 盡量少地移動(dòng)鼠標(biāo)、少地通過截圖判斷,從而優(yōu)化執(zhí)行效率。」
最終生成一個(gè)可復(fù)用的技能。
03
Skills 可能是「中間態(tài)」,
個(gè)性化的端側(cè)模型是未來
在 Violoop 團(tuán)隊(duì)看來,當(dāng)下火熱的 Skills 更多是結(jié)構(gòu)化的文本,他們一方面建立便于用戶分享 Skills 的社區(qū),一方面也在探索一個(gè)更長(zhǎng)遠(yuǎn)的方向。
當(dāng)用戶錄制了足夠多的數(shù)據(jù),AI 對(duì)用戶產(chǎn)生足夠了解、累積了足夠的個(gè)人記憶后,團(tuán)隊(duì)計(jì)劃將這些專屬于個(gè)人的數(shù)據(jù),通過后訓(xùn)練的方式訓(xùn)練進(jìn)一個(gè)專屬的端側(cè)模型中。
「現(xiàn)在的 AI 記憶主要通過外部數(shù)據(jù)庫(如 RAG)提取,而未來端側(cè)模型可以直接內(nèi)化這些記憶和技能。這樣模型在理解用戶信息、記憶調(diào)取速度以及執(zhí)行技能的泛化能力上,都會(huì)有質(zhì)的提升。」
![]()
在共處的每一秒,它都在默默捕獲用戶的意圖與決策偏好,積累成屬于個(gè)人的「專屬記憶」|圖片來源:Violoop
也就是說,當(dāng)用戶積累了足夠多的數(shù)據(jù)之后,AI 不再只是調(diào)用工作流,而是直接把這些能力「內(nèi)化」進(jìn)模型里。
在這種情況下,每個(gè)人的 AI 都會(huì)逐漸變得不同。
它會(huì)記住你的習(xí)慣、理解你的工作方式,并逐漸演化成一個(gè)專屬于你的模型。
Jaylen He 說,他們想象的未來一定是「端側(cè)模型 + 云端模型」的組合,且端側(cè)模型會(huì)變得越來越高度定制化。
「就像現(xiàn)在的手機(jī)應(yīng)用更新,美團(tuán)更新了,所有人一并更新。但未來的軟件一定是高度定制化的,每個(gè)人的更新頻次和內(nèi)容可能不同。當(dāng)個(gè)人數(shù)據(jù)累積到一定量時(shí),它會(huì)自動(dòng)進(jìn)行一輪獨(dú)立的模型更新。」
無論對(duì)于用戶個(gè)人還是 Violoop 本身,這都會(huì)比單純的構(gòu)建工作流、Skills 分享社區(qū),更能夠構(gòu)建長(zhǎng)期護(hù)城河。
04
OpenClaw 是 AI 時(shí)代的 Linux,
Violoop 想成為 Mac
在比較 OpenClaw 和 Violoop 時(shí),Jaylen He 給出了一個(gè)類比:「OpenClaw 就是這個(gè)時(shí)代的 Linux,是開源的底層操作系統(tǒng)。」
Linux 之后沒有出現(xiàn)純軟件的 OS 能與之競(jìng)爭(zhēng),卻長(zhǎng)出了 Windows 和 macOS 這樣基于硬件分發(fā)的商業(yè)巨頭。
因此,Violoop 想做的是 AI 時(shí)代的 Mac,做軟硬一體的產(chǎn)品。
「我們認(rèn)為,下一代 OS 一定是『云端模型+端側(cè)模型』的組合。」
Jaylen He 表示,「云端大模型的算力成本極高,我們團(tuán)隊(duì)每天在自己軟件上的使用成本可能超過 1500 美金。通過端側(cè)能力,我們可以將多模態(tài)處理放在本地,既能節(jié)省成本,又能利用端側(cè)即時(shí)響應(yīng)和感知的優(yōu)勢(shì)。」
在這種形態(tài)中,云端大模型像 CPU,內(nèi)存像 DRAM,而端側(cè)模型則像 GPU,分?jǐn)偺囟ú糠值倪\(yùn)算。
多模態(tài)處理主要在本地完成,因?yàn)橐粢曨l傳到云端有傳輸時(shí)間,且云端處理多模態(tài)的成本更高。
端側(cè)模型理解內(nèi)容后將信息(如 JSON 格式)傳給云端,云端再進(jìn)行后續(xù)的推理和任務(wù)規(guī)劃。
除了電腦,Violoop 還可以輕易接入智能家居的 IoT 體系,比如控制燈光、音樂、空調(diào)等。
「現(xiàn)在智能家居有比較統(tǒng)一的協(xié)議,比如 HomeKit。我們把協(xié)議裝在硬件上,通過局域網(wǎng)掃描設(shè)備,就能直接進(jìn)行更新和控制。」
另外,他們?cè)谑謾C(jī)上運(yùn)行了一個(gè)安卓虛擬機(jī),來實(shí)現(xiàn)類似操控手機(jī)的功能。
這不是直接控制用戶的實(shí)體手機(jī),而是生成一個(gè)模擬環(huán)境,Agent 與其進(jìn)行底層交互。有點(diǎn)類似于「豆包手機(jī)」,但沒有實(shí)體。
他們團(tuán)隊(duì)介紹,如果用戶想用美團(tuán)或攜程,需要重新下載并登錄。因?yàn)檫@些應(yīng)用支持多設(shè)備登錄,登錄后它就像一個(gè)助手,可以幫您訂票或外賣。
到這里,一個(gè) AI 時(shí)代 OS 的雛形已經(jīng)變得清晰:電腦、手機(jī)、智能家居等任何設(shè)備都變成了這個(gè) OS 的物理外設(shè)。
換句話說,電腦只是它的一個(gè)入口。未來,這類產(chǎn)品甚至有機(jī)會(huì)成為整個(gè)家庭的 AI 控制中心。
05
「Violoop 在自我迭代」
Violoop 的起點(diǎn)源于自身的真實(shí)痛點(diǎn)——一個(gè)「偷懶」的需求。
23 年到 24 年期間,Violoop 團(tuán)隊(duì)主要在為世界 500 強(qiáng)等企業(yè)做端側(cè)模型的部署和微調(diào)。
Jaylen He 回憶,24 年年中,客戶的知識(shí)庫調(diào)取和商業(yè)決策類需求趨于穩(wěn)定,但需求非常零散且隨時(shí)可能進(jìn)來。「我們當(dāng)時(shí)不想一直守在電腦前,嘗試過 TeamViewer 或向日葵,但交互體驗(yàn)很差。」
于是,開始投入研究,最終在 2025 年中旬摸索到了現(xiàn)在的方向。
「近期最讓我們驚艷的,是我們的 AI 幾乎已經(jīng)實(shí)現(xiàn)了自我編寫。」
Violoop 團(tuán)隊(duì)發(fā)現(xiàn),他們只需框定研發(fā)范圍,為每個(gè) Agent 分發(fā)其負(fù)責(zé)的組件,AI 就能實(shí)現(xiàn)自我迭代。
目前,他們維持著「三天一次重構(gòu)」的驚人節(jié)奏。
「編寫代碼的 AI 先完成多輪自我編寫,并梳理出上百個(gè)測(cè)試用例,再由負(fù)責(zé)測(cè)試的 Agent 逐一完成并提交 issue。另一類 Agent 負(fù)責(zé)監(jiān)控并修復(fù) issue。最后人工進(jìn)行實(shí)際驗(yàn)證。」Jaylen He 說。
每次重構(gòu)后,代碼庫的行數(shù)大概能精簡(jiǎn) 20%~30%,能用更少的代碼、更精準(zhǔn)的編排實(shí)現(xiàn)同等的功能。
這種「自我進(jìn)化」的背后是真金白銀的投入——目前,團(tuán)隊(duì)大概有 20 個(gè)月付 200 美元的套餐用于代碼編寫,而測(cè)試環(huán)節(jié)只能通過 API 調(diào)用,日均 API 費(fèi)用大概在 1500 美元。
「我們團(tuán)隊(duì)的核心價(jià)值觀就是:能在算力上投入的資金,絕對(duì)不會(huì)吝嗇。」Jaylen He 認(rèn)為,「算力是這個(gè)時(shí)代賦予個(gè)人和團(tuán)隊(duì)最大的杠桿。」
對(duì)于 Violoop 的未來,團(tuán)隊(duì)表示,「我們對(duì)它的愿景和目標(biāo)是,當(dāng)產(chǎn)品發(fā)展到成熟階段時(shí),但凡是人類在電腦上能完成的工作,希望它都能自己完成。」
Violoop 的出現(xiàn),證明了個(gè)人 Agent 的形態(tài)、AI OS 的形態(tài)遠(yuǎn)未定格。
這種「不向現(xiàn)有生態(tài)妥協(xié)」的極客精神值得欽佩。它所代表的方向——軟硬一體、主動(dòng)式 AI、端云協(xié)同、高度定制化——或許也正是 AI 時(shí)代操作系統(tǒng)的正確打開方式。
不過,一旦進(jìn)入到「AI OS」的領(lǐng)域,各路互聯(lián)網(wǎng)、AI、手機(jī)、PC 等科技巨頭的后續(xù)入場(chǎng),這個(gè)戰(zhàn)場(chǎng)將有多卷,自然不必多說。
當(dāng)大模型的能力越來越強(qiáng)時(shí),這個(gè)最初的小工具,能否逐漸演變成一個(gè)新的基礎(chǔ)設(shè)施,一個(gè) AI 時(shí)代的計(jì)算平臺(tái),值得期待。極客公園將持續(xù)追蹤這一賽道的演變。
*頭圖來源:violoop
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO
極客一問
你需要有一臺(tái)自己的「龍蝦」主機(jī)嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.