讓AI讀個(gè)外部網(wǎng)站,換來(lái)一句"抱歉,我無(wú)法直接訪問(wèn)"——這種挫敗感,用過(guò)Agent的人都懂。
GitHub上有個(gè)開源項(xiàng)目,把這事徹底解決了:網(wǎng)站變命令行。目前20k+ Star,還在漲。
![]()
Reddit討論、B站熱門、Arxiv論文,以前開瀏覽器一個(gè)個(gè)翻的,現(xiàn)在終端一行命令直接出結(jié)構(gòu)化數(shù)據(jù)。更狠的是,它連微信、Telegram、Discord這些私域聊天記錄都打通了。
核心差異:本地執(zhí)行,零Token成本
這跟"讓大模型自己操作瀏覽器"最大的區(qū)別在于——CLI命令是在本地瀏覽器里直接執(zhí)行的,不經(jīng)過(guò)大模型推理。
意思是,如果不分析結(jié)果,運(yùn)行時(shí)就零Token消耗。同一個(gè)命令跑出來(lái)的結(jié)果結(jié)構(gòu)一致,可管道、可腳本,CI/CD友好。
某種程度上,它把瀏覽器自動(dòng)化從AI推理重新拉回系統(tǒng)調(diào)用。
私域數(shù)據(jù):聊天記錄變個(gè)人信息流
安裝很簡(jiǎn)單,Node.js 21+環(huán)境下一行命令:
npm install -g @jackwener/opencli
然后去Chrome應(yīng)用商店下載擴(kuò)展,打開開發(fā)者模式。不需要手動(dòng)配置cookie,它能直接復(fù)用Chrome的登錄態(tài)。
私域聊天統(tǒng)一在命令下調(diào)用:
? wx search——搜微信聊天記錄
? tg search——搜Telegram消息(基于MTProto協(xié)議)
? discord recent——查Discord最近消息
微信用的是獨(dú)立的wx-cli工具。首次使用需要wx init初始化,自動(dòng)檢測(cè)微信數(shù)據(jù)目錄,從微信進(jìn)程內(nèi)存里掃描數(shù)據(jù)庫(kù)密鑰。這個(gè)過(guò)程需要root權(quán)限,且微信必須處于登錄狀態(tài)。
初始化完成后,wx session拉會(huì)話列表,wx history精準(zhǔn)查找某個(gè)聯(lián)系人的歷史會(huì)話,還能直接搜關(guān)鍵詞。
輸出格式支持JSON和CSV,直接灌進(jìn)知識(shí)庫(kù)或數(shù)據(jù)分析流程,跟Obsidian這類工具接上也順理成章。
聊天記錄從散落在各App里的碎片,變成可搜索、可篩選、可導(dǎo)出、可自動(dòng)化處理的持續(xù)更新信息流。
辦公場(chǎng)景同樣覆蓋:lark-cli管飛書200多條命令,消息、文檔、日歷、任務(wù)全拿;wecom-cli管企業(yè)微信;dws管釘釘。
網(wǎng)友戲稱這是"電商人福音"——客服聊天記錄一鍵導(dǎo)出,用戶反饋批量歸檔,以前手動(dòng)截圖復(fù)制粘貼的活兒,現(xiàn)在一行命令搞定。
公域覆蓋:100+站點(diǎn)開箱即用
項(xiàng)目?jī)?nèi)置100+站點(diǎn)適配器。國(guó)內(nèi)平臺(tái):小紅書、B站、知乎、豆瓣、虎撲、貼吧;海外站:Twitter/X、HackerNews、Pixiv;學(xué)術(shù)搜索:Google Scholar、百度學(xué)術(shù);求職數(shù)據(jù):牛客面經(jīng)和薪資。
實(shí)際用法示例:
知乎搜"AI Agent"并下載文章:
zhihu search "AI Agent"
zhihu download —url "文章地址" —output ./zhihu
看Reddit今天討論啥:
reddit search "AI"
圖文/視頻/音頻一鍵下載,文章導(dǎo)出Markdown/CSV/JSON,頁(yè)面點(diǎn)擊、翻頁(yè)、表單填寫、批量爬取數(shù)據(jù),創(chuàng)作者數(shù)據(jù)、粉絲分析、評(píng)論區(qū)抓取——以前開瀏覽器點(diǎn)點(diǎn)點(diǎn)半天的事,終端里敲一行完事兒。
除了視頻下載需要裝yt-dlp,其他基本開箱即用。
擴(kuò)展機(jī)制:Agent幫你寫適配器
沒(méi)找到你要的站?項(xiàng)目給AI Agent準(zhǔn)備了adapter-author skill。
通過(guò)npx skills add jackwener/opencli —skill adapter-author安裝,Agent就能幫你自動(dòng)寫適配器。社區(qū)還有插件系統(tǒng),plugin install一鍵裝別人寫好的適配器。
更狠的一招:通過(guò)CDP協(xié)議,它能直接操控Electron桌面應(yīng)用的界面,不用手動(dòng)點(diǎn)鼠標(biāo)。
Cursor的Composer、聊天和終端,都能被自動(dòng)化接管。Composer寫代碼、聊天窗口發(fā)消息、終端跑命令——原本需要人眼確認(rèn)、手動(dòng)點(diǎn)擊的步驟,現(xiàn)在腳本直接驅(qū)動(dòng)。
這意味著Agent不僅能讀網(wǎng)頁(yè),還能操作你日常用的桌面工具鏈。
從"能訪問(wèn)"到"能操作"
這個(gè)項(xiàng)目的真正價(jià)值,是把"讓AI上網(wǎng)"從昂貴的推理任務(wù)變成了廉價(jià)的基礎(chǔ)設(shè)施。
以前Agent每動(dòng)一下瀏覽器都要燒Token、等響應(yīng)、賭成功率。現(xiàn)在確定性操作交給CLI,Token只花在真正需要理解、分析、決策的環(huán)節(jié)。
私域聊天記錄的打通更關(guān)鍵——那是AI以前根本碰不到的"暗數(shù)據(jù)"。工作流、關(guān)系鏈、協(xié)作歷史、長(zhǎng)期偏好,全藏在里面。
當(dāng)這些信息變成可搜索、可流式讀取的結(jié)構(gòu)化數(shù)據(jù),Agent才開始真正具備持續(xù)感知你數(shù)字生活的能力。
技術(shù)實(shí)現(xiàn)上,它用Playwright操控瀏覽器,通過(guò)Chrome擴(kuò)展復(fù)用登錄態(tài),私域數(shù)據(jù)則調(diào)用各平臺(tái)獨(dú)立的CLI工具。確定性操作本地執(zhí)行,不確定性推理交給模型——分工明確,成本可控。
目前項(xiàng)目還在快速迭代,社區(qū)適配器持續(xù)增長(zhǎng)。對(duì)于需要頻繁抓取數(shù)據(jù)、整合私域信息、構(gòu)建個(gè)人知識(shí)流的場(chǎng)景,這大概是現(xiàn)階段最務(wù)實(shí)的方案。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.