最開始以為,只是一次,不會怎么樣..
我已經回不去了
第一次用 Agent 處理合同的時候,我跟自己說,就這一次,試試。然后是郵件,然后是材料,然后是活動復盤。現在一個小時過幾十份文檔,手都不抖。以前一天的工作量,現在是熱身,總量翻了十倍還都覺得不夠。你知道最可怕的是什么嗎?我已經不記得以前是怎么干活的了...
![]()
我自己主力 Agent 是 Claude Code,最高級的會員,整天掛著不間斷地干活;承接這些活的容器是飛書,所有文檔、合同、郵箱、活動資料、酒吧物料都堆在那兒。中間用 CLI 連起來,Claude Code 自己讀材料、寫文檔、發郵件、改表格,完事退出
比如說我收到一份合同,文件會落在我的飛書郵箱里,Claude Code 通過 CLI 把它讀出來,對照存好的公司信息和常用條款逐條填好,再生成回執郵件草稿,我看一眼確認沒問題發出去,整個過程我只點了一下「發送」
昨天我坐高鐵從北京來上海,發現并沒啥事兒能做,就讓讓 Agent 把賽博禪心所有文章爬下來,一共 900 多篇,半個多小時跑完,數據整理進多維表格,甚至能通過「群發觸達」這個參數,來追蹤過去幾年的關注量增長
![]()
還生成了十幾張可視化圖表,也是我第一次能完整看到自己公眾號的數據:一共800+次推送,900+篇內容
![]()
(OpenAI 前幾天宣布 Codex 支持手機遙控了,我估摸著也會把 Codex 改造得趁手一些,先按下不表)
3 月底我寫過一篇飛書 CLI 的報道:,而現在這個 CLI 在 GitHub Star 過萬了,我已經重度成癮了,可以聊得更深一點
Agent 進了辦公系統
AI 和辦公系統的交互方式,過去幾年發生過幾輪變化
第一輪在 ChatGPT 之前,這時候能用到的模型還叫 davinci-003(你也可以把他叫做 GPT-3)....啊啊啊啊啊啊,我真是賽博老古董,然后這個模型被大家所熟知的 GPT-3.5 取代,并于 24 年初下線
![]()
當時有家 AI 公司叫 Jasper,年化營收一度做到上億美金,7 萬多付費用戶,算是最早的明星 AI 公司。按現在的話說,“這不就是個 GPT-3 的套殼嗎”
![]()
它的產品形態是這樣的,打開 Jasper 能看到 50 多個模板(Facebook 廣告、Google 廣告、產品描述、博客大綱、PAS 框架),點開一個,左側填字段(產品名、描述、目標受眾、語氣),右側生成幾段候選文案,挑一段復制粘貼到自己的工作環境里
![]()
第二輪是 ChatGPT 出來之后。2023 年 2 月 Notion 上線了 Notion AI,把 ChatGPT 的 API 封裝成插件嵌進文檔里,你在任何一個空 block 上按下空格鍵,AI 召喚面板就出來
![]()
選中已有文字按 Cmd/Ctrl+J,彈出 Ask AI 菜單,里面有「繼續寫」「改寫」「讓它更長」「讓它更短」「換語氣:專業/休閑/直率/友好」「翻譯」「總結」「找行動項」「修語法」。AI 在文檔當前光標位置直接生成結果,你點 Keep 接受、Discard 丟棄,或者再讓它改一次
![]()
第三輪是 2023 年下半年到現在,Word、Excel、PowerPoint、Outlook 這些主流辦公軟件把 AI 以插件或者側邊欄的方式插進了產品里,典型是 Microsoft 365 Copilot
![]()
但實際上 Copilot 這玩意兒做的一言難盡,倒是 Claude 做了很多不錯的嵌入,之前有聊過:;同時 Google Docs 里也做了很好的兼容
![]()
而在最近的時間軸里,我們看到了 CLI 的崛起:干活的時候可以完全不打開任何文件,Agent 通過 CLI 自己讀、自己寫、自己完成,對批量化的工作特別合適。這種趨勢在 OpenClaw 爆火后愈演愈烈
就比如開頭我舉例子的那個例子:郵件進來,Agent 通過 lark-cli mail 讀出來,用 lark-cli docs 去文檔里找相關材料,寫一份回復草稿存進草稿箱,甚至你可以通過飛書 CLI 給眾多地址進行批量的郵件發送,就比如在這里我演示的那樣:
![]()
日歷里有個會,Agent 用 lark-cli calendar 查參會人、lark-cli wiki 從知識庫里找相關歷史,生成議程發到群里;任務到期,Agent 讀對應文檔,生成進度報告寫進多維表格,再起一封匯報郵件
很多繁瑣需要來回切換環境的動作,現在通過 CLI 由 Agent 控制,形成了一條非常讓人舒爽的通路,甚至我可以在飛書里做備注,然后留給 Agent 幫我修改
![]()
之前的幾輪變化,AI 都嵌在某個具體的產品里(Jasper 的網頁、Notion 的文檔、Word 的側邊欄),但在 CLI 這輪中卻是反了過來,Agent 通過 CLI 進入用戶原本就在用的環境直接干活,然后交付
就比如上文的統計,在運行的過程中,我完全沒有打開飛書,更不會說去導入數據到表格里,只是告訴 Claude Code「去搞吧」,它通過 CLI 自己建表、自己定義字段、自己寫入記錄
![]()
多維表格當后臺
我有個暴論:Agent 時代,最好用的數據庫是多維表格
多維表格這個東西,它既能夠給人看,也可以通過 CLI 給 Agent 用,還有對非程序員很友好的 Constraint,這點非常重要。這里差個題外話,之前幫體制內的朋友用 excel 進行全國的業務信息統計,用的是 excel 表格,發出去的是一個版本,收回來的是幾百個版本,各種合并單元格與樣式美化
我真誠的期盼:能不能把「合并單元格」這個功能,從計算機課本里刪掉
![]()
限制填表人【在哪個位置】【以怎樣的格式填寫信息】【并且不該動表格】,真的是一件很麻煩的事兒。并且,在我的實操中,就是把表格凍結了、加上密碼了也沒用...會有小天才把表格內容復制出來,重新建一份,然后發給你
話說回來,之前我讓酒吧里的小伙伴做了個實驗:用多維表格控制屏幕切換
![]()
在飛書里上傳圖片
![]()
圖片會在屏幕中輪播
故事的起因是這樣:酒吧里很多塊屏幕,過去換圖非常麻煩,得登錄每塊屏幕的后臺、上傳圖片、調位置
![]()
那么不妨就用多維表格,把這些圖片或者網頁的信息記錄下來:每塊屏幕是多維表格里的一行,字段里放圖片或網頁鏈接,我在表格里放了圖或者點了某個鏈接,對應的屏幕就讀取并展示
![]()
這事兒搞完之后,我就有了個啟發:多維表格脫胎于數據庫結構,那它能不能直接當數據庫用,于是又有了后來的嘗試
比如酒吧的庫存管理:以打酒機庫存為例,能看到里面剩多少酒;酒槽位上加磁控牌,知道每一槽打出去了多少;為此我專門定制了一批能夠進行流量控制&監控的酒頭,進行實時感知;這些東西如果靠人盯庫存經常會過期、會亂,得專人盯,讓 AI 接手之后就規整得多
![]()
供應商那邊也在打通 API:很多的供應鏈是可以通過 API 的方式進行調用沒 API 的就讓店長當人肉 API,Agent 通過推送告訴店長今天要進什么貨,店長按推送下單,而我可以通過多維表格來監控所有的進度
![]()
更進一步的事我也在做:我正在手挫一套硬件,顧客對它說「明天我要一杯可樂」,需求會寫進多維表格數據庫,同時讓最鄰近的服務員過去服務;攝像頭看到哪兒臟了,也通過表格通知最近的工作人員;服務員每天做了哪些事,被規范化記錄下來。以后如果有機器人服務員,也可以通過這套方式調度
![]()
作為一個博主,我也在用飛書幫我去追蹤最新的信息,比如有啥可能的熱點新聞,或者有趣的東西,我都會第一時間收到通知。比如前兩天我報道的:,就是用這套追蹤系統監控到的
![]()
之前搞一個產品,我都會自己去手搭數據庫;而現在的話,我更傾向于用多維表格來做這個:既能給 AI 讀,也容易給人讀,AI 在背后更新數據,人在前臺掃一眼就知道發生了什么
對于 AGI Bar 的活動安排,我也用多維表格記錄。一場活動什么時候組織、什么時候舉辦、多少人參加、產生了哪些照片,全在一張表里,活動結束自動歸檔。以后我要做一份匯報材料或者展示材料,直接問 Agent 就行。比如:
![]()
Agent 從多維表格里讀活動數據,從文檔里讀詳細信息和圖片,組裝成一份海報,當我需要去做對外的活動報告的時候,就非常的方便
飛書 CLI
Claude Code 能進飛書,全靠 CLI
我是 Claude Code 的忠實用戶,非常習慣于拿他操縱各種東西。而這東西能能夠介入飛書,完全靠的是 CLI
PS:我也是忠實的賽博墻頭草,也很有可能調轉風向稱為 Codex 忠實用戶
PPS:我個人習慣于手挫各種東西,但大家也可以嘗試飛書自帶的aily智能伙伴,cli的能力是對齊的
這個項目的地址在這:https://github.com/larksuite/cli
![]()
然后這個項目上周拿到了上萬 star,目前已經 11.3k 了,這很合理
![]()
這東西的核心厲害點在于把每個業務域的能力都做成了 Agent 能直接調用的命令,配上一套給 Agent 用的語義和默認值。具體看它的三層命令架構:
第一層 Shortcut 命令帶
+前綴,比如+agenda、+messages-send、+create,人和 Agent 共用,內置智能默認值和 dry-run 預覽,日常用這一層就夠了;第二層 API Commands 跟飛書 OpenAPI 一一對應,覆蓋 200 多條命令;
第三層 Raw API 可以直接調飛書開放平臺的任意端點,覆蓋 2500 多個 API,Agent 遇到前兩層覆蓋不到的場景可以自己找路
![]()
每個業務域配一個 Skill,把怎么用這些命令的最佳實踐直接教給 Agent。裝完 CLI 之后跑一行 npx skills add larksuite/cli -y -g,Agent 就知道該怎么調用了;Agent 調錯了 CLI 會告訴它缺什么權限、怎么補,可能產生副作用的命令支持 dry-run 先預覽再執行
目前飛書 CLI 覆蓋 17 個業務域:消息、文檔、多維表格、電子表格、幻燈片、日歷、郵件、任務、知識庫、通訊錄、云空間、會議、妙記、白板、審批、搜索、Markdown,同時這里包含 200 多條命令,這讓 Claude Code 這樣的外部 Agent 進入飛書的成本變得很低,輕松把整套辦公能力接進自己的工作流
辦公軟件多了一個維度
過去評價辦公軟件,主要看人用得順不順,比如這個文檔好不好寫,表格好不好做,協作順不順暢,權限夠不夠細
但在 Agent 時代會多一個維度:Agent 能不能快速的接入這個辦公軟件,完全代替人來高度精準的操作
核心邏輯就是:給人用的是界面,給 AI 用的是接口。下一代辦公軟件必須具備一個能力,讓用戶能用自己的 Agent 代替自己完成操作
![]()
最后
哎...我已經回不去了
Agent 接住整套辦公流程之后,過去那種一切靠手的狀態就再也找不回來,文檔、合同、表格、郵件、活動、庫存都進出于此。對我個人來說,Agent 搭配著最爽的(我自己氪金氪到飛起的),也差不多就是飛書了
![]()
我就感覺,自己的整個鍵盤都長在 Agent 上面,替我干活,辦公平臺承接和呈現... 可能未來大部分的辦公都會變成這個樣子
之前寫的一些東西:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.