![]()
“「養蝦」,正在成為打工人的常態,因此也產生新的日常開銷,甚至新的風險和成本。”
撰文|程佳
編輯|翟文婷
小鹿向新莓回憶起不久前的一場AI小事故,仍然心有余悸。
小鹿在北京一家媒體負責運營,一個人管理著三個賬號。她對沒有用上AI智能體之前的生活有一個精準的形容,「每一項工作都不難,但加在一起就是搞死人。」刷信息流找熱點、匯總寫文案、配圖發布、回復評論……每天循環往復,停不下來。
「龍蝦」的出現,一定程度上讓她從這種瑣碎和重復中解放出來,但同時也給她帶來災難。
前段時間,小鹿養的「蝦」追了一個敏感熱點,自動發出去了,結果觸發「無形的手」干預,當天不僅帖子被刪,賬號也被限流三天。
小鹿不是個例。養一只「蝦」,正在成為越來越多打工人的常態,因此也產生新的日常開銷,甚至新的風險和成本。
國盛證券研報數據顯示,中國整體日均Token消耗在2024年初僅為1000億,到2026年3月已突破140萬億,兩年多時間增長了超過1000倍。
而根據IDC預測,中國活躍智能體數量將在2031年突破3.5億,年復合增長率高達135%以上,伴隨任務密度與復雜度提升,智能體Token消耗將迎來年均超30倍的指數級躍升。
Token,也正成為繼流量之后,又一項悄悄進入生活成本的基礎支出。
而這只橫空出世的「龍蝦」,究竟會成為打工人的效率杠桿,還是食之無味棄之可惜的新型吞金獸?
01 養蝦的甜頭和苦頭
年前,旁聽了一場業內關于AI應用的分享后,小鹿和同事在老板的號召下,試著搭建了一套小紅書自動化鏈路。
給「蝦」一句話指令,它自己去追熱點、寫文案、做封面、定時發布。「早上起來直接審稿就行,不用自己泡在信息流里了。」小鹿告訴新莓,這套流程解決了她日常工作大概七成的重復勞動,剩下的三成卡在封面上,「AI生成的圖總跟文案差點意思,而且平臺對AI圖有限流,所以還是得自己經手再過一遍。」
「蝦」是AI智能體在用戶圈子里的通行叫法。
與普通AI對話產品不同,它能自主規劃任務、調用外部工具、自動執行完整的工作流,不只是回答你的問題,還替你把事情做完。
2026年初,OpenClaw的出現成為這波熱潮的重要引爆點。這款可在用戶自有設備上運行的個人AI智能體助手一經推出即在全球廣受歡迎,GitHub星標數在極短時間內飆升登頂,超越了React、Linux等歷經數十年積累的開源傳奇。之后國內開始出現各種「蝦」同類或變種。
![]()
OpenClaw的Github星標數快速飆升;來源:OpenClaw社交平臺
數字足以說明這場熱潮的體量,背后則是職場打工人對「養蝦」無法抵擋的熱情。
獨立開發者陳博一個人負責維護好幾個項目,有些代碼因為年代久遠沒時間重構,但放著又心神不安,總擔心不知什么時候就卡BUG了。「重構要整塊時間,但整塊時間永遠擠不出來。」
浪潮來臨,陳博養了一只專門用于解決工作問題的蝦,把重構任務拆碎扔給蝦,「它能讀寫文件、執行Shell命令、SSH到其他機器,跟我自己在終端里能干的事基本一樣,我早上來看結果、審代碼、做決策。」
而且他讓這只蝦專門在夜間工作,原因很簡單,「閑時Token省錢,還不卡。」
如果說陳博養的是一只「實習程序員」,那上海的產品經理林然則給自己養了個「實習分析師」。以前,林然每個周末都要加班,花上幾個小時,刷遍知乎、小紅書和應用商店的評論,手動篩選出提到競品的內容,整理成報告,以便在周一例會上向老板匯報。
現在,他讓「蝦」每天早上自動跑一遍,把結果總結成簡報推送到飛書,他只需要做最后的審核。「之前都得靠自己收集整理,但現在自己只需要審核AI整理的結果即可。」林然坦言效率提升巨大。
同樣在上海,私募研究員張恒則用「蝦」來盯盤和篩選研報。他白天忙于開會和見客戶,無法持續監控市場,過去完全被動地依賴微信群里的信息流。現在,每天都會有一套定制化的市場信息簡報定時推送給他。
四個人,四種用法,但交給「蝦」的活兒卻高度一致,多為重復的、格式化的瑣事。正如麥肯錫2025年全球AI調查顯示,AI真正大規模滲透的場景,集中在流程清晰、標準化程度高、數據充分的領域。上述幾位養蝦用戶,無不如此。
然而,「蝦」也不是那么好「養」的。
小鹿遭遇AI事故之后,意識到「全自動發布風險太大。」她現在改成先把生成內容寫入文件夾,人工審完再發,「寧可多一步,不然連主號都得搭進去。」
林然踩的坑則是「信任過頭」。
有一次他讓「蝦」整理一份競品功能對比,輸出的內容看起來條理清晰、論據充分,但有兩個核心功能點竟是AI「幻覺」出來的,競品根本沒有。「我直接把報告發給了老板,好在我發現紕漏時老板還沒認真看報告,不然得當場社死了。」從那以后,他給自己立下鐵律,所有對外報告,涉及具體功能、數據和引用,必須人工進行二次核對。
張恒雖然自己還沒踩過坑,但一個發生在同事身上的案例,讓他當即就去重新檢查了自己的所有配置。
他的同事當時給「蝦」的指令是「檢查收件箱,給出存檔或刪除的建議,但在我批準前不要執行任何操作」,但因為郵箱信息量過大,觸發了AI的上下文壓縮機制,「蝦」把那句關鍵的「未經批準不得操作」忘掉了,開始無差別地刪除郵件。
聽聞此事后,張恒至今仍然后怕。他第一時間把自己的配置翻了一遍。所有刪除、發送、修改類操作的權限全部關掉,蝦只能讀取和整理,不能主動執行寫操作。
在這些「調教」過程中,其實都指向一個所有養蝦人必須接受的現實,即養蝦的前期成本,遠不止金錢。
02 養蝦之前,先算賬
先從一個最簡單的動作說起,一句「你好」大約消耗1.2個Token,開支不到1厘錢。
這個數字看起來微不足道,但當「蝦」開始自主執行一個囊括讀取文件、搜索信息、分析結果、生成報告的多步驟任務,便可輕松消耗數萬乃至數十萬Token。財新曾報道,一只「勤奮的蝦」,每天的Token開銷可以輕松達到數百元。
陳博掰著手指算過自己的賬:「月均開支穩定在兩三千,高頻月份沖到四千出頭。模型API占大頭,其次是云服務器的算力費用,硬件折舊還沒算進去。」但他對這筆錢的態度很坦然:「如果請實習生,最少三千塊,還得花時間帶。蝦不用帶節約溝通成本,甚至白天黑夜都能干。」
這筆賬能不能算贏,很大程度上取決于用的模型。
根據llm-stats.com的追蹤數據,GPT-4級別的API推理單價從2023年初約每百萬Token 30美元,三年間已降至不足1美元。但各模型之間的定價與能力差距仍然顯著,其中頂級國際模型如Claude Opus 4.6、GPT-5.4,每百萬Token輸入約108至180元人民幣;國產主流旗艦在8至15元之間;優化過的輕量級模型,則低至每百萬Token 1至4元。
值得注意的是,OpenRouter顯示,本月消耗量排名靠前的Qwen3.6 Plus(free)和Step 3.5 Flash (free),都依托免費或極低價格驅動了大量調用,說明性價比已成為決定流量分布的核心變量。
資深開發者和AI從業者花叔在《OpenClaw橙皮書:從入門到精通》中也提及如何「成本控制」,「從Claude Sonnet切換到『Sonnet→Haiku→DeepSeek』三級Fallback鏈,可以降低80%—95%的API成本。大部分簡單任務(問候、查天氣、簡單查詢)會自動走最便宜的模型,只有復雜任務才會用到主力模型。」
![]()
來源:《OpenClaw橙皮書:從入門到精通》
換言之,對于Token高消耗使用者來說,「分層使用」勢在必行。
陳博最初全程使用Claude Sonnet,兩個月后一算賬,發現近一半的簡單任務用更便宜的DeepSeek就足夠了,開始分層之后賬單立減一半。
他給任務定了明確的觸發規則,日常的代碼注釋、文件整理、日志分析,用DeepSeek V3.2,夠快夠便宜;需要多步推理的代碼review,用Claude Sonnet,在工具調用和指令遵循上更穩,一次跑對比反復返工要值錢得多;遇到系統架構設計才切Claude Opus,答錯了代價很高,費用會劇增。
張恒則按文檔長度分模型使用,像短任務處理就用DeepSeek,整份研報處理則用Kimi,「200K上下文是Kimi的核心優勢,一份研報塞進去不用分段」。而需要復雜推理任務時,張恒會手動切Claude Sonnet,「只訂閱了Claude的pro會員,所以平時會省著用。」
但就在用戶努力壓低成本的同時,價格正在從另一側悄悄上漲。
3月18日,阿里云宣布將平頭哥真武810E等算力卡產品價格上漲5%至34%,文件存儲CPFS同步上漲30%;百度智能云當日跟進,AI算力相關產品上調5%至30%,并行文件存儲漲約30%,兩家新價格均于4月18日起生效。再往前,騰訊云已大幅上調混元系列模型價格,其中混元HY2.0 Instruct模型輸入價格上調了463%。
顯而易見,這不是個別企業的定價調整,而是一場有結構性根源的全行業轉向。
中信建投證券計算機行業首席分析師指出,Token調用量暴漲直接推高算力需求,多模態生成技術進一步加速了這一趨勢。「以多模態生成為例,生成1分鐘視頻需消耗約10萬億Token,而國產視頻模型的價格已低至0.5至10元/5秒,商業化落地加速,算力供需失衡持續加劇。」
國聯民生證券在研報中更是一針見血地指出,「本次漲價標志著二十年來云服務價格只降不升的行業慣例被徹底打破。一旦云服務商在某一服務上成功提價而未引起大規模客戶流失,第二次、第三次漲價就會變得更容易。」
這意味著,用戶在模型側省下來的錢正在被算力側悄悄補收回去。而養蝦的賬,未來只會越來越難算。
03 龍蝦淘金熱,誰真正賺到了錢
這場來勢洶洶的「養蝦潮」,錢從哪來,又流向哪里?
目前來看,創業者、自由職業者、在大廠里用個人賬戶悄悄跑任務的C端用戶,構成了這個市場最活躍的消費群體。
B端并非沒有動靜,只是節奏比C端慢一些。麥肯錫2025年全球AI調查顯示,62%的企業已經在試驗AI智能體,但僅23%完成規模化落地,主要阻礙集中在「難以證明商業價值」和「集成準備不足」兩項。
眼下,這個僵局正在被打破。
2026年3月,阿里巴巴啟動內部計劃向員工提供Token額度,淘天集團「AI生產力計劃」向實習生全員開放。58同城董事長姚勁波向媒體透露,公司每天消耗接近2000億Token,「我甚至會問團隊,卡什么時候能用完,下一批什么時候買。」4月1日,康師傅、名創優品、安克創新、書亦燒仙草、晨光文具等12家企業集中宣布,將為優秀員工提供「無限Token」權益。
Token消耗,正在從個人自費的私人賬單,變成組織管理的一部分,那句「工資條上配發Token額度」的玩笑,也正步步走進現實。
OpenRouter平臺的實時數據,一定程度上能看出這場熱潮的大致流向。從本月應用消耗榜來看,上榜的幾乎都是編程與Agent工具,其中OpenClaw以20.3T tokens斷層領跑。
![]()
Token消耗量最大的應用 來源:OpenRouter
不過,榜單反映的是「誰在被使用」,而非「誰在賺錢」。
OpenClaw本身是開源免費的框架,不向用戶收取任何費用。用戶每一次通過它發起任務,背后消耗的每一個Token,實際上都在調用上游的模型API。也就是說,資金真正流向了模型廠商和云基礎設施提供商的賬戶,而非這些應用本身。
換言之,模型API廠商是最直接的受益者,也是直接賣「子彈」的人。
在這場「養蝦潮」中,國產大模型「雙雄」智譜和MiniMax走了兩條截然不同的路,卻指向同一個終點。
智譜走的是「提價」路線。2026年一季度智譜對API價格接連上調,累計漲幅達83%,相對上一代GLM-4.7價格接近翻倍;漲價之后調用量不降反升,市場依然供不應求。
MiniMax的打法則是「降本增效」。2026年2月,它推出專為Agent場景設計的M2.5模型。據《財經》引用測算,M2.5的單位Token成本只有OpenAI同類模型的四分之一,但面對中等復雜任務時可靠性與之接近。上線不到一周,M2.5便登頂OpenRouter平臺Token調用榜首。
兩種策略,殊途同歸。中金公司研報將此描述為,行業定價邏輯正從「流量消耗」轉向「算力價值變現」。
然而,消耗量在漲,利潤還沒跟上,卻是當下大模型市場最基本的矛盾,也是這場淘金熱最殘酷的底色。
3月31日,智譜交出了上市后的首份財報,2025年全年營收7.24億元,同比增長131.9%,凈虧損卻達47億元。MiniMax同期經調整凈虧損約2.51億美元,與上年基本持平。
相比之下,這場「養蝦潮」中的另一明確受益者云基礎設施廠商,似乎處境更好一些。
除了上述提及「云服務價格只降不升的行業慣例被徹底打破」外,騰訊云的變化最具代表性。
騰訊在2025年年度財報中寫道:「2025年我們保持了健康的增長,云業務收入加速增長并實現了規模化盈利。」這也意味著,從2013年騰訊云品牌正式推向市場算起,歷經十二年持續投入,騰訊云終于跨越了從「燒錢換市場」到「自我造血」的關鍵拐點。
而推動這一拐點提前到來的核心變量,正是AI智能體爆發所帶動的算力需求井噴。自主運行的Agent動輒觸發數十個推理循環,對算力、存儲、數據處理提出了更高需求,直接為云廠商帶來了前所未有的需求側動能。云廠商的收入結構也隨之改變,從過去賣一次性資源,變成了收持續性的「算力租金」。
對大廠而言,沒有一塊業務是孤立存在的。云服務消費增長的背后,也是大廠積極爭奪龍蝦入口的必然結果。
OpenClaw爆火之后,國內大廠幾乎都推出各種「龍蝦」。阿里推出「悟空」,騰訊發布QClaw和WorkBuddy,字節升級「飛書aily」,華為發布盤古Agent,百度推出文心智能體……短短一個月時間,市面上的「龍蝦」產品多達數十款。
這些產品本身大多并不直接收費,大廠入場的真實邏輯,是爭奪上游的算力消耗入口。
中銀證券研報中指出,「OpenClaw創造了全新的『模型消費場景』。一個配置合理的OpenClaw,每天可能會向模型發起數百次甚至上千次調用,并且每次調用時都攜帶完整的上下文信息。這意味著單個OpenClaw用戶產生的Token消耗量,可能是傳統聊天用戶的幾十倍甚至上百倍。」
更關鍵的是,用戶一旦完成智能體部署,就不會輕易離開。因為養成習慣的工作流、積累在平臺內的任務記錄與數據、與云端API的深度綁定,都在悄悄抬高用戶的遷移成本。
先燒出規模,再等待盈利的到來,這是所有玩家心照不宣的默契。「龍蝦」時代,依然難逃如此規律。
(應訪談對象要求,文中小鹿、陳博、林然、張恒為化名。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.