无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

平民玩家,開始玩兒不起AI了

0
分享至

2026年4月12日,智譜Coding Plan(海外版)月付價格幾乎翻倍

第二天,阿里云宣布取消百煉平臺基礎套餐的續費入口。

其他廠商并沒有在漲價上落后,4月9日,騰訊云AI算力全線上調5%

這場漲價潮,代表著AI產業正從"流量獲客"的互聯網時代,迅速滑向"算力通貨緊縮"的重工業時代

之前為了吸引用戶,大模型大打價格戰。現在token使用量猛增,從大模型到云廠商,都看到了賣token能夠跑通的盈利模式,也該提價收回此前的成本了。

在洶涌增長的token需求面前,算力供應極度吃緊,漲價就順著產業鏈不斷向下游傳導,承受成本的終端就是中小型開發者和普通用戶。

智能體撞開了算力閘門

我國日均token調用量,今年三月已經超過了140萬億,相比2024年初的1000億增長了1000多倍,比起2025年底的100萬億,三個月內也增長了40%。

最近三個月的猛漲,主要得益于以OpenClaw為代表的智能體,讓它們自動工作要消耗大量token,以至于有相當一批人體驗了OpenClaw后,大呼token消耗太厲害,快沒錢燒了,只好卸載了事。

token消耗量猛增,意味著算力大幅消耗,傳導到上游就是AI芯片遭到哄搶

根據SemiAnalysis,英偉達H100的一年期租賃合同價格從2025年10月的1.70美元/小時/GPU飆升至2026年3月的2.35美元,漲幅近40%。

上漲的可不只有GPU價格,就連AI服務器調度與推理核心的CPU也在被搶購,2026年3月下旬,英特爾與AMD相繼通知客戶上調處理器價格,這兩家今年服務器CPU產能已基本售罄。

成本壓力沿著"芯片-云廠商-模型廠商-應用廠商-企業客戶"的鏈條層層下傳。

Cursor是全球最大的獨立AI代碼生成平臺,2026年2月年化收入突破20億美元,看似風光,實則2025年虧損至少1.5億美元。

其幾乎所有收入都被用于調用Anthropic和OpenAI的模型,毛利率被壓縮至令人窒息的水平。

傳統SaaS軟件公司毛利率中位數高達77%,現在AI大模型和應用卷死了傳統軟件公司,可AI應用的平均毛利率僅為25%至60%

所以大模型只能漲價,把成本繼續往下游傳導,此前價格戰給的福利要收回,這一風氣也不是國內先開始的。

2026年4月初,全球領先的大模型廠商,已經估值數百億美元的AI巨頭Anthropic,突然切斷訂閱用戶通過OpenClaw等第三方工具接入Claude API的許可。

官方解釋直白赤裸,部分重度用戶每月僅支付200美元訂閱費,卻消耗了價值5000美元的算力資源

一個OpenClaw代理運行一天,背后的算力成本在1000至5000美元之間,用戶還是趁早別白嫖自家服務,該去切換至按用量付費的API模式,不然連Anthropic都頂不住。

token浪費觸目驚心

大模型漲價,用戶肉疼之余也在疑惑,這token就非得燒這么多嗎?

今年3月,就有一位名為shelvenzhou的開發者在GitHub上進行了一項基準測試,記錄自己使用OpenClaw處理日常工作的Token消耗軌跡。

第一輪對話成本0.0050美元,很是省錢。

第五輪飆升至0.0665美元,不大對勁。

第十輪達到0.13美元,是個人意識到了,燒的錢根本不是一點點增長,而是指數級爆炸

像癌細胞一樣,每一輪分裂都在加速吞噬算力資源。

為什么token消耗會隨著對話次數增多而指數爆炸呢?

了解OpenClaw等智能體的工作原理,就能理解token消耗量指數增長,是因為“上下文的無序膨脹”

隨著對話輪次增長,歷史文件、對話記錄不斷累積,智能體為了尋找相關信息,往往只能采取"寧可錯殺一千"的策略,把所有文件都讀一遍。

用戶每次輸入后,Agent甚至可能需要重新計算完整的對話記錄和文件數據。這導致智能體成本指數級增長,正如shelvenzhou測試的那樣,第10輪對話的成本已是第1輪的26倍

聰明的你自然會想到,這么多消耗的token里有相當一部分是浪費掉了。

《財經》統計,今年一季度,GitHub上有關“Token Waste”(token浪費)的問題,數量沖到了超過4000多個,比起上個季度增長了快五倍。


數據來源:財經

天下苦token浪費久矣。

讓人人都能用得起智能體

想要用token少花錢,一個辦法是多提供芯片,把芯片成本降下來。

然而國產AI芯片產能仍然被卡脖子,3月底華為昇騰服務器系列也漲價了,910C(A3)1TB內存版本單臺大概上漲16萬至32萬元,2TB版本漲幅在32萬至48萬元之間。

還有一個辦法,就是優化智能體,讓它不要再浪費那么多token了

目前有個成熟做法是“KV Cache”(鍵值緩存)技術。

這項技術原理也簡單,模型對已計算上下文的結果進行緩存,以免下次調用重復計算消耗token。

還有一個辦法,就是做好模型分工,token用在刀刃上

復雜規劃用旗艦模型保證準確,簡單的高頻執行交給輕量模型即可。

OpenAI的Codex升級已經體現了這種分層邏輯:GPT-5.4負責規劃、協調與最終判斷,而GPT-5.4 Mini子智能體則并行處理代碼庫檢索、大文件審閱等細粒度任務。

不管哪種方法,都說明目前的智能體仍然處于起步階段,還很不成熟,就像一批天不怕地不怕的小馬駒,雖然最終能跑到終點,但過程中會到處亂跑消耗體力。

所以最近harness在AI圈子里火了

Harness原意是馬具,放在這里就是指約束智能體,讓它更省力地跑到終點,這涉及到給模型調用什么工具、如何做分層的上下文工程、如何管理長記憶、如何設計工作流。

從這個意義上說,在智能體從"能跑"進化到"越跑越穩"的harness時代,能做的工作還有很多。誰能用更少的token完成同樣的任務,誰就能在AI產業的殘酷洗牌中存活

token經濟的正向循環不會自動形成,想要用戶用得起,還是得減少浪費,讓大家都玩起來。

否則,2026年智能體普及年的狂歡,將在算力不足,擠出普通用戶的過程中落幕。

參考資料:

AI漲價潮:智譜海外版“直逼”Claude,阿里云取消基礎套餐,四年前的H100也賣光了 https://mp.weixin.qq.com/s/VJzaTh9rHAawssltU3FaFQ

阿里、騰訊、百度集體調價,Token第一股年內狂飆547%,算力漲價潮來了 https://mp.weixin.qq.com/s/s6LoLAD3WvhN1-QdNi_hDg

從“龍蝦”到“愛馬仕”,Agent越能干Token越費錢 https://mp.weixin.qq.com/s/40lUY9JWuxq6EryEkImK-Q

Elephant走紅:AI開始為“Token浪費”算細賬 https://mp.weixin.qq.com/s/7e0WXmZl2Ar25vd-RiNHbg

今天,50%的Token正在被浪費 https://mp.weixin.qq.com/s/r7LMwCArMtDfejJbrPJC5w

我國日均Token的調用量三個月增長超40% 目前已超140萬億_媒體聚焦_數字中國建設峰會 https://www.digitalchina.gov.cn/2026/xwzx/mtjj/202603/t20260325_5300141.htm

來源 | 非凡油條(ID:ffyoutiao)

作者 | 豆腐乳兒 ; 編輯 | 呼呼大睡

內容僅代表作者獨立觀點,不代表早讀課立場


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
廣東東莞一女生回家被陌生男尾隨至電梯口,索要微信遭拒后提出“加價400元一起玩”,女生嚴詞拒絕兩句“滾”霸氣回懟,房東稱已上報警務站

廣東東莞一女生回家被陌生男尾隨至電梯口,索要微信遭拒后提出“加價400元一起玩”,女生嚴詞拒絕兩句“滾”霸氣回懟,房東稱已上報警務站

揚子晚報
2026-06-14 13:08:09
內馬爾又傷了!戴滿金鏈子手表,球迷氣炸:你是來走紅毯的?

內馬爾又傷了!戴滿金鏈子手表,球迷氣炸:你是來走紅毯的?

陳意小可愛
2026-06-14 14:50:55
16萬人口“小國”闖世界杯,陣中還有一位華裔球星

16萬人口“小國”闖世界杯,陣中還有一位華裔球星

瀟湘晨報
2026-06-14 17:34:16
央視起底直播間“特供酒”完整黑產鏈:靠暗語、軍風包裝炒作“京總一號”等白酒,謊稱內部稀缺好酒,40名嫌犯被捕,7.52萬箱涉案酒被查

央視起底直播間“特供酒”完整黑產鏈:靠暗語、軍風包裝炒作“京總一號”等白酒,謊稱內部稀缺好酒,40名嫌犯被捕,7.52萬箱涉案酒被查

大風新聞
2026-06-14 16:03:06
世界杯首場強強對話:1-1!真不像傳統的巴西,安切洛蒂奪冠難了

世界杯首場強強對話:1-1!真不像傳統的巴西,安切洛蒂奪冠難了

侃球熊弟
2026-06-14 07:35:00
DeepSeek研究員控訴字節工地周末半夜2點施工擾民,隨后社媒賬號被封

DeepSeek研究員控訴字節工地周末半夜2點施工擾民,隨后社媒賬號被封

回旋鏢
2026-06-14 12:52:08
A股,明起重大調整

A股,明起重大調整

第一財經資訊
2026-06-14 10:50:38
諾貝爾經濟學獎得主:馬斯克本質上是真人版龐氏騙局

諾貝爾經濟學獎得主:馬斯克本質上是真人版龐氏騙局

新浪財經
2026-06-14 10:16:45
英格蘭隊隊長凱恩只穿內褲照片被曝光,球迷調侃:被偷得只剩褲衩;該隊世界杯訓練裝備大部分已追回

英格蘭隊隊長凱恩只穿內褲照片被曝光,球迷調侃:被偷得只剩褲衩;該隊世界杯訓練裝備大部分已追回

極目新聞
2026-06-14 00:20:46
曝俄羅斯央行行長納比烏琳娜被軟禁!同克宮矛盾激化

曝俄羅斯央行行長納比烏琳娜被軟禁!同克宮矛盾激化

項鵬飛
2026-06-14 16:34:45
俄羅斯沒收富豪76億美元資產,寡頭們“自愿”捐款支持戰爭

俄羅斯沒收富豪76億美元資產,寡頭們“自愿”捐款支持戰爭

山河路口
2026-06-14 14:01:30
警鐘長鳴!國務院安委辦通報典型案例 商洛高速橋梁垮塌等事故細節公布

警鐘長鳴!國務院安委辦通報典型案例 商洛高速橋梁垮塌等事故細節公布

極目新聞
2026-06-14 09:38:49
文班亞馬在令人心碎的總決賽失利后向NBA傳遞了令人恐懼的信息

文班亞馬在令人心碎的總決賽失利后向NBA傳遞了令人恐懼的信息

夜白侃球
2026-06-14 13:40:42
一場1-1絕平,誕生世界杯最大冷門!新死亡之組:4隊同分,全亂了

一場1-1絕平,誕生世界杯最大冷門!新死亡之組:4隊同分,全亂了

侃球熊弟
2026-06-14 06:08:16
每周質量報告丨兩塊多一斤的酒賣599一箱 起底直播間“特供酒”完整黑產鏈

每周質量報告丨兩塊多一斤的酒賣599一箱 起底直播間“特供酒”完整黑產鏈

環球網資訊
2026-06-14 15:08:23
殯葬師提醒:老人在家離世,打完120后,家屬千萬別漏了這3個動作

殯葬師提醒:老人在家離世,打完120后,家屬千萬別漏了這3個動作

奇葩游戲醬
2026-06-14 17:05:05
歐洲偽強隊世界杯露餡 5億豪陣狂轟30腳輸0-2 9次大賽8度遭開門黑

歐洲偽強隊世界杯露餡 5億豪陣狂轟30腳輸0-2 9次大賽8度遭開門黑

我愛英超
2026-06-14 14:21:13
5萬次模擬之后,高盛認為世界杯冠軍六成概率落入這三支球隊

5萬次模擬之后,高盛認為世界杯冠軍六成概率落入這三支球隊

華爾街見聞官方
2026-06-14 16:31:29
世界杯看臺對900萬粉韓國博主做“瞇瞇眼”歧視動作,涉事墨西哥男子身份曝光:系一協會主席,已被緊急撤職,本人道歉

世界杯看臺對900萬粉韓國博主做“瞇瞇眼”歧視動作,涉事墨西哥男子身份曝光:系一協會主席,已被緊急撤職,本人道歉

極目新聞
2026-06-14 19:24:32
隊報:美國隊世界杯首戰收視2490萬創紀錄,超NBA總決賽前4場

隊報:美國隊世界杯首戰收視2490萬創紀錄,超NBA總決賽前4場

懂球帝
2026-06-14 19:55:09
2026-06-14 21:23:00
互聯網早讀課 incentive-icons
互聯網早讀課
專注互聯網產品、運營、交互
9720文章數 55199關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

伊朗球員受訪 反問美記者:我在美國安全嗎

頭條要聞

伊朗球員受訪 反問美記者:我在美國安全嗎

體育要聞

8年8隊奪冠,鄧肯那句話,現在還給了馬刺

娛樂要聞

鄧超攜子觀戰NBA,等等帥氣十足

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

綜合續航超1600km/零百加速4秒級 2027款星途ES預售18.99萬起

態度原創

時尚
藝術
房產
本地
數碼

世界杯的“頭”等大事,來了

藝術要聞

Lori Putnam | 光感拉滿的印象風景寫生

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

本地新聞

AK劉彰邂逅河北南大港濕地

數碼要聞

出貨量兩連冠:華為朱懂東稱鴻蒙平板連續兩年在國內絕對領先

無障礙瀏覽 進入關懷版