【文/觀察者網專欄作者 唐曉甫】
最近,AI Agent(AI智能體/助理/助手)成為一個非常熱門的話題。作為一個長期跟蹤AI發展、但已經忘記如何編程的人,我也在一直追逐前沿動態,試圖更加高效地學習使用AI Agent,拓展自己的能力邊界。
于是繼5月份,我和AI一起從零開始,低效手搓出一個功能不全的簡易版Agent后,我把目光投向了已經頗具規模的成熟Agent,選擇了朋友推薦的新興開源Agent——Hermes,然后將API(應用程序編程接口)選定為我的老朋友DeepSeek。
當然,開了高權限的Agent能干的事情確實非常多,不僅能和你搞出聊天bot、相對高效率地編程、對很多參數配置進行一句話修改,還能模擬鍵鼠繞過傳統的反爬蟲程序,讀取不少東西。當然這個過程也并非一帆風順,也會出現改錯東西致使軟件崩潰的情況,例如我在修改bot參數的時候,Agent會意外篡改原來的API信息、并且沒事就切換輸入法繁簡體,還挺無語的。
令人驚嘆的低價
只不過最讓我意外的還是DeepSeek,由于我本來對編程已經忘得差不多了,本地也沒有很多編程工具和軟件包,每次在調試程序的時候,我給出的提示詞都比較模糊,導致精細調整時浪費很多詞元。于是在一次次不斷地為本地Agent界面功能升級、自動輸出skill以及編程的過程中,不知不覺,我的詞元消耗量在短時間內達到了相對龐大的數字——4.5億。
![]()
我不太清楚這個數字意味著什么,尤其是我的第一選擇一直是DeepSeek,沒有使用過其他公司的官網API,我并不知道這背后隱藏著中美AI大模型最核心的差異之處。我只是稀里糊涂地查了一下賬單,發現我四天浪費4.5億詞元的結果是——我只要為此付出35塊錢。
到這時,我才突然想起來,我是不是可以問問ChatGPT,4.5億詞元意味著什么。于是我向ChatGPT提出了這個問題:4.5億詞元是不是很多?然后它給出了回答:
![]()
是的,4.5億詞元非常多。直觀說: 1.內容量級很大 4.5億詞元大致相當于: 英文:約3億多個英文單詞 中文:可能約3億到4.5億個漢字/字符級內容 如果一篇長稿按1萬詞元算,大概是4.5萬篇長稿,如果一本書按10萬到20萬詞元算,大概是2250到4500本書 2.API成本也不小 按OpenAI當前官方價格,GPT-5.5標準API是輸入$5/100萬詞元,輸出$30/100萬詞元;GPT-5.4mini是輸入$0.75/100萬詞元,輸出$4.50/100萬詞元。所以4.5億詞元=450個“百萬詞元”。 結論: 4.5億詞元已經不是普通個人使用量,而是中大型內容處理、批量摘要、數據清洗、知識庫構建、批量翻譯/改寫這類項目級用量。
由于ChatGPT的這個回答超出了我的預期,我就問了一下,4億詞元(還不是4.5億)用美國的API要多少錢?答案再次讓我驚訝。
![]()
![]()
![]()
根據ChatGPT、Gemini和Claude的說法,即便在最便宜的情況下,用GPT-5.4nano全輸入4億詞元,也要80美元。而如果是全輸出,最貴的GPT-5.5會收費1.2萬美元。可以這么說,即便按美國主流模型中最便宜的報價計算,處理4.5億詞元的成本,理論上也會是我這次DeepSeek浪費行動所花成本的約17.5倍。
然后我想了想,也許是因為我的緩存命中比較高的原因(DeepSeek也是出了名的緩存命中高),所以導致收費很低。于是我問了一下,如果緩存命中率達到99%(顯然正常情況下是不可能的),4億詞元我要花多少錢?答案如下:
![]()
![]()
![]()
我們可以看到,哪怕是我把緩存命中率提到99%,無論是ChatGPT、Gemini還是Claude的旗艦大模型的收費標準都顯著高于DeepSeek,甚至高于DeepSeek幾十倍收費依舊是常態。
當然,這次Agent實驗過程中,我沒有用什么專門的編程軟件,也沒有調用現成的工具庫、多專家Agent或者Skill庫,沒有用Codex或者Claude Code中轉CC Switch連接DeepSeek,也知道DeepSeek在處理一些問題的時候會非常笨拙且消耗詞元,所以我這次只是單純比較詞元的價格。
也許有人認為這樣單純追求廉價意義有限。因為在AI狂飆突進的敘事下,似乎極致的性能才是一切的核心,誰能率先實現AGI,誰就能拿到打開下一個時代的鑰匙,然后在一夜之間帶來生產力的飛升和文明的進化,所以一切高投入都是值得的。
這里我們先拋開DeepSeek V4 Pro本身的Agent性能,以及國人是否可以圍繞DeepSeek等國產大模型創造更高效的Vibe Coding生態等問題不談,而是更加細致地從價格和財務的角度關注2026年上半年的AI生態,就會發現,所謂“一切高投入都是值得的”之類的結論似乎太武斷了。
美國公司也無法承受越來越長的美國AI賬單了
一些不太關注AI的朋友可能會產生這樣的印象:即便有數據表明中國模型的性價比遠高于美國產品——例如,人工智能基準測試公司Artificial Analysis在相同10項評估中對比各實驗室最強模型后發現,Anthropic的Claude成本高達4811美元,OpenAI的ChatGPT為3357美元,而DeepSeek僅需1071美元,Kimi為948美元,智譜的GLM更是低至544美元,Claude的成本幾乎是其中最便宜的中國方案的九倍。
同時,中國模型的調用詞元數量已階段性位居世界第一,根據OpenRouter數據,3月底至4月初中國模型的詞元調用占比一度接近48%,并且在2026年4月以來的大多數周中都超過了美國模型,單周調用量甚至一度達到美國模型的4.28倍。
盡管如此,我們一般還是會默認,美國公司不僅會將業務留給美國AI大模型,而且美國巨頭們對于AI詞元的需求,至少現在是近乎無上限的。但是事實上,我們錯了,而且大錯特錯。
首先,美國公司現在也在大規模運用中國的AI大模型。不僅用得多,甚至還直連官網。這里我們可以看看知名財務自動化平臺與企業支出管理軟件Ramp關于DeepSeek的兩篇報道。第一篇是發布于2025年3月7日的《Are businesses actually using DeepSeek?》,里面提到,根據其企業支付數據估算,截至2025年1月底,一度有0.3%的美國企業使用過DeepSeek。
![]()
然而在6月3日發布的《Top SaaS Vendors on Ramp (June 2026)》中,Ramp首席經濟學家Ara Kharazian在文中表示,DeepSeek在當月登上Ramp “trending software list”的榜首。更重要的是,Ramp特別說明,這不是企業自建開源模型的間接使用,而是企業正在直接向DeepSeek付款,并且通過DeepSeek直接發送和接收數據。也就是說,雖然沒有給出明確數據,但是已經有一定比例的美國企業開始通過官方API渠道采購DeepSeek的服務,而不只是下載開源權重或通過第三方平臺間接使用。
如果這只是小型企業開始嫌棄美國大模型收費太貴的話,那么另外的一些報道則可能更值得警惕:美國頂級企業開始限制員工對詞元的消耗。
5月,美媒《華爾街日報》就報道,不少大公司數月前對AI應用的普遍看法仍是“越多越好”。因此,當模型開發商提供無限量訂閱模式時,部分企業員工便盡可能消耗算力,以證明自己緊跟AI熱潮。然而,隨著無限量訂閱模式被按詞元收費的模式取代,以及詞元的單價飆升后,企業在運用AI方面的支出也將隨之大增。
有公司已經報告稱自家AI支出增加了一到兩倍,而Uber在4個月就已經用完了AI的全年度預算。Meta、微軟、Salesforce等企業的技術主管也提出新措施,以確保員工使用AI有助于提高生產力,或減少部分員工使用特定工具的權限。亞馬遜也在5月通知員工,旗下可用于跟蹤員工詞元消耗情況的“Kirorank”榜單已停止服務。該榜單的設立初衷是推動AI在業務場景的應用,然而事與愿違,部分員工為追求更高的排名和績效,將AI智能體當作不計成本的“燒詞元”工具,導致公司算力資源被浪費。
同時,老牌企業也開始限制自家員工對于詞元的需求。Walmart也被報道對內部AI編程工具設置詞元數量限制,用來減少重復性“vibe coding”和控制成本。
這股風氣甚至蔓延到了一直在炒作AI需求的華爾街。Business Insider報道稱,JPMorgan、畢馬威等公司已經建立了跟蹤員工AI使用機制;其中JPMorgan工程師的AI使用情況會被內部記錄和分類(包括GitHub Copilot、Claude等工具)。
摩根大通的首席數據與分析官在2026年6月初的紐約科技周上公開證實,部分員工使用大模型產生的詞元成本,已經超過了其個人薪水。作為在全球及北美擁有龐大投行業務的歐洲最大銀行之一,法國巴黎銀行CIB的首席AI官在巴黎Mistral AI峰會期間表示,他已經不再把“每天消耗數十億詞元”作為首要指標,而是更重視實際產出、效率提升和收入影響。
更加扎心的是,這些被消耗的詞元并沒有轉化為生產力,根據初創企業Entelligence AI收集的2000多家使用高級AI編程工具公司的數據,發現只有18%的詞元支出轉化為了能夠觸及真實用戶的已交付編碼產品。
而這時候,我們不妨來看看近期的一個例子,《崩壞》系列AI NPC&Gameplay技術團隊負責人鄭銀河在2026阿里云峰會上,無意間透露了內部Agent嘗試的成本。團隊有個工程師為測試多智能體協作,搭建了幾十個AI Agent,沒有設置詞元消耗上限就下班離開。結果智能體連續運行13小時,消耗了價值200萬元人民幣的詞元。他還對同事開玩笑說,如果你是一個獨立游戲開發團隊,那一晚上已經破產了。(200萬元人民幣都夠很多編程小團隊一年以上工資了。)
![]()
接連出現的成本失控事件,正在迫使所有企業直面AI實驗室此前刻意回避的核心問題:這項技術究竟是否足夠有用,值得投入這么高的成本?
從創新邏輯看,技術發展本就建立在大量試錯的基礎上,但當試錯本身已經擁有極高的成本,甚至有拖垮項目的風險時,越來越多企業開始重新衡量這條技術路線的合理性。Ramp首席經濟學家Ara Kharazian指出,當前大量美國企業的AI支出已經面臨巨大成本壓力;在高昂詞元消耗、遠低于預期的投資回報率雙重擠壓下,不少企業開始主動尋找OpenAI、Anthropic的平價替代方案,而DeepSeek極低的詞元定價,恰好給這類嘗試和創新提供了低成本試錯的空間。
但是從美國政府的角度來看,AI從來不只是工程上的問題,也不只是金融上的問題,它還涉及美國的美元霸權以及所謂“第四次工業革命”的美夢。
美國“AI金融學”已經正面遇到了那堵墻
對于美國來說,金融端對詞元需求的敘事恰恰相反。在很多人的敘事中,美國的高等級AI推理是稀缺的、高價的AI硬件是供應不足的、高價詞元是可以被企業無限消化的、高估值是可以由無限增長的推理需求支撐的,而且即便詞元價格高企,其投入產出終將會擴大,而AI公司也可以靠昂貴的閉源API,長期收割全球企業并獲得盈利。
為此,他們試圖將詞元與“高等級推理能力的計量單位”相掛鉤:越復雜的推理、越長的上下文、越多的Agent調用,就越需要高端GPU、數據中心、電力、云服務和閉源模型能力。這個敘事支撐了AI基礎設施的巨額資本開支預期。高盛的基準模型估算,AI相關年度資本開支可能從2026年的7650億美元,增長到2031年的1.6萬億美元;摩根士丹利也估算,到2028年前后將有近3萬億美元AI基礎設施投資流入全球經濟。
隨后通過這種掛鉤以及對稀缺算力的壟斷,美國一直試圖將算力和美元掛鉤,從而實現新時代美元霸權體系的基礎,也就是“算力美元”。要不是中國也發展出了自己的AI產業鏈、開源了自己的AI大模型,并且始終只落后美國AI半年到一年的時間,早就開始加速“算力美元”體系以及其至關重要的算力期貨機制建設,而不是拼命地迭代自己的閉源AI體系了。要知道迭代一次AI,沿著Scaling Law擴大參數是非常燒錢的。如果沒有后面的追趕,美國人完全可以達成一種默契,逐步收回自己的前期投資之后再推進AI大模型的發展。
而現在,美國的AI相關資本開支已經達到了一個驚人的地步,根據2026年6月初的公開財報和投行估算,美國AI相關資本開支已經進入“準國家級基建投資”規模:一年7000億到8000億美元量級,未來數年累計數萬億美元。市場媒體匯總中,四大科技公司Amazon、Microsoft、Alphabet、Meta在2026年合計資本性支出預估為約7250億美元,較2025年的約4100億美元增長約77%。這已經超過很多國家一整年的財政支出,也與美國的年度國防預算相媲美。
根據公開數據,僅Amazon、Microsoft、Alphabet、Meta四家公司2026年的AI/數據中心相關資本開支,就相當于美國全年私人國內總投資的約13%,相當于美國全年私人非住宅固定投資的約16%。
這一比例是歷史級別的,甚至比互聯網泡沫末期的比例更大。2000年美國信息產業資本開支為1642億美元,占當年有雇員企業資本開支的14.9%;可以說,這是現代美國資本主義史上罕見的,甚至可以說接近史無前例的集中式投資浪潮。
更有意思的是,美國M2從2025年4月的21.7757萬億美元,上升到2026年4月的22.8045萬億美元,一年增加約1.0288萬億美元。這意味著,僅四大AI的資本支出就是過去一年美國M2增量的70.5%。這說明AI基礎設施建設已經成為吸收市場流動性、重塑資本配置和支撐高估值敘事的核心機制之一。
美國已經All in AI。
所以美國馬上面臨的下一個問題是:美國人多久能收回自己的投資?未來的流動性還夠嗎?在中國大模型已經滲透進美國公司工作環境的今天,在美國資本已經把AI相關資本開支預期打滿的今天,在美國密歇根大學消費者信心指數創下自1952年調查以來歷史新低的今天,在美國面臨高通脹、高利率的今天,本輪美國的AI產業鏈以及上下游產業鏈還能燒多久的錢呢?他們真的還能無限擴張式(保持高增速)地燒錢嗎?以及最重要的問題,AI算力尤其是推理算力真的缺嗎?
至少從我得到的消息看,似乎推理算力(訓練算力依舊相對緊缺),全球已經有了短期相對過剩趨勢。微軟CEO Nadella甚至公開承認,當前瓶頸不是“沒有芯片”,而是沒有足夠電力和已經準備好的數據中心外殼,導致部分芯片處于“在庫存里但插不上電”的狀態。這意味著AI基礎設施的約束正在從“買不買得到GPU”,轉向“有沒有電、有沒有機房、有沒有冷卻、有沒有真實負載把GPU用滿”。而Cast AI《2026年 Kubernetes 優化報告》則指出,根據其對大量未優化Kubernetes集群的分析顯示,GPU平均利用率只有約5%,CPU平均利用率約8%,內存約20%。
誠然,我們可以明確,AI肯定是未來最重要的發展方向之一,但是正如經典模型Gartner技術成熟度曲線所展現的那樣,我們眼下正在經歷的,似乎是本輪AI產業鏈從技術萌芽期到商業化驗證的階段。
![]()
更關鍵的是,美國經濟已經出現了明顯的“雙層結構”:AI相關資本開支、數據中心建設和高端設備投資仍在高速擴張,并成為GDP增長和資本市場估值的核心支撐;但在AI之外,傳統消費、服務業就業、制造業就業、白領崗位、利率敏感行業和中小企業部門已經顯著降速,部分指標呈現衰退特征。美國正在進入一種由AI投資遮蔽的結構性停滯狀態。
![]()
我們可以看一張比較經典的圖片:標普500指數與美國失業率的走勢圖。傳統上,美國股市通常會在失業率見底并開始上行后進入更脆弱階段,因為就業惡化最終會傳導到消費、企業盈利和信用周期。但本輪AI行情中,這一傳統關系出現了明顯分化:失業率已經從周期低位抬升至4.3%,但標普500仍處在歷史高位附近。AI行情暫時把“就業走弱”轉化為“降息預期”,又把“資本開支擴張”轉化為“盈利增長預期”,從而遮蔽了傳統經濟部門的疲弱。
尤其是,在美國AI巨頭普遍將基于AI發展的裁員視作一種重大利好的背景下,這種分化正在演變成為本輪AI周期最大的風險:AI敘事必須證明自己能夠創造足夠生產率、利潤乃至就業;否則兩條分化的線條會重新收斂,但大概率不是以失業率下降的方式,而是以標普500補跌的方式收斂。
所以一切又回到了那個問題:“美國的高等級AI推理是稀缺的,高價的AI硬件是供應不足的,高價詞元可以被企業無限消化,高估值可以由無限增長的推理需求支撐且即便詞元價格高企,其投入產出終將會擴大,而AI公司也可以靠昂貴閉源API長期收割全球企業并獲得盈利。”——這個敘事還能持續嗎?
至少在我看來,這個問題很難。因為流動性短期上限正在被鎖死,而便宜、性能僅次于美國大模型的中國大模型正在蠶食美國大模型的盈利預期上限。而且這種局面會讓越來越多的人,包括美國人也包括廣大的第三世界人民,可以圍繞著這個便宜但能用的生態貢獻自己的力量,畢竟有句老話:永遠不要小瞧開源的信仰。
而正如很多網友的說法一樣,從美國的AI閉源模型角度來看,以DeepSeek為代表的、開源而廉價的中國大模型就像一個淘汰圈,閉源模型跑贏了DeepSeek沒有獎勵,但是跑輸了,那就有懲罰,懲罰的結果就是,這個閉源模型會直接消失。
![]()
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.