6月20日消息,企業(yè)把AI工具推給員工之后,第一輪賬單壓力正在顯現(xiàn):亞馬遜、沃爾瑪、思科、優(yōu)步和Meta等早期使用者,開始給員工的AI用量設(shè)上限、減少浪費(fèi)式使用,或把任務(wù)導(dǎo)向更便宜的模型。
據(jù)英國(guó)《金融時(shí)報(bào)》6月19日?qǐng)?bào)道,變化的背景是AI工具從聊天機(jī)器人升級(jí)到AI智能體(AI agent)。智能體能連續(xù)執(zhí)行更復(fù)雜的任務(wù),但也消耗更多算力。與此同時(shí),越來越多企業(yè)AI服務(wù)開始按token或?qū)嶋H使用量計(jì)費(fèi),企業(yè)也第一次更直接地看到每一次查詢、每一個(gè)自動(dòng)化流程要花多少錢。
員工用得越多,賬單越難解釋
優(yōu)步是最直接的例子。這家公司在4月就用完了2026年全年AI預(yù)算,隨后把員工在單個(gè)AI工具上的月度token支出限制在1,500美元以內(nèi)。優(yōu)步總裁兼首席運(yùn)營(yíng)官安德魯?麥克唐納(Andrew Macdonald)在近期一檔播客中說,AI token支出正變得 “越來越難證明劃算”,因?yàn)楣竞茈y把這些使用數(shù)據(jù)直接對(duì)應(yīng)到 “多交付了多少消費(fèi)者功能”。
沃爾瑪也在限制內(nèi)部AI智能體的token用量。沃爾瑪全球首席技術(shù)官蘇雷什?庫馬爾(Suresh Kumar)說,公司內(nèi)部AI編程工具Code Puppy的使用量大幅上升,現(xiàn)在要求員工先判斷哪個(gè)工具適合當(dāng)前任務(wù),而不是默認(rèn)動(dòng)用AI。
軟件公司W(wǎng)orkato的反應(yīng)更劇烈。公司約1,300名員工去年夏天開始使用AI智能體后,使用量迅速擴(kuò)大。今年5月,Anthropic把相關(guān)服務(wù)切換到token計(jì)費(fèi),Workato第一天支出就漲到原來的7倍。首席信息官卡特?布斯(Carter Busse)隨后把每周兩次的AI推廣會(huì)改成省錢培訓(xùn),要求員工更多使用Anthropic較舊、較便宜的模型。
模型公司增長(zhǎng)還在,但客戶開始算細(xì)賬
企業(yè)控制AI用量,并不等于AI需求消失。《金融時(shí)報(bào)》也明確提到,企業(yè)token使用量和AI支出仍在增長(zhǎng)。真正變化的是,客戶不再只看 “有沒有用AI”,而是開始追問每一筆AI開銷是否值得。
OpenAI首席執(zhí)行官薩姆?奧特曼(Sam Altman)本月對(duì)《金融時(shí)報(bào)》說,成本已經(jīng)成為今年客戶口中的 “大問題”;去年這個(gè)問題幾乎沒有出現(xiàn),客戶對(duì)自己的花費(fèi)還很滿意。
這對(duì)OpenAI和Anthropic的增長(zhǎng)故事很關(guān)鍵。它們一方面要證明企業(yè)AI需求足夠大,另一方面又要面對(duì)客戶預(yù)算約束。token計(jì)費(fèi)能讓收入更貼近實(shí)際使用量,但也把成本暴露給企業(yè)財(cái)務(wù)部門。德勤全球生成式AI負(fù)責(zé)人科斯蒂?佩里科斯(Costi Perricos)說,算力成本正在進(jìn)入首席財(cái)務(wù)官和董事會(huì)的視野,消費(fèi)者和企業(yè)過去被培養(yǎng)出一種預(yù)期:AI很便宜,甚至免費(fèi)。但事實(shí)并非如此。
OpenAI自身也承受成本壓力。據(jù)The Information報(bào)道,OpenAI在2026年第一季度消耗現(xiàn)金37億美元,同期營(yíng)收57億美元。報(bào)道還提到,公司當(dāng)季經(jīng)營(yíng)虧損93億美元,其中包含超過23億美元員工股權(quán)激勵(lì)費(fèi)用。需要注意,現(xiàn)金消耗、經(jīng)營(yíng)虧損和股權(quán)激勵(lì)是三個(gè)不同口徑,但它們共同指向一個(gè)問題:收入增長(zhǎng)背后,成本結(jié)構(gòu)仍然很重。
平臺(tái)開始把任務(wù)分給更便宜的模型
為了讓客戶繼續(xù)使用AI,平臺(tái)公司也在改變產(chǎn)品設(shè)計(jì)。微軟、亞馬遜、谷歌等公司已經(jīng)推出模型路由工具,根據(jù)用戶任務(wù)自動(dòng)選擇更合適的模型,而不是所有問題都默認(rèn)交給最貴的前沿模型。
GitHub首席運(yùn)營(yíng)官凱爾?戴格爾(Kyle Daigle)說,微軟在調(diào)整定價(jià)前會(huì)先和客戶討論 “適配性和目的”。用戶真正要問的是哪個(gè)模型最適合這項(xiàng)工作,而不是每次都需要前沿模型。
思科總裁兼首席產(chǎn)品官吉圖?帕特爾(Jeetu Patel)點(diǎn)出另一個(gè)現(xiàn)實(shí)問題:智能體需要的計(jì)算基礎(chǔ)設(shè)施明顯高于聊天機(jī)器人。在企業(yè)的遠(yuǎn)景規(guī)劃中,一名員工可能配備10個(gè)、100個(gè)甚至上千個(gè)智能體,它們會(huì)持續(xù)工作,也會(huì)持續(xù)消耗算力。對(duì)企業(yè)來說,AI從 “買工具” 變成了 “管用量”。
一些公司也開始引導(dǎo)員工使用能在自有服務(wù)器或個(gè)人設(shè)備上本地運(yùn)行的開源模型,以減少付給AI實(shí)驗(yàn)室和云廠商的費(fèi)用。中國(guó)模型也在價(jià)格上形成壓力。《金融時(shí)報(bào)》援引OpenRouter數(shù)據(jù)稱,在其平臺(tái)樣本中,中國(guó)AI模型的token消耗量今年以來已經(jīng)超過美國(guó)模型;更低能源成本和更高效模型,讓中國(guó)AI實(shí)驗(yàn)室能以更低價(jià)格出售token。
企業(yè)AI進(jìn)入第二階段后,問題不再是員工會(huì)不會(huì)用,而是公司愿意為哪些場(chǎng)景持續(xù)付錢。對(duì)普通員工來說,AI工具不會(huì)因此消失,但 “隨便試、隨便跑” 的階段正在結(jié)束;對(duì)OpenAI和Anthropic來說,下一輪增長(zhǎng)要說服的不只是技術(shù)負(fù)責(zé)人,還有盯著預(yù)算表的財(cái)務(wù)部門。(易句)
(本文由AI翻譯,網(wǎng)易編輯負(fù)責(zé)校對(duì))
