![]()
過去,AI公司習(xí)慣按使用量收費(fèi)。無論是token消耗制還是額度制,本質(zhì)上都是“用多少、付多少”。
這套模式適合模型API,卻未必適合越來越深入工作流的企業(yè)Agent。為了完成一個(gè)任務(wù),它們會(huì)不斷讀取上下文、提煉信息、調(diào)用工具……token消耗很容易膨脹。
一些企業(yè)甚至開始出現(xiàn)token maxxing的情況——員工和Agent不斷增加AI使用量,卻很難證明這些token最終創(chuàng)造了多少價(jià)值。
如此這般,企業(yè)AI的成本越來越高,生產(chǎn)力回報(bào)卻并不總是清晰。Gartner預(yù)計(jì),到2028年,AI編程工具的成本甚至可能超過開發(fā)者薪資。
就在大家還在討論token該怎么省的時(shí)候,AI編程Agent公司Cognition提出了另一種思路:
它沒有繼續(xù)強(qiáng)調(diào)Devin消耗了多少token,而是把Devin完成的工作折算成“等效工程師小時(shí)”,再換算成美元價(jià)值。更進(jìn)一步,Cognition還推出了Productivity Guarantee——如果Devin創(chuàng)造的工程價(jià)值低于客戶支付的費(fèi)用,公司將返還最高1000萬美元額度的使用credits。
![]()
比起“AI能不能干活”,Cognition試圖回答另一個(gè)老板更為關(guān)心的問題:
這個(gè)AI員工,到底值不值這個(gè)價(jià)。
01
token消耗只是成本,不是價(jià)值
單看產(chǎn)品形態(tài),Cognition的主產(chǎn)品Devin仍然屬于AI編程Agent:寫代碼、修Bug、提交PR,都是這個(gè)賽道里的標(biāo)準(zhǔn)能力。讓它脫穎而出的是,Cognition沒有把Devin只當(dāng)成一個(gè)開發(fā)者工具來賣,而是把它包裝成一套能用ROI來衡量的生產(chǎn)力方案。
在David Senra 6月28日的最新訪談里,Cognition的CEO Scott Wu 專門用了一個(gè)章節(jié)討論“Measuring ROI Instead Of Token Spend”(用ROI而不是token消耗,來衡量AI的價(jià)值)。
他提到,一些企業(yè)開始統(tǒng)計(jì)員工用了多少AI、消耗了多少token,甚至把token用量當(dāng)成內(nèi)部指標(biāo)。但這樣很容易偏離真正的問題。
因?yàn)閠oken消耗只是成本,不是價(jià)值。
企業(yè)真正關(guān)心的根本不是誰用了更多AI,而是這些AI最終完成了多少工作。
![]()
Scott Wu舉了一個(gè)例子:
如果一個(gè)原本需要花1500萬美元、18個(gè)月的項(xiàng)目,最終借助Devin和內(nèi)部團(tuán)隊(duì),只花100萬美元、3個(gè)月就完成了,那么對(duì)于CEO和CFO來說,這筆投資就是劃算的。
他們其實(shí)并不在意這個(gè)項(xiàng)目花了多少token,甚至不在意你用的是哪家的AI——只要你能幫我解決我的問題、完成我的任務(wù),我就覺得這筆錢畫得值。
我用更少的錢、更短的時(shí)間,拿到了同樣甚至更好的結(jié)果,我就賺了。
Cognition會(huì)派團(tuán)隊(duì)到客戶現(xiàn)場(chǎng),幫他們找適合Devin的使用場(chǎng)景,做用戶培訓(xùn),搭建工作流程,寫playbook,配合安全審查和私有云部署。
也就是說,Devin被包裝成一套企業(yè)生產(chǎn)力改造方案,而不是被當(dāng)作一個(gè)“開箱即用”的工具。
這套打法不太像一家普通SaaS公司,更像一家咨詢公司或IT外包公司。企業(yè)采購(gòu)咨詢服務(wù),最終買單的是項(xiàng)目成果;采購(gòu)AI Agent,也正在越來越接近這種邏輯。
在這套邏輯下,Cognition想證明的不只是Devin的代碼能力,更重要的是,它值不值得進(jìn)入企業(yè)預(yù)算。
02
AI員工的價(jià)值,是怎么被計(jì)算出來的
問題是,ROI并不是一句空話。
如果Devin要向企業(yè)證明自己“值這個(gè)價(jià)”,Cognition首先要回答一個(gè)更具體的問題:一個(gè)AI工程師完成的工作,到底怎么換算成美元價(jià)值?
Cognition專門寫了一篇文章解釋這套方法。它承認(rèn),直接計(jì)算AI帶來的商業(yè)價(jià)值很難——一個(gè)PR到底帶來多少收入,一個(gè)Bug修復(fù)到底避免了多少損失,這些很難被精確歸因。所以Cognition沒有一上來就計(jì)算最終商業(yè)收益,它選擇了一個(gè)中間指標(biāo):“有效工程師小時(shí)”。
![]()
首先,他們收集了126位企業(yè)開發(fā)者、258個(gè)真實(shí)Devin Session的數(shù)據(jù)。每位開發(fā)者都會(huì)回答一個(gè)問題:如果沒有Devin,這項(xiàng)工作你自己需要花多久?
這些真實(shí)反饋,被用來訓(xùn)練和校準(zhǔn)整套評(píng)估系統(tǒng)。之后,每一次Devin完成任務(wù),這套系統(tǒng)都會(huì)重新評(píng)估它到底創(chuàng)造了多少價(jià)值。
整個(gè)過程大致可以分為三步:
第一步,先過濾掉無效工作。
不是每一次Devin Session都算生產(chǎn)力。
如果Devin生成了一堆代碼,最后沒有被采用、沒有推進(jìn)項(xiàng)目、也沒有真正解決問題(PR沒有被合并),那么這些token消耗就不會(huì)被計(jì)入價(jià)值。
對(duì)于沒有PR的任務(wù),它還會(huì)用分類器判斷這個(gè)Session是否真的推進(jìn)了工作。比如查找未使用依賴、掃描安全漏洞、審查PR、跑數(shù)據(jù)查詢、排查Bug等等,這些工作不一定產(chǎn)生代碼,但仍然可能是有效工程工作。
相反,如果Devin因?yàn)闆]有權(quán)限無法繼續(xù),或者向用戶追問后沒人回復(fù),這類Session就會(huì)被過濾掉。
第二步,估算人類工程師完成同樣任務(wù)需要多少時(shí)間。
評(píng)估系統(tǒng)會(huì)讀取整個(gè)Session,包括用戶需求、Devin執(zhí)行過程、代碼、PR、日志以及代碼庫(kù)上下文,然后估算一名普通工程師完成同樣結(jié)果需要投入多少時(shí)間。
它甚至?xí)紤]很多細(xì)節(jié),例如:如果用戶已經(jīng)告訴了Devin具體怎么改,那只計(jì)算寫代碼的時(shí)間;如果Bug需要自己定位,那定位時(shí)間也要算進(jìn)去;如果這是一個(gè)陌生的遺留代碼庫(kù),人類需要先花時(shí)間熟悉,而Devin已經(jīng)完成了這部分工作,這些時(shí)間同樣會(huì)計(jì)入價(jià)值。
第三步,再把工程師時(shí)間換算成美元。
Cognition采用統(tǒng)一的工程師成本標(biāo)準(zhǔn),把“等效工程師小時(shí)”轉(zhuǎn)換成美元價(jià)值,再與企業(yè)實(shí)際支付的費(fèi)用進(jìn)行比較。
如果創(chuàng)造的價(jià)值高于成本,企業(yè)獲得正ROI;如果低于成本,Cognition就通過Productivity Guarantee返還credits(最高價(jià)值1000萬美元)。
當(dāng)然,Cognition并沒有宣稱這套算法能夠精確計(jì)算每一個(gè)任務(wù)的真實(shí)價(jià)值,他們?cè)诩夹g(shù)文檔里承認(rèn),單個(gè)任務(wù)的估算可能存在2到3倍誤差。但他們認(rèn)為,隨著企業(yè)部署規(guī)模擴(kuò)大、任務(wù)數(shù)量增加,整體平均結(jié)果會(huì)越來越穩(wěn)定,更接近AI創(chuàng)造的真實(shí)生產(chǎn)力。
![]()
這套機(jī)制值得關(guān)注的地方也不是它能把每一行代碼都精確折算成多少錢。重點(diǎn)在于,它把AI Agent的價(jià)值衡量,從“消耗了多少token”,轉(zhuǎn)向了“替企業(yè)節(jié)省了多少工程時(shí)間”。
因?yàn)槟切┐篌w量的客戶并不會(huì)只因?yàn)橐粋€(gè)AI產(chǎn)品看起來很酷,就去大規(guī)模部署。它們要過預(yù)算、合規(guī)、安全、采購(gòu)和財(cái)務(wù)審核,必須有人解釋:為什么這筆錢值得花?
過去,ROI往往是客戶內(nèi)部采購(gòu)部門、業(yè)務(wù)部門或財(cái)務(wù)部門需要自己計(jì)算的事。軟件公司只負(fù)責(zé)賣工具,至于工具有沒有真正提升效率、節(jié)省成本,更多要靠客戶自己證明。買了、用了、效果不好,通常也是客戶自己消化。
但Cognition把這件事攬了過來,在銷售階段就主動(dòng)幫客戶把這筆賬算清楚,還用Productivity Guarantee把一部分風(fēng)險(xiǎn)接了過去。
這套打法也確實(shí)成為了Cognition擴(kuò)張故事的一部分:Cognition在融資時(shí)披露,企業(yè)用量今年以來增長(zhǎng)超過10倍,run-rate revenue已經(jīng)達(dá)到4.92億美元;同時(shí),它把Citi、Goldman Sachs、Santander、Mercedes-Benz、Dell、美國(guó)陸軍和海軍等大客戶放在了最顯眼的位置。
Cognition這套邏輯帶來的最大價(jià)值就在于,它讓Devin從工程師手里的AI編程工具,變成了CFO能看懂、采購(gòu)部門能推進(jìn)、CEO能批準(zhǔn)的預(yù)算項(xiàng)。
畢竟,不是所有老板都會(huì)寫代碼,但所有老板都會(huì)算賬。
03
AI越像員工,就越要看結(jié)果
如果把視角從AI編程Agent放大到企業(yè)Agent,事實(shí)上,按結(jié)果衡量?jī)r(jià)值這件事,客服Agent已經(jīng)先走了一步。
比如Intercom。它原本就是做客戶服務(wù)軟件的,F(xiàn)in是它推出的AI客服Agent,它就是按一次成功結(jié)果收費(fèi),官方價(jià)格是每個(gè)結(jié)果0.99美元。
Zendesk也是類似邏輯,作為老牌客服軟件公司,它的AI Agent面向客服工單場(chǎng)景,收費(fèi)單位是“自動(dòng)解決”:只有AI獨(dú)立解決了一次客戶問題,才會(huì)被計(jì)入收費(fèi)。
Sierra則從一開始就把自己定位成“按業(yè)務(wù)結(jié)果收費(fèi)”的企業(yè)Agent公司,服務(wù)客服、銷售、續(xù)費(fèi)、退訂挽回等場(chǎng)景,客戶為AI完成了多少次有效業(yè)務(wù)結(jié)果付費(fèi)。
因?yàn)榭头?chǎng)景的結(jié)果最容易定義。用戶問題有沒有被解決、工單有沒有關(guān)閉、客戶有沒有被成功轉(zhuǎn)化……這些結(jié)果比“一個(gè)PR到底創(chuàng)造了多少商業(yè)價(jià)值”更容易被衡量。
傳統(tǒng)的企業(yè)服務(wù)本來就看重結(jié)果,ROI敘事本身就是企業(yè)軟件、咨詢服務(wù)和IT外包行業(yè)里非常常見的商業(yè)邏輯。可以說,客服Agent率先把這套邏輯轉(zhuǎn)移到了AI領(lǐng)域,而Devin又把這套邏輯搬到了更復(fù)雜的軟件工程場(chǎng)景。
不過,AI行業(yè)里并不是所有產(chǎn)品都適合用ROI直接計(jì)費(fèi)。
底層模型API就像水電煤,模型公司提供的是算力和模型調(diào)用能力,客戶調(diào)用一次模型,就會(huì)產(chǎn)生真實(shí)的推理成本。所以O(shè)penAI、Anthropic、Google這類模型公司,仍然很難完全擺脫token、調(diào)用量或credits計(jì)費(fèi)。
Copilot類產(chǎn)品則更像傳統(tǒng)軟件,GitHub Copilot、Microsoft 365 Copilot、ChatGPT Business這類產(chǎn)品,主要賣的是一個(gè)固定入口和一套使用權(quán)限,所以更適合按人頭、按月訂閱。
但Agent產(chǎn)品不一樣。
我們之前在討論Claude Tag的時(shí)候就提過,“AI同事”并不等于免費(fèi)牛馬。
企業(yè)Agent越像一個(gè)真正的同事,token消耗就越不可能像普通聊天那樣可控。當(dāng)這個(gè)AI同事足夠聰明、足夠勤快、足夠愿意加班的時(shí)候,企業(yè)反而需要限制它的使用。
AI同事也要有預(yù)算;而一旦有預(yù)算,老板就會(huì)繼續(xù)往下問:這筆預(yù)算帶來了多少回報(bào)?
換句話說,如果AI只是工具,企業(yè)可以按使用量、按席位、按額度付費(fèi);但如果AI被包裝成一個(gè)員工,老板自然也會(huì)用考核員工的方式考核它。
ROI敘事未必代表AI計(jì)費(fèi)方式的終點(diǎn),也不意味著所有企業(yè)Agent都會(huì)立刻轉(zhuǎn)向按成果收費(fèi)。但Cognition確實(shí)在軟件工程這個(gè)更難量化的場(chǎng)景里,重新建立了一套R(shí)OI計(jì)算方法,展示了Agent商業(yè)化的一條清晰路徑。
畢竟,當(dāng)“AI員工”正式上崗,老板遲早會(huì)問一句:
這個(gè)AI員工,到底值不值這個(gè)價(jià)?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.