網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

ROI這口利劍，終于懸在了AI員工頭頂

2026-06-30 12:35:36　來源: 字母榜

北京舉報(bào)

分享至

過去，AI公司習(xí)慣按使用量收費(fèi)。無論是token消耗制還是額度制，本質(zhì)上都是“用多少、付多少”。

這套模式適合模型API，卻未必適合越來越深入工作流的企業(yè)Agent。為了完成一個(gè)任務(wù)，它們會(huì)不斷讀取上下文、提煉信息、調(diào)用工具……token消耗很容易膨脹。

一些企業(yè)甚至開始出現(xiàn)token maxxing的情況——員工和Agent不斷增加AI使用量，卻很難證明這些token最終創(chuàng)造了多少價(jià)值。

如此這般，企業(yè)AI的成本越來越高，生產(chǎn)力回報(bào)卻并不總是清晰。Gartner預(yù)計(jì)，到2028年，AI編程工具的成本甚至可能超過開發(fā)者薪資。

就在大家還在討論token該怎么省的時(shí)候，AI編程Agent公司Cognition提出了另一種思路：

它沒有繼續(xù)強(qiáng)調(diào)Devin消耗了多少token，而是把Devin完成的工作折算成“等效工程師小時(shí)”，再換算成美元價(jià)值。更進(jìn)一步，Cognition還推出了Productivity Guarantee——如果Devin創(chuàng)造的工程價(jià)值低于客戶支付的費(fèi)用，公司將返還最高1000萬美元額度的使用credits。

比起“AI能不能干活”，Cognition試圖回答另一個(gè)老板更為關(guān)心的問題：

這個(gè)AI員工，到底值不值這個(gè)價(jià)。

token消耗只是成本，不是價(jià)值

單看產(chǎn)品形態(tài)，Cognition的主產(chǎn)品Devin仍然屬于AI編程Agent：寫代碼、修Bug、提交PR，都是這個(gè)賽道里的標(biāo)準(zhǔn)能力。讓它脫穎而出的是，Cognition沒有把Devin只當(dāng)成一個(gè)開發(fā)者工具來賣，而是把它包裝成一套能用ROI來衡量的生產(chǎn)力方案。

在David Senra 6月28日的最新訪談里，Cognition的CEO Scott Wu 專門用了一個(gè)章節(jié)討論“Measuring ROI Instead Of Token Spend”（用ROI而不是token消耗，來衡量AI的價(jià)值）。

他提到，一些企業(yè)開始統(tǒng)計(jì)員工用了多少AI、消耗了多少token，甚至把token用量當(dāng)成內(nèi)部指標(biāo)。但這樣很容易偏離真正的問題。

因?yàn)閠oken消耗只是成本，不是價(jià)值。

企業(yè)真正關(guān)心的根本不是誰用了更多AI，而是這些AI最終完成了多少工作。

Scott Wu舉了一個(gè)例子：

如果一個(gè)原本需要花1500萬美元、18個(gè)月的項(xiàng)目，最終借助Devin和內(nèi)部團(tuán)隊(duì)，只花100萬美元、3個(gè)月就完成了，那么對(duì)于CEO和CFO來說，這筆投資就是劃算的。

他們其實(shí)并不在意這個(gè)項(xiàng)目花了多少token，甚至不在意你用的是哪家的AI——只要你能幫我解決我的問題、完成我的任務(wù)，我就覺得這筆錢畫得值。

我用更少的錢、更短的時(shí)間，拿到了同樣甚至更好的結(jié)果，我就賺了。

Cognition會(huì)派團(tuán)隊(duì)到客戶現(xiàn)場(chǎng)，幫他們找適合Devin的使用場(chǎng)景，做用戶培訓(xùn)，搭建工作流程，寫playbook，配合安全審查和私有云部署。

也就是說，Devin被包裝成一套企業(yè)生產(chǎn)力改造方案，而不是被當(dāng)作一個(gè)“開箱即用”的工具。

這套打法不太像一家普通SaaS公司，更像一家咨詢公司或IT外包公司。企業(yè)采購(gòu)咨詢服務(wù)，最終買單的是項(xiàng)目成果；采購(gòu)AI Agent，也正在越來越接近這種邏輯。

在這套邏輯下，Cognition想證明的不只是Devin的代碼能力，更重要的是，它值不值得進(jìn)入企業(yè)預(yù)算。

AI員工的價(jià)值，是怎么被計(jì)算出來的

問題是，ROI并不是一句空話。

如果Devin要向企業(yè)證明自己“值這個(gè)價(jià)”，Cognition首先要回答一個(gè)更具體的問題：一個(gè)AI工程師完成的工作，到底怎么換算成美元價(jià)值？

Cognition專門寫了一篇文章解釋這套方法。它承認(rèn)，直接計(jì)算AI帶來的商業(yè)價(jià)值很難——一個(gè)PR到底帶來多少收入，一個(gè)Bug修復(fù)到底避免了多少損失，這些很難被精確歸因。所以Cognition沒有一上來就計(jì)算最終商業(yè)收益，它選擇了一個(gè)中間指標(biāo)：“有效工程師小時(shí)”。

首先，他們收集了126位企業(yè)開發(fā)者、258個(gè)真實(shí)Devin Session的數(shù)據(jù)。每位開發(fā)者都會(huì)回答一個(gè)問題：如果沒有Devin，這項(xiàng)工作你自己需要花多久？

這些真實(shí)反饋，被用來訓(xùn)練和校準(zhǔn)整套評(píng)估系統(tǒng)。之后，每一次Devin完成任務(wù)，這套系統(tǒng)都會(huì)重新評(píng)估它到底創(chuàng)造了多少價(jià)值。

整個(gè)過程大致可以分為三步：

第一步，先過濾掉無效工作。

不是每一次Devin Session都算生產(chǎn)力。

如果Devin生成了一堆代碼，最后沒有被采用、沒有推進(jìn)項(xiàng)目、也沒有真正解決問題（PR沒有被合并），那么這些token消耗就不會(huì)被計(jì)入價(jià)值。

對(duì)于沒有PR的任務(wù)，它還會(huì)用分類器判斷這個(gè)Session是否真的推進(jìn)了工作。比如查找未使用依賴、掃描安全漏洞、審查PR、跑數(shù)據(jù)查詢、排查Bug等等，這些工作不一定產(chǎn)生代碼，但仍然可能是有效工程工作。

相反，如果Devin因?yàn)闆]有權(quán)限無法繼續(xù)，或者向用戶追問后沒人回復(fù)，這類Session就會(huì)被過濾掉。

第二步，估算人類工程師完成同樣任務(wù)需要多少時(shí)間。

評(píng)估系統(tǒng)會(huì)讀取整個(gè)Session，包括用戶需求、Devin執(zhí)行過程、代碼、PR、日志以及代碼庫(kù)上下文，然后估算一名普通工程師完成同樣結(jié)果需要投入多少時(shí)間。

它甚至?xí)紤]很多細(xì)節(jié)，例如：如果用戶已經(jīng)告訴了Devin具體怎么改，那只計(jì)算寫代碼的時(shí)間；如果Bug需要自己定位，那定位時(shí)間也要算進(jìn)去；如果這是一個(gè)陌生的遺留代碼庫(kù)，人類需要先花時(shí)間熟悉，而Devin已經(jīng)完成了這部分工作，這些時(shí)間同樣會(huì)計(jì)入價(jià)值。

第三步，再把工程師時(shí)間換算成美元。

Cognition采用統(tǒng)一的工程師成本標(biāo)準(zhǔn)，把“等效工程師小時(shí)”轉(zhuǎn)換成美元價(jià)值，再與企業(yè)實(shí)際支付的費(fèi)用進(jìn)行比較。

如果創(chuàng)造的價(jià)值高于成本，企業(yè)獲得正ROI；如果低于成本，Cognition就通過Productivity Guarantee返還credits（最高價(jià)值1000萬美元）。

當(dāng)然，Cognition并沒有宣稱這套算法能夠精確計(jì)算每一個(gè)任務(wù)的真實(shí)價(jià)值，他們?cè)诩夹g(shù)文檔里承認(rèn)，單個(gè)任務(wù)的估算可能存在2到3倍誤差。但他們認(rèn)為，隨著企業(yè)部署規(guī)模擴(kuò)大、任務(wù)數(shù)量增加，整體平均結(jié)果會(huì)越來越穩(wěn)定，更接近AI創(chuàng)造的真實(shí)生產(chǎn)力。

這套機(jī)制值得關(guān)注的地方也不是它能把每一行代碼都精確折算成多少錢。重點(diǎn)在于，它把AI Agent的價(jià)值衡量，從“消耗了多少token”，轉(zhuǎn)向了“替企業(yè)節(jié)省了多少工程時(shí)間”。

因?yàn)槟切┐篌w量的客戶并不會(huì)只因?yàn)橐粋€(gè)AI產(chǎn)品看起來很酷，就去大規(guī)模部署。它們要過預(yù)算、合規(guī)、安全、采購(gòu)和財(cái)務(wù)審核，必須有人解釋：為什么這筆錢值得花？

過去，ROI往往是客戶內(nèi)部采購(gòu)部門、業(yè)務(wù)部門或財(cái)務(wù)部門需要自己計(jì)算的事。軟件公司只負(fù)責(zé)賣工具，至于工具有沒有真正提升效率、節(jié)省成本，更多要靠客戶自己證明。買了、用了、效果不好，通常也是客戶自己消化。

但Cognition把這件事攬了過來，在銷售階段就主動(dòng)幫客戶把這筆賬算清楚，還用Productivity Guarantee把一部分風(fēng)險(xiǎn)接了過去。

這套打法也確實(shí)成為了Cognition擴(kuò)張故事的一部分：Cognition在融資時(shí)披露，企業(yè)用量今年以來增長(zhǎng)超過10倍，run-rate revenue已經(jīng)達(dá)到4.92億美元；同時(shí)，它把Citi、Goldman Sachs、Santander、Mercedes-Benz、Dell、美國(guó)陸軍和海軍等大客戶放在了最顯眼的位置。

Cognition這套邏輯帶來的最大價(jià)值就在于，它讓Devin從工程師手里的AI編程工具，變成了CFO能看懂、采購(gòu)部門能推進(jìn)、CEO能批準(zhǔn)的預(yù)算項(xiàng)。

畢竟，不是所有老板都會(huì)寫代碼，但所有老板都會(huì)算賬。

AI越像員工，就越要看結(jié)果

如果把視角從AI編程Agent放大到企業(yè)Agent，事實(shí)上，按結(jié)果衡量?jī)r(jià)值這件事，客服Agent已經(jīng)先走了一步。

比如Intercom。它原本就是做客戶服務(wù)軟件的，F(xiàn)in是它推出的AI客服Agent，它就是按一次成功結(jié)果收費(fèi)，官方價(jià)格是每個(gè)結(jié)果0.99美元。

Zendesk也是類似邏輯，作為老牌客服軟件公司，它的AI Agent面向客服工單場(chǎng)景，收費(fèi)單位是“自動(dòng)解決”：只有AI獨(dú)立解決了一次客戶問題，才會(huì)被計(jì)入收費(fèi)。

Sierra則從一開始就把自己定位成“按業(yè)務(wù)結(jié)果收費(fèi)”的企業(yè)Agent公司，服務(wù)客服、銷售、續(xù)費(fèi)、退訂挽回等場(chǎng)景，客戶為AI完成了多少次有效業(yè)務(wù)結(jié)果付費(fèi)。

因?yàn)榭头?chǎng)景的結(jié)果最容易定義。用戶問題有沒有被解決、工單有沒有關(guān)閉、客戶有沒有被成功轉(zhuǎn)化……這些結(jié)果比“一個(gè)PR到底創(chuàng)造了多少商業(yè)價(jià)值”更容易被衡量。

傳統(tǒng)的企業(yè)服務(wù)本來就看重結(jié)果，ROI敘事本身就是企業(yè)軟件、咨詢服務(wù)和IT外包行業(yè)里非常常見的商業(yè)邏輯。可以說，客服Agent率先把這套邏輯轉(zhuǎn)移到了AI領(lǐng)域，而Devin又把這套邏輯搬到了更復(fù)雜的軟件工程場(chǎng)景。

不過，AI行業(yè)里并不是所有產(chǎn)品都適合用ROI直接計(jì)費(fèi)。

底層模型API就像水電煤，模型公司提供的是算力和模型調(diào)用能力，客戶調(diào)用一次模型，就會(huì)產(chǎn)生真實(shí)的推理成本。所以O(shè)penAI、Anthropic、Google這類模型公司，仍然很難完全擺脫token、調(diào)用量或credits計(jì)費(fèi)。

Copilot類產(chǎn)品則更像傳統(tǒng)軟件，GitHub Copilot、Microsoft 365 Copilot、ChatGPT Business這類產(chǎn)品，主要賣的是一個(gè)固定入口和一套使用權(quán)限，所以更適合按人頭、按月訂閱。

但Agent產(chǎn)品不一樣。

我們之前在討論Claude Tag的時(shí)候就提過，“AI同事”并不等于免費(fèi)牛馬。

企業(yè)Agent越像一個(gè)真正的同事，token消耗就越不可能像普通聊天那樣可控。當(dāng)這個(gè)AI同事足夠聰明、足夠勤快、足夠愿意加班的時(shí)候，企業(yè)反而需要限制它的使用。

AI同事也要有預(yù)算；而一旦有預(yù)算，老板就會(huì)繼續(xù)往下問：這筆預(yù)算帶來了多少回報(bào)？

換句話說，如果AI只是工具，企業(yè)可以按使用量、按席位、按額度付費(fèi)；但如果AI被包裝成一個(gè)員工，老板自然也會(huì)用考核員工的方式考核它。

ROI敘事未必代表AI計(jì)費(fèi)方式的終點(diǎn)，也不意味著所有企業(yè)Agent都會(huì)立刻轉(zhuǎn)向按成果收費(fèi)。但Cognition確實(shí)在軟件工程這個(gè)更難量化的場(chǎng)景里，重新建立了一套R(shí)OI計(jì)算方法，展示了Agent商業(yè)化的一條清晰路徑。

畢竟，當(dāng)“AI員工”正式上崗，老板遲早會(huì)問一句：

這個(gè)AI員工，到底值不值這個(gè)價(jià)？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.