十二個月前,三位工程師盯著同一塊 Datadog 儀表板,每月燒掉 4200 美元 AI 基礎設施費,居然沒一個人能說清楚這些錢被哪個功能花掉了。兩個監控工具、一個儀表板,統統只能回答“花了多少”——卻沒人追問“哪個功能在燒錢”“哪個用戶觸發的”“哪個服務調用的”。當賬單開始失控時,這三個數字才是唯一值得看的。
那個下午,他們終于給每一次大模型調用打上了功能、服務和用戶標簽。48 小時的數據跑出來,團隊立刻意識到自己之前的直覺錯得離譜。不到半杯咖啡的時間,每個功能的真實成本赤裸裸攤在眼前,和大家的“感覺排名”完全相反。
![]()
先來看看這六項接入 GPT-4o 的功能:合同分析器,上傳文檔時自動提取條款并標記風險;執行摘要生成器,用戶主動請求時按需運行;智能搜索,跨文檔庫做語義檢索;合規檢查器,每次文檔保存都跑一遍;內聯紅線建議器,選中文本時觸發;審計跟蹤敘述器,每晚為文檔生成人類可讀的審計日志。團隊原以為合同分析器最燒錢,其次是智能搜索,剩下幾個不過是零頭。收入影響方面,他們也篤定合同分析器和執行摘要生成器是推動用戶升級的主力。結果,兩樣全都猜反了。
實際歸因數據甩在臉上:
合規檢查器,月費 1890 美元,吞掉總預算的 45%,平均每次調用 0.087 美元;
審計跟蹤敘述器,月費 1102 美元,占 26%,每次 0.24 美元;
合同分析器,672 美元,僅占 16%,每次 0.31 美元;
執行摘要生成器,294 美元,7%,每次 0.18 美元;
智能搜索,168 美元,4%,每次 0.021 美元;
內聯紅線建議器,74 美元,2%,每次不到一美分。
被團隊寄予厚望、花了兩周拼命優化的合同分析器,只排在第三。而兩個從未在任何一次成本復盤會上被提起的功能,正聯手吞掉 71% 的預算。
合規檢查器,月耗 1890 美元,零報錯,零超時,零失敗請求,沒有任何一條告警被觸發。每一條日志都干凈得像教科書。它通過設計完美地浪費錢:文檔自動保存間隔設為 30 秒,40 個活躍企業用戶意味著每小時 4800 次調用,每個工作日開足馬力。功能并沒有“壞掉”,壞掉的是設計——堆棧里沒有任何機制能區分“正確運行”和“昂貴運行”,因為在響應層面它們長得一模一樣。修復干凈到只有一行代碼:把合規檢查從每次自動保存的鉤子拆下來,改成只在手動觸發和文檔提交時運行。月費應聲斷崖式下跌,從 1890 美元變成 190 美元。
審計跟蹤敘述器的賬單同樣駭人:每月 1102 美元,至少 60% 純屬浪費。它按計劃夜間運行,為所有有活動記錄的文檔生成完整敘述,包括那些被自動化流程、系統集成、后臺作業摸過的文檔。這意味著大約六成文檔的審計日志根本沒有任何人類讀者——他們在為空無一人的觀眾席寫散文,夜夜如此。修復方案很樸素:只對由人工操作觸發的活動生成敘述,且至少積累三次人工編輯后再運行。成本隨即收縮到原來的零頭。
最諷刺的地方在于:當團隊以為自己在死磕最耗錢的功能時,真正的吞金獸正安靜地趴在最不起眼的角落里,從不觸發警報,從不出錯,每月穩穩收走一大筆賬單。數據歸因之前,所有的優化沖動都打在棉花上,花兩周死磕合同分析器,不如一行代碼把自動保存的鉤子松開。
工具鏈不能只會統計總量,必須回答“哪個功能”“哪個用戶”“哪個服務”——賬單攀高時,缺了這三個數字的任何成本復盤都是瞎子摸象。那 48 小時的歸因數據,比三個月的人肉直覺值錢得多。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.