无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

優化AI架構提升token產出率的四個方向

2026-06-04 09:41:56　來源: AI先鋒官

北京舉報

0

分享至

Token消耗是當下AI 行業的最核心議題，甚至關系到對 AI產業的價值評估。

Glean主營企業AI token成本、RAG上下文架構的優化，年營收3億美元。公司創始人&CEO Arvind Jain首創token產出率(token yield)行業分析框架，是企業落地大模型成本管控領域的代表人物。

以下是他今天最新推出的專文：

《你的token開銷本質是AI架構問題，而非單純模型問題》

企業級AI的token開銷正在快速攀升，尤其隨著技術從簡易對話助手轉向代碼智能體、AI協作助手與長周期運行工作流。

這類系統單次任務的運算量大幅提升，對應的token消耗量也水漲船高。這給企業帶來全新運營約束：問題不再是AI有沒有實用價值，而是其產出的有效收益能否覆蓋投入成本。

各項開銷數據已不容忽視。德勤2025年科技價值調研顯示，超半數受訪企業將21%至50%的數字化項目預算投向AI，平均占比36%。

Ramp近期披露，月度AI開銷同比暴漲4倍；《財富》報道稱，Uber僅用四個月就耗盡了2026全年AI代碼工具預算。

在我和眾多企業負責人的交流中普遍發現：token消耗增速持續走高，但業務價值沒能同步增長。

正因如此，企業需要跳出原始token用量指標，選用更科學的核算標準。關鍵不在于系統耗用了多少token，而是每消耗單位token能產出多少有效落地成果，簡言之：token產出率。

從AI投入產出邏輯來看，該衡量方式更合理，因為token消耗很少只由模型本身決定，而是受整套配套系統影響：上下文檢索邏輯、工具調用方式、任務拆分規則、模型調度策略、過往執行結果復用機制。

一旦架構設計低效，即便最終輸出質量沒有提升，token開銷依舊會持續上漲。

token不單單是提示詞里的文本內容

一句簡短的用戶指令，就可能催生高額token賬單。

舉例提示詞：“分析這些賬戶流失風險并生成跟進任務”。肉眼可見的提示詞篇幅很短，但實際token負載往往包含系統預置指令、工具參數定義、檢索獲取的文檔、中間推理內容、運行日志與記憶數據。

多數企業級AI系統里，絕大部分token并非由用戶手動輸入，而是任務配套框架自動生成。

這時架構設計的重要性便凸顯出來：若系統無差別拉取過量上下文、頻繁調用冗余工具、重復執行已完成運算、把常規任務交由成本高昂的前沿大模型處理，token成本上升的同時，產出質量卻毫無改善。

資源浪費不在單條提示詞，而在頂層系統架構設計。

所以token產出率歸根結底是架構層面的問題。

四項決定token使用效率的架構優化方向

1. 上下文質量

多數企業AI落地失利，根源都出在上下文環節。

模型無法自主甄別有效上下文信息，只會全盤處理傳入數據；上下文體量越大，模型解析信息產生的開銷越高。若檢索數據源雜亂冗余，模型會耗費token在無關、矛盾信息上梳理，無法聚焦有效信息落地任務。

優化思路不是往提示詞里堆砌更多數據，而是優化檢索精度。

這也是上下文層架構至關重要的原因。在對標Claude Cowork類任務的基準測試中，@glean自研中心索引方案的選用頻次約是通用MCP工具的2.5倍，而通用MCP工具的token消耗量高出約30%。

更關鍵的是：即便通用工具輸出結果達標，也要耗用約83k tokens，Glean僅需43k tokens。

簡言之，檢索能力薄弱會迫使系統通過增加工具調用次數、反復推理、過量拉取數據彌補短板，這就是劣質上下文架構暗藏的隱性成本。

成熟的上下文層設計恰好相反：提前給模型精準、規整的有效信息，讓token全部用在解決業務問題，而非拼湊原始素材。

2. 模型調度

智能體工作流里，并非所有步驟都需要調用前沿高階模型做深度推理。

企業AI大量工作屬于常規運維類：信息檢索、檢索方案規劃、工具選型、結果校驗、流程管控。這類環節不可或缺，但沒必要全線啟用成本最高的前沿模型。

多模型混合架構的價值正在于此：不是所有場景都一刀切使用輕量化模型，而是按需匹配算力層級適配任務難度。

業務規模化后，該選型邏輯愈發關鍵。倘若系統默認所有步驟都路由至高價前沿模型，企業等于為標準化常規工作支付頂配算力費用。

按需匹配模型規格是提升token產出率最直接的手段：高價值差異化任務保留前沿模型推理，重復標準化業務選用專用輕量化模型。

3. 持續迭代學習

企業AI系統不應每次處理同類問題都從零推演。

每一輪任務執行都會沉淀優化線索：哪些工具適配場景、哪條檢索鏈路最優、哪些步驟屬于冗余操作、哪些輸出真正幫用戶完成業務。

人類工作正是這套邏輯：優質成果會留存歸檔，避免重復造輪子，企業AI系統也應遵循該邏輯。日積月累的運行日志，能幫系統規避重復試錯，高效處理同類需求。

缺少學習沉淀的系統，會不斷為重復試錯持續買單。

這是AI成本管控里容易被忽略的一環：能復用過往執行經驗的系統，可精簡無效推理、舍棄失敗路徑、快速收斂最優工作流，不僅優化輸出質量，還能壓低重復任務的token開銷。

優質企業級AI會形成復利效應：完成一項任務，就能優化后續同類任務的投入成本。

4. 運行框架設計

隨著智能體承接長鏈路、多步驟復雜任務，運行框架直接左右最終效果與token成本。

簡陋的運行框架會無限制擴充有效上下文窗口，每一步迭代都不斷疊加指令、工具定義、運行狀態和中間結果，任務越長開銷越高，輸出穩定性同步下滑。

優質運行框架奉行上下文管控思路，而非無限制累積信息：按需為單步驟限定可用工具、復雜任務拆分給多個專用智能體協作、中間運行數據外置存儲而非全留在即時上下文，每個模型僅載入當前必需的數據集。

設計目標不只是支撐復雜業務，更是在上下文不冗余膨脹的前提下控制成本。

AI真正的核心壁壘，是任務執行效率。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Karpathy投了一家AI記憶公司，撞名DeepSeek Engram記憶架構

機器之心Pro 2026-06-24 18:38:15
3 跟貼 3
巨頭打響Context之戰，重構AI護城河

鈦媒體APP 2026-06-24 15:34:23
0 跟貼 0

數智時代新官上任：算法信任與系統植入的“靜力點火術”

經濟觀察報 2026-06-08 11:20:59
0 跟貼 0

讓AI自動發現前沿風險：創智×復旦×牛津發布AutoControl-Arena

機器之心Pro 2026-06-24 20:00:00
0 跟貼 0
二元成功率已經過時！PRM-as-a-Judge是你需要的具身操作評測框架

機器之心Pro 2026-04-14 12:24:23
0 跟貼 0

我們跟吉利、杰克、美的的實干派，聊了聊工業智能體的真相

虎嗅APP 2026-06-25 02:00:12
0 跟貼 0

具身智能的數據困境，不只在數量

智東西 2026-06-24 22:11:53
0 跟貼 0
融資6.7億！卡帕西押注，這家創企要讓AI學會你的工作

智東西 2026-06-24 19:35:23
0 跟貼 0

Token調用量增長超10倍！豆包大模型2.1上線，Seedance 2.5預計7月初正式上線

華爾街見聞官方 2026-06-23 14:56:31
1 跟貼 1
為何頂級陽謀困局，深度剖析其底層邏輯，運行機制及其影響力！

清晨的世界 2026-06-23 00:59:26
0 跟貼 0
中方投下贊成票

政知新媒體 2026-06-24 09:57:23
2748 跟貼 2748
教練車油改電后，用車成本直接降到谷底，滿電只要三塊錢！

搞笑脫口秀 2026-06-24 15:30:26
1 跟貼 1
網友吐槽“被WPS背刺了”，公司回應

南方都市報 2026-06-23 20:17:09
1737 跟貼 1737
算力荒，但Token卻便宜了，智算云的賬該怎么算？

鈦媒體APP 2026-06-24 13:15:23
0 跟貼 0
伊朗無人機施壓特朗普，戰爭邏輯轉變，中國成最大變量

精彩一網打盡 2026-06-23 06:14:41
0 跟貼 0
張家界大庸古城將重新開業！曾因耗資24億4年虧損超10億被焦點訪談“關注”

紅星新聞 2026-06-24 19:33:08
1443 跟貼 1443
郭春林 2026教育大變局！人才選拔邏輯已經發生了改變

安安折紙 2026-06-24 02:57:06
0 跟貼 0
插混vs增程，聊透邏輯，選購干貨，幫你少虧20萬！

X基地 2026-06-24 14:05:51
0 跟貼 0
1:9寶馬合金模型！避震聯動+燈光，細節絕了！#機車模型

制造科技 2026-06-23 01:02:22
0 跟貼 0
美財長貝森特：一旦烏克蘭戰爭結束，預計俄羅斯將重新回到美元體系

瀟湘晨報 2026-06-24 21:10:28
338 跟貼 338
豆包專業版采用三級階梯定價方案，最高一年6000元

第一財經 2026-06-24 09:14:12
1350 跟貼 1350
老鷹完成人類指令有獎勵，訓鷹人都驚了，大鳥食物怕不是橡膠做的

日常逗趣集 2026-06-24 09:09:14
1 跟貼 1
福建高考分數線發布

央視新聞 2026-06-24 16:41:54
1070 跟貼 1070
7月1日起強制執行！新能源車安全底線全面刷新

8099999街頭巷尾 2026-06-24 20:59:22
1 跟貼 1
免費版夠用、專業版更強，豆包這次收費被罵太冤了？

雷科技 2026-06-25 00:10:04
0 跟貼 0
清華微軟聯合提出STAR-PólyaMath，Apex基準超GPT-5.5 13.5%

機器之心Pro 2026-06-24 19:43:36
0 跟貼 0
自動駕駛強制國標出臺，業內又為激光雷達吵起來？

愛駕天下 2026-06-24 17:03:41
0 跟貼 0
這渦扇模型真能轉還帶聲？全合金超1000零件！#硬核模型

制造科技 2026-06-22 19:32:06
0 跟貼 0
最貴349元/斤！雨后大量出現地衣，很多杭州人在撿，“出門就有”

環球網資訊 2026-06-24 14:30:30
131 跟貼 131
個稅飆升12%，收入只增4.2%，反差信號背后的促消費難點｜商業微史記

界面新聞 2026-06-24 14:09:58
630 跟貼 630
知情人士曝因后續淘汰賽未攜帶完整裁判組，馬寧基本確定無緣主裁機會；此前FIFA官宣馬寧擔任法國VS挪威比賽第四官員

封面新聞 2026-06-24 18:54:06
132 跟貼 132
黃曉明中餐廳上演霸總式管理，一連串指令下來讓眾人敢怒不敢言

小七說籃球 2026-06-24 16:27:20
1 跟貼 1
山東曲阜動物園被指將狗狗染成熊貓色用以宣傳引流，園方：若大家不喜歡會考慮取消

南陽日報 2026-06-24 18:34:49
82 跟貼 82
并行三代理：會議摘要本該這么穩

硅嶼手記 2026-06-25 03:36:14
0 跟貼 0
茶飲店打烊前接到千元訂單，00后員工沒有抱怨默默干活，店主給每人發兩千元紅包

瀟湘晨報 2026-06-24 15:49:15
86 跟貼 86
男子制作的桌子很漂亮，其實成本并不高

大叔探世界 2026-06-22 17:24:21
0 跟貼 0
十二年異鄉求學被挖去雙眼的男孩考了個"全國第一"

新民周刊 2026-06-24 21:46:33
42 跟貼 42
41歲C羅梅開二度創六屆進球紀錄：不想與他人比較我只希望球隊能贏｜封面頭條

封面新聞 2026-06-24 10:09:03
325 跟貼 325
多地優化政策：停車61分鐘，再不能按2小時收費了

陽泉日報 2026-06-24 16:57:00
48 跟貼 48
陽光電源市值領跑光儲板塊

第一財經資訊 2026-06-25 01:12:57
11 跟貼 11

價格暴漲！山姆、盒馬已限購！

廣州生活美食圈

2026-06-24 12:29:42

603001，4天2板！最新公告：籌劃購買資產，停牌！

603001，4天2板！最新公告：籌劃購買資產，停牌！

證券時報e公司

2026-06-25 02:10:06

穆里尼奧：“我非常珍視那張與瓜迪奧拉和路易斯·恩里克的合影”

穆里尼奧：“我非常珍視那張與瓜迪奧拉和路易斯·恩里克的合影”

綠茵情報局

2026-06-25 00:00:59

“開屏廣告沒了”登頂熱搜，大量網友驚喜反饋高德地圖、百度地圖、微博等App能“秒進”主頁，體驗極為“絲滑”

“開屏廣告沒了”登頂熱搜，大量網友驚喜反饋高德地圖、百度地圖、微博等App能“秒進”主頁，體驗極為“絲滑”

大風新聞

2026-06-23 22:27:03

袁詠儀回應兒子進娛樂圈：我沒看到他的天分！其與張智霖之子身高超1米8，帥氣五官酷似爸媽

袁詠儀回應兒子進娛樂圈：我沒看到他的天分！其與張智霖之子身高超1米8，帥氣五官酷似爸媽

臺州交通廣播

2026-06-24 13:41:22

破防了！土耳其排協體面送別老將，中國女排功勛，只剩默默退場

破防了！土耳其排協體面送別老將，中國女排功勛，只剩默默退場

金毛愛女排

2026-06-24 00:00:07

特朗普在臺灣問題上，終于不裝了！

特朗普在臺灣問題上，終于不裝了！

果媽聊娛樂

2026-06-24 10:50:19

廣西一地5年發現1420例！50歲以上成艾滋重災區，這個數據太扎心

廣西一地5年發現1420例！50歲以上成艾滋重災區，這個數據太扎心

小怪吃美食

2026-06-25 00:13:37

6月24日，萬眾期待的養老金調整通知公布了嗎？漲2.2%很難嗎？

6月24日，萬眾期待的養老金調整通知公布了嗎？漲2.2%很難嗎？

兵鑒史

2026-06-24 13:43:41

理想L8 Ultra實測續航1779.5公里！李想：還有人質疑增程沒技術含量嗎？

理想L8 Ultra實測續航1779.5公里！李想：還有人質疑增程沒技術含量嗎？

快科技

2026-06-24 17:30:16

國際足聯主席確認：特朗普將出席世界杯決賽，并向冠軍頒獎

國際足聯主席確認：特朗普將出席世界杯決賽，并向冠軍頒獎

環球網資訊

2026-06-24 11:50:36

高考出分后，他發帖求助：中流985還是再戰一年？

高考出分后，他發帖求助：中流985還是再戰一年？

娛圈觀察員

2026-06-24 00:11:16

山姆會員離世家屬持證明退費系統提示需本人到場客服：建議聯系就近門店

山姆會員離世家屬持證明退費系統提示需本人到場客服：建議聯系就近門店

中國能源網

2026-06-24 16:03:48

澤連斯基發出最后通牒，莫斯科擺明要袖手旁觀：盧卡申科大概藥丸

澤連斯基發出最后通牒，莫斯科擺明要袖手旁觀：盧卡申科大概藥丸

鷹眼Defence

2026-06-23 17:02:51

消失的150萬契丹人找到了？DNA比對結果一出，原來就在我們身邊

消失的150萬契丹人找到了？DNA比對結果一出，原來就在我們身邊

馬蹄燙嘴說美食

2026-06-24 21:36:53

國際油價24日顯著下跌

新華社

2026-06-25 04:03:13

原來她是姆巴佩新女友，坐擁全球超2400萬粉絲，曾對足球一竅不通

原來她是姆巴佩新女友，坐擁全球超2400萬粉絲，曾對足球一竅不通

手工制作阿殲

2026-06-24 04:57:16

上海79歲爺叔懵了：宅基地檔案上，多了個“陌生妻子”！前后3段婚姻，配偶都不是她；派出所也查不出這人到底是誰……

上海79歲爺叔懵了：宅基地檔案上，多了個“陌生妻子”！前后3段婚姻，配偶都不是她；派出所也查不出這人到底是誰……

大風新聞

2026-06-24 16:57:19

百萬粉絲女博主在線相親：誰替我還12萬我就嫁給誰！

百萬粉絲女博主在線相親：誰替我還12萬我就嫁給誰！

曹莽看世界

2026-06-24 17:30:28

皇馬欲4.04億元截胡阿森納，馬丁內利立場浮出水面

皇馬欲4.04億元截胡阿森納，馬丁內利立場浮出水面

瀟湘煙雨水

2026-06-25 04:46:43

AIGC大模型及應用精選與評測

552文章數 92關注度

往期回顧全部

科技要聞

豆包專業版上線：定價68-500元每月

頭條要聞

15歲男孩肥胖誘發糖尿病搶救無效離世

頭條要聞

15歲男孩肥胖誘發糖尿病搶救無效離世

體育要聞

字母哥，會把凱爾特人拆了嗎？

娛樂要聞

向佐向佑兄弟合體直播！母子終于和解

財經要聞

逃稅23億：審計署年報直指七家機構

汽車要聞

施鵬澤：為什么奧迪E7X強調座艙氣味安全?

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

時尚

數碼

親子

軍事航空

教育要聞

2026高考分數線最新匯總！12省已公布，含藝術類各專業分數線

那些搞砸高考的年輕人，人生完蛋了嗎？

數碼要聞

三星電子公眾號注銷！家電業務已官宣退出中國大陸市場

親子要聞

今天教兒子如何擦屁股

軍事要聞

伊朗代表：霍爾木茲海峽已免費開放

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版