![]()
“對(duì)于每一個(gè)企業(yè)來(lái)說(shuō),怎么用好Tokens,是一門必修課。”
作者丨胡敏
編輯丨包永剛
2026年,AI應(yīng)用的普及讓Token消耗量進(jìn)入指數(shù)級(jí)增長(zhǎng)。但對(duì)企業(yè)來(lái)說(shuō),這不是一個(gè)抽象的數(shù)字游戲,每一筆Token消耗,都是真金白銀的算力賬單。一家中等規(guī)模的AI客服公司,月Token消耗從去年底的幾百萬(wàn)飆升到現(xiàn)在的上億;一家做代碼助手的創(chuàng)業(yè)公司,半年內(nèi)Token成本漲了5倍,增速超過(guò)了收入。
類似的案例正在各行各業(yè)上演。Token用得多,說(shuō)明業(yè)務(wù)在增長(zhǎng)。但問(wèn)題也隨之而來(lái):Token成本正在吃掉企業(yè)利潤(rùn)。很多公司陷入了一個(gè)尷尬的局面,業(yè)務(wù)越火,算力賬單越燙手。
本期圓桌,我們聚焦企業(yè)視角,邀請(qǐng)三位算力成本一線的實(shí)戰(zhàn)派,拆解:企業(yè)到底怎么才能把Token成本降下來(lái)?
01
核心議題
我們將討論這4個(gè)你最關(guān)心的問(wèn)題:
第一,看看大家Token賬單都有多夸張?
三位大咖將分享他們親身經(jīng)歷的“最離譜”消耗案例,那些讓你肉疼的數(shù)字。
第二,再查查這些“錢”燒在哪?
企業(yè)Tokens成本,到底被誰(shuí)吃掉了?是無(wú)效的推理調(diào)用、過(guò)長(zhǎng)的上下文,還是模型架構(gòu)本身的低效?當(dāng)前企業(yè)對(duì)于“降本”這件事,是已有成熟方法論,還是仍在迷茫摸索。
第三,拆解省錢實(shí)操路徑
我們將從三個(gè)維度,一次性講透降本方法:
使用側(cè):優(yōu)化提示詞、減少無(wú)效調(diào)用、控制輸出長(zhǎng)度……這些“小動(dòng)作”到底能省多少錢?有哪些反直覺(jué)的坑?
采購(gòu)側(cè):OpenAI、Anthropic、DeepSeek……模型怎么選?便宜的模型真的更省錢嗎?訂閱制看似劃算,但遭遇“封號(hào)”風(fēng)險(xiǎn)怎么辦?從廠商直購(gòu)還是走第三方平臺(tái)?
技術(shù)側(cè):從模型、工程到硬件,哪些降本路徑真正有效?哪些只是看上去美好
第四,解答你對(duì)未來(lái)的擔(dān)憂
二級(jí)市場(chǎng)擔(dān)心“Tokens用得越多,利潤(rùn)越薄”,這個(gè)擔(dān)心有必要嗎?未來(lái)企業(yè)Tokens成本會(huì)繼續(xù)快速下降,還是會(huì)遇到天花板?
02
圓桌嘉賓
![]()
九章云極聯(lián)合創(chuàng)始人兼COO 尚明棟
尚明棟,畢業(yè)于北京航空航天大學(xué)和美國(guó)雪城大學(xué)(Syracuse University),計(jì)算機(jī)工程等前瞻學(xué)術(shù)經(jīng)歷為其后的技術(shù)生涯奠定了堅(jiān)實(shí)的基礎(chǔ)。原微軟服務(wù)器高可用集群文件系統(tǒng)核心開發(fā)工程師, 曾參與發(fā)布Windows 7和Windows 8,是SMB 3.0的主要擬草人之一。擁有Continuous Availability over Cluster Failover和Multichannel over SMB 等美國(guó)專利,在文件系統(tǒng)和海量數(shù)據(jù)可靠傳輸領(lǐng)域具有深厚造詣。
2013年,尚明棟聯(lián)合創(chuàng)立了九章云極DataCanvas,并擔(dān)任COO,負(fù)責(zé)公司人工智能基礎(chǔ)設(shè)施軟件的技術(shù)架構(gòu)、團(tuán)隊(duì)管理和智算產(chǎn)品的創(chuàng)新研發(fā),引領(lǐng)公司在智算領(lǐng)域取得顯著成果。作為行業(yè)內(nèi)的技術(shù)領(lǐng)袖,他以其卓越的創(chuàng)新能力和豐富的行業(yè)經(jīng)驗(yàn),為推動(dòng)人工智能技術(shù)的發(fā)展做出重要貢獻(xiàn)。
![]()
云天勵(lì)飛副總裁、智算研究院院長(zhǎng)肖嶸
肖嶸,現(xiàn)任深圳云天勵(lì)飛技術(shù)股份有限公司副總裁、兼智算研究院院長(zhǎng),正高級(jí)工程師。先后入選國(guó)家重大人才工程、深圳市孔雀計(jì)劃 A 類人才。 肖嶸博士本、碩、博均畢業(yè)于南京大學(xué),擁有扎實(shí)的學(xué)術(shù)背景和長(zhǎng)期的產(chǎn)業(yè)實(shí)踐經(jīng)驗(yàn)。
曾任微軟研究院高級(jí)研究員、微軟必應(yīng)搜索資深軟件工程師,以及平安產(chǎn)險(xiǎn)人工智能部總經(jīng)理等職務(wù),在人工智能核心技術(shù)研發(fā)與規(guī)模化應(yīng)用方面積累了豐富經(jīng)驗(yàn)。 其主要研究方向涵蓋機(jī)器視覺(jué)、大規(guī)模搜索引擎、多模態(tài)大模型等領(lǐng)域,長(zhǎng)期致力于推動(dòng)前沿算法向?qū)嶋H場(chǎng)景落地轉(zhuǎn)化。
曾榮獲吳文俊人工智能科技進(jìn)步獎(jiǎng)一等獎(jiǎng)、微軟 ICICLE 獎(jiǎng)、平安集團(tuán)重大創(chuàng)新獎(jiǎng)等多項(xiàng)重要榮譽(yù)。其主持研發(fā)的 OCR 表格識(shí)別、人臉識(shí)別算法在多項(xiàng)國(guó)內(nèi)外權(quán)威比賽中多次奪冠;主導(dǎo)打造的“云天天書”大模型在 C-Eval、CMMLU、MMBench 等權(quán)威評(píng)測(cè)榜單中取得第一名的成績(jī)。
目前,肖嶸博士主持云天勵(lì)飛智算研究院工作,重點(diǎn)聚焦大模型推理優(yōu)化與具身智能多模態(tài)大模型兩個(gè)前沿研究方向,持續(xù)推動(dòng)人工智能技術(shù)創(chuàng)新與產(chǎn)業(yè)化應(yīng)用。
![]()
云器科技聯(lián)合創(chuàng)始人、CTO關(guān)濤
關(guān)濤 Tony,云器科技聯(lián)合創(chuàng)始人/CTO,分布式系統(tǒng)和大數(shù)據(jù)平臺(tái)領(lǐng)域?qū)<摇?/p>
曾任阿里云計(jì)算平臺(tái)事業(yè)部研究員,前阿里巴巴通用計(jì)算平臺(tái)MaxCompute、Dataworks負(fù)責(zé)人,負(fù)責(zé)阿里巴巴主線大數(shù)據(jù)平臺(tái)。前阿里巴巴和螞蟻集團(tuán)技術(shù)委員會(huì)計(jì)算平臺(tái)領(lǐng)域組長(zhǎng)、阿里云架構(gòu)組大數(shù)據(jù)組組長(zhǎng)。
加入阿里云之前,在微軟云計(jì)算和企業(yè)事業(yè)部工作 9 年,主持和參與開發(fā)了Azure DatalakeAnalytics、Cosmos/Scope等多套超大規(guī)模分布式存儲(chǔ)和計(jì)算平臺(tái)。并著有多篇國(guó)內(nèi)外會(huì)議論文和專利。
03
2026 年 4 月 10 日 14:00(北京時(shí)間)
觀看平臺(tái)
視頻號(hào) “雷峰網(wǎng)”直播間
掃碼預(yù)約,看看其他企業(yè)是怎么省錢的~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.