![]()
圖片系A(chǔ)I生成
AI快節(jié)奏的變化,已然打破原有產(chǎn)業(yè)鏈的運(yùn)行方式,從芯片、基礎(chǔ)設(shè)施,再到模型和應(yīng)用,產(chǎn)品的設(shè)計(jì)邏輯已被改寫。Token經(jīng)濟(jì)下,AI正從工具應(yīng)用走向生產(chǎn)要素,算力也隨之從資源供給升級(jí)為面向Token生產(chǎn)的系統(tǒng)能力。
爆發(fā)式的需求讓Token工廠成為資本和產(chǎn)業(yè)界追捧的熱點(diǎn),亦是今年產(chǎn)業(yè)發(fā)力的關(guān)鍵點(diǎn)。整個(gè)產(chǎn)業(yè)正在進(jìn)入由“能力競爭”邁向“生產(chǎn)范式競爭”的新階段,對(duì)算力規(guī)模、效率與能效提出了更高要求。
對(duì)于算力基礎(chǔ)設(shè)施服務(wù)商來說,走了幾十年的 “穩(wěn)態(tài)” 路線成了過去式,需要將分散、復(fù)雜的AI能力轉(zhuǎn)化為標(biāo)準(zhǔn)化、規(guī)模化的生產(chǎn)能力,為客戶提供面向未來的企業(yè)AI解決方案。
正如國際核能院院士、中國人工智能學(xué)會(huì)會(huì)士張勤所說:“隨著AI從語言理解邁向?qū)ξ锢硎澜绲恼J(rèn)知與交互,算力基礎(chǔ)設(shè)施也必須從單點(diǎn)供給升級(jí)為算力、網(wǎng)絡(luò)與能源協(xié)同的系統(tǒng)性底座,才能真正支撐智能應(yīng)用的規(guī)模化落地。”
只是,Token經(jīng)濟(jì)聽起來很美,真正要跑通,不只是在算力層,在應(yīng)用層、模型層等都還有無數(shù)的坑需要填。
算力產(chǎn)品底層邏輯已經(jīng)改寫
Token正在徹底重構(gòu)算力世界,成為中國AI產(chǎn)業(yè)的核心“貨幣”。據(jù)相關(guān)機(jī)構(gòu)預(yù)測,2026年中國整體Token調(diào)用量將達(dá)日均306.3萬億,2030年有望達(dá)到19306萬億,2025至2030年復(fù)合增長率高達(dá)210%。而在Token經(jīng)濟(jì)的“沖擊”下,算力基礎(chǔ)設(shè)施的底層邏輯也在被徹底改寫。
過去,在AI沒有真正火起來之前,服務(wù)器產(chǎn)品還是集中在通用計(jì)算和超算,那時(shí)候做產(chǎn)品規(guī)劃更多是以追隨上游廠商的CPU路線為主。而芯片的路線圖一般在三五年之內(nèi)都很清晰,不會(huì)有較大的變動(dòng),因此基礎(chǔ)設(shè)施產(chǎn)品的定義是一個(gè)“穩(wěn)態(tài)”的模式,可以把未來三年、五年一起都規(guī)劃了。
不僅如此,當(dāng)初的設(shè)計(jì)出發(fā)點(diǎn)就是要量產(chǎn),需要適配所有的CPU、各種型號(hào)的SSD、HHD等,中間還要不斷的驗(yàn)證,因?yàn)橐WC產(chǎn)品在客戶端每一個(gè)配置都不會(huì)出問題。并且,所有客戶的需求要摸清楚,各種成本要摸清楚,確保產(chǎn)品一上市就是一個(gè)爆款。
但AI時(shí)代到來后,一切都變了,整個(gè)產(chǎn)品的路線出現(xiàn)了一些不確定性,特別是GPU,可能產(chǎn)品還沒有來得及上市,就已經(jīng)過時(shí)了。
“等你摸清楚所有市場的需求,你摸清楚的那些可能已經(jīng)變了。”聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器事業(yè)部總經(jīng)理周韜指出,模型、應(yīng)用的層面更新更加快,當(dāng)我們發(fā)現(xiàn)DeepSeek可以搞一體機(jī),剛搞出來,好像就已經(jīng)過時(shí)了。今年年初龍蝦火了,但最近好像也不是那么熱了。
這時(shí),如果還沿用穩(wěn)態(tài)模式跟跑,只會(huì)永遠(yuǎn)慢市場半拍,算力產(chǎn)品的研發(fā)邏輯正在全面轉(zhuǎn)向敏態(tài)。所謂敏態(tài),核心就是放棄“全量適配、一步量產(chǎn)”的傳統(tǒng)思路。
現(xiàn)如今,客戶要的配置可能相對(duì)特別單一,沒有那么復(fù)雜,不用把所有想得到的都進(jìn)行交叉驗(yàn)證,快速迭代最好是讓客戶去看哪個(gè)是他真正需要的,快速形成一個(gè)產(chǎn)品,送測之后,客戶覺得不錯(cuò)再把它轉(zhuǎn)為量產(chǎn)的產(chǎn)品。
“這樣可以把原來從18個(gè)月,甚至更長演化、規(guī)劃的時(shí)間,縮短到幾個(gè)月的時(shí)間,投資的成本也會(huì)降低很多。原來一年的研發(fā)預(yù)算只能投兩三個(gè)產(chǎn)品,現(xiàn)在這種敏捷的模式,我就能投10個(gè)產(chǎn)品、15個(gè)產(chǎn)品,并不需要每一個(gè)投的產(chǎn)品最后都成功,可能投了10個(gè),有三四個(gè)成功就行了。”周韜說道。
在這套邏輯下,聯(lián)想問天也改變了原有的產(chǎn)品規(guī)劃模式,并新推出萬全異構(gòu)智算平臺(tái)V5.0、超節(jié)點(diǎn)解決方案,提出到2027年聯(lián)想中國基礎(chǔ)設(shè)施群要做到1000億元的業(yè)績目標(biāo),推動(dòng)算力基礎(chǔ)設(shè)施從“資源支撐載體”向“詞元生產(chǎn)系統(tǒng)”轉(zhuǎn)變。
周韜表示:“我們的目標(biāo),是讓客戶以更高效率、更低成本實(shí)現(xiàn)AI規(guī)模化應(yīng)用,讓算力從資源供給真正轉(zhuǎn)化為可交付、可擴(kuò)展、可持續(xù)的生產(chǎn)能力。”
Token工廠,還有無數(shù)的坑要填
產(chǎn)品研發(fā)邏輯的迭代,只是AI時(shí)代下變化的第一步。聯(lián)想問天在做的,一個(gè)是通過AI工廠、超智融合算力與全棧產(chǎn)品體系,將分散、復(fù)雜的AI能力轉(zhuǎn)化為標(biāo)準(zhǔn)化、規(guī)模化的生產(chǎn)能力;另外一個(gè),則是通過構(gòu)建高性能、低成本、可持續(xù)的基礎(chǔ)設(shè)施底座,為客戶提供面向未來的企業(yè)AI解決方案。
不過,推動(dòng)算力從資源供給走向價(jià)值生產(chǎn),當(dāng)行業(yè)真正試圖把算力中心變成“Token工廠”,才會(huì)發(fā)現(xiàn),面前還有很多坑要去填。
其中,計(jì)算系統(tǒng)就需要六大工藝去填補(bǔ),每一項(xiàng)都是決定Token成本與效率的關(guān)鍵。比如計(jì)算調(diào)優(yōu)工藝、緩存的工藝。緩存是目前國產(chǎn)卡做推理最大的瓶頸,需要進(jìn)一步做好KVcache命中以及緩存的量化。谷歌的相關(guān)技術(shù)論文曾引發(fā)存儲(chǔ)板塊股價(jià)大幅波動(dòng),足見緩存優(yōu)化對(duì)Token效率的影響力,也是當(dāng)前國內(nèi)算力廠商必須啃下的硬骨頭。
除此之外,在計(jì)算層面,還要做好容錯(cuò)、用電、通信以及能耗的工藝等。這些工藝的差距,也正是為什么同樣的GPU配置,不同廠商的集群跑出的Token吞吐量天差地別的原因。
而在填完計(jì)算這個(gè)坑后,還有數(shù)據(jù)治理、能效管理、安全合規(guī)、運(yùn)維管理等短板需要解決。聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群戰(zhàn)略總監(jiān)黃山透露,在安全層面,正在與火山合作,因?yàn)槿袊还糇詈莸氖嵌拱!艾F(xiàn)在的測試版本到了第二版,接近滿意,我希望第三輪之后,在7月份把它發(fā)到市場,目標(biāo)是能達(dá)到火山在公有云防豆包攻擊測試水平。”
需要指出的是,對(duì)于整個(gè)Token經(jīng)濟(jì)來說,算力基礎(chǔ)設(shè)施解決不了所有的卡點(diǎn)。黃山坦言,即便把數(shù)據(jù)、計(jì)算、安全、能效這些坑都填平,也只是能經(jīng)營好一個(gè)AIDC,賣Token而已,這個(gè)時(shí)候AI應(yīng)用落地會(huì)怎樣?模型有沒有選對(duì)?智能體做的好不好?架構(gòu)、算力在AIDC之上還有幾個(gè)卡點(diǎn)。
簡單來說,上層應(yīng)用不成熟,對(duì)Token的需求就起不來,算力投資難以收回成本。Token成本居高不下,企業(yè)就不敢大規(guī)模投入應(yīng)用創(chuàng)新,場景就永遠(yuǎn)跑不出來。
“好在全世界那么多的大咖下了很大的決心往里面使勁砸錢,我們希望這些錢能夠用到對(duì)的技術(shù)上。”黃山說道。(文 | 志讀科技,作者 | 杜志強(qiáng))
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.