公眾號(hào)記得加星標(biāo)??,第一時(shí)間看推送不會(huì)錯(cuò)過(guò)。
人工智能熱潮首先席卷了GPU市場(chǎng),隨后內(nèi)存需求激增。如今,人工智能熱潮正在沖擊CPU市場(chǎng),導(dǎo)致CPU供應(yīng)短缺和價(jià)格上漲,這可能會(huì)影響那些希望構(gòu)建和發(fā)布人工智能產(chǎn)品的企業(yè),以及任何其他需要CPU的用戶。
SemiAnalysis創(chuàng)始人迪倫·帕特爾近日表示: “過(guò)去六個(gè)月,我們看到整個(gè)云市場(chǎng)的CPU資源都已耗盡。到處都沒(méi)有足夠的容量,這導(dǎo)致了很多不穩(wěn)定因素。”
例如,帕特爾表示,微軟的GitHub版本控制網(wǎng)站最近變得不穩(wěn)定,使用它的開發(fā)者經(jīng)常遇到錯(cuò)誤。這是因?yàn)椤拔④洶阉惺S嗟腃PU都賣給了其他人,一部分供內(nèi)部實(shí)驗(yàn)室使用,但更多的是賣給了外部實(shí)驗(yàn)室,”他解釋說(shuō)。“他們已經(jīng)與Anthropic和OpenAI簽署了協(xié)議,所以他們沒(méi)有剩余的CPU了。”
帕特爾表示,盡管AWS在過(guò)去一年中將CPU產(chǎn)量提高了三倍,但仍然感受到了CPU短缺的壓力。亞馬遜首席執(zhí)行官安迪·杰西在致股東的年度信中寫道:“……已有兩家AWS大客戶詢問(wèn)是否可以在2026年購(gòu)買我們所有Graviton實(shí)例容量(Graviton是我們廣泛采用的定制CPU芯片)——考慮到其他客戶的需求,我們無(wú)法滿足這些請(qǐng)求,但這足以說(shuō)明市場(chǎng)需求。”
帕特爾上個(gè)月在代托納計(jì)算大會(huì)上接受伊萬(wàn)·布拉津的現(xiàn)場(chǎng)采訪時(shí)發(fā)表了上述言論。在采訪中,他詳細(xì)闡述了CPU短缺的原因。
帕特爾表示,CPU在人工智能領(lǐng)域一直扮演著重要角色,曾被用于存儲(chǔ)、數(shù)據(jù)預(yù)處理、預(yù)訓(xùn)練以及人工智能訓(xùn)練過(guò)程中的檢查點(diǎn)等任務(wù)。“但以前CPU的功能非常有限,”他說(shuō)道。
到了2025年初,情況發(fā)生了變化:推理模型的出現(xiàn)。突然之間,我們擁有了功能更強(qiáng)大的AI模型,而這種能力正在推動(dòng)對(duì)CPU的需求。
他說(shuō),現(xiàn)在客戶不再使用正則表達(dá)式對(duì)模型進(jìn)行簡(jiǎn)單的檢查,而是對(duì)模型進(jìn)行更加復(fù)雜的檢查。
他說(shuō):“你在進(jìn)行代碼單元測(cè)試和編譯。你在運(yùn)行代理流程,其中實(shí)際上會(huì)調(diào)用數(shù)據(jù)庫(kù)等等。或者你在與一些占用大量 CPU 資源的環(huán)境進(jìn)行交互,例如物理模擬或生物模擬。”
“你不斷地涉足越來(lái)越復(fù)雜的事情,模型輸出結(jié)果會(huì)經(jīng)過(guò)驗(yàn)證,進(jìn)入強(qiáng)化學(xué)習(xí)環(huán)境,然后再返回并基于此進(jìn)行訓(xùn)練,”帕特爾繼續(xù)說(shuō)道。“而且在過(guò)去的幾年里,這個(gè)循環(huán)變得越來(lái)越緊密。”
我們一直在關(guān)注CPU再次成為熱門技術(shù)的趨勢(shì)。我們見證了人工智能處理需求的演變,人工智能推理的重要性已經(jīng)超過(guò)了人工智能訓(xùn)練。我們也看到,針對(duì)人工智能推理的兩個(gè)階段——預(yù)填充和解碼階段——出現(xiàn)了新的服務(wù)器架構(gòu),這兩個(gè)階段的需求截然不同。
我們看到英偉達(dá)通過(guò)推遲發(fā)布七個(gè)月前宣布用于人工智能推理的 Rubin CPX GPU 來(lái)應(yīng)對(duì)這些變化,轉(zhuǎn)而將芯片投入到其他處理器類型中,包括花費(fèi) 200 億美元收購(gòu)知識(shí)產(chǎn)權(quán)的 Groq LPU,以及其新的 Vera ARM CPU,該公司指望這兩款產(chǎn)品能夠推動(dòng)“推理之王”的經(jīng)濟(jì)效益。
上個(gè)月,我們見證了Arm Holdings 攜其首款芯片AGI CPU強(qiáng)勢(shì)回歸,這款CPU由Arm與Meta聯(lián)合設(shè)計(jì),旨在服務(wù)于蓬勃發(fā)展的AI推理市場(chǎng)。本月初,芯片制造商d-Matrix收購(gòu)了GigaIO的數(shù)據(jù)中心業(yè)務(wù),以拓展其除PCI接口AI加速器之外的產(chǎn)品線。就在上周,SambaNova和Intel攜手合作,共同打造了一套用于構(gòu)建大規(guī)模可擴(kuò)展AI推理系統(tǒng)的新藍(lán)圖。
雖然 GPU 和其他 AI 加速器在 AI 熱潮的第一階段占據(jù)主導(dǎo)地位,使得 GPU 巨頭英偉達(dá)成為世界上最有價(jià)值的公司,但當(dāng)前階段的 AI 需要大量的 CPU 來(lái)處理大規(guī)模運(yùn)行 AI 推理所帶來(lái)的各種計(jì)算任務(wù)。
KeyBanc 分析師 John Vinh 和 Ryan Rosumny 在 1 月份的一份報(bào)告中寫道,英特爾和AMD 的服務(wù)器 CPU 幾乎已經(jīng)售罄,并且正在考慮將價(jià)格提高 10% 到 15%。
過(guò)去12個(gè)月,英特爾的股價(jià)上漲了211%,而AMD的股價(jià)上漲了169%。雖然英特爾的至強(qiáng)CPU仍然占據(jù)服務(wù)器市場(chǎng)的大部分份額,但AMD的Eyep CPU取得了長(zhǎng)足的進(jìn)步,目前已占服務(wù)器市場(chǎng)41%的份額。
服務(wù)器CPU的需求正蔓延至其他領(lǐng)域。據(jù)報(bào)道,戴爾和惠普等PC制造商正面臨家用和辦公電腦CPU供應(yīng)短缺的問(wèn)題,因?yàn)镃PU的交貨周期已從兩周延長(zhǎng)至六個(gè)月。
在某些情況下,CPU 根本就買不到。“如果錢能解決這個(gè)問(wèn)題,那當(dāng)然最好,”一家游戲電腦品牌的負(fù)責(zé)人告訴《日經(jīng)亞洲》,“我們擔(dān)心的是,即使我們多花錢,也買不到更多。CPU 短缺的情況日益嚴(yán)重,其嚴(yán)重程度不亞于內(nèi)存芯片短缺。”
(來(lái)源:編譯自hpcwired)
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4377內(nèi)容,歡迎關(guān)注。
加星標(biāo)??第一時(shí)間看推送
![]()
![]()
求推薦
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.