引言:當下AI行業(yè)的競爭,早已從模型算法比拼,下沉到底層算力的角力。近期全球科技大廠動作不斷,新技術(shù)、新芯片密集亮相,推動行業(yè)分工持續(xù)細化。專用TPU憑借高算力、低成本、高能效的優(yōu)勢快速崛起,一躍成為行業(yè)焦點。而在全球產(chǎn)業(yè)格局重構(gòu)之際,國產(chǎn)TPU也迎來關(guān)鍵破局機遇,以中昊芯英等為代表的本土企業(yè)加速實現(xiàn)技術(shù)突圍與商業(yè)化落地。
近日,在COMPUTEX展會上,英偉達正式發(fā)布RTX Spark PC超級芯片,標志著其算力布局從云端服務器全面下沉至終端PC場景。此前,英偉達宣布計劃率先在其下一代Vera Rubin AI平臺上導入“GPU發(fā)起直接存儲訪問”(GIDS)技術(shù)、谷歌在2026 Google Cloud Next推出訓推分離的第八代TPU,全球AI算力產(chǎn)業(yè)迎來密集技術(shù)迭代窗口。行業(yè)逐步形成新的分工:通用GPU承接全場景與端側(cè)算力需求,專用TPU聚焦云端大模型訓推核心任務,兩者協(xié)同的產(chǎn)業(yè)架構(gòu)加速落地,TPU賽道迎來規(guī)模化產(chǎn)業(yè)化窗口期。
巨頭雙線縱深布局:英偉達打通端云算力,谷歌TPU憑專用性形成技術(shù)互補
英偉達持續(xù)完善全棧算力版圖,在服務器端依托GIDS技術(shù)讓GPU直連SSD,大幅降低數(shù)據(jù)搬運延遲與功耗損耗;在終端依靠全新RTX Spark PC芯片,實現(xiàn)本地端側(cè)AI推理落地,強化了通用算力從云到端的場景覆蓋能力。
與之形成差異化互補的是,谷歌持續(xù)深耕專用算力賽道,推出TPU 8t訓練芯片與TPU 8i推理芯片。其中TPU 8t綜合性能較上代提升2倍、算力提升3倍,適配超大規(guī)模千億、萬億級大模型訓練;TPU 8i實現(xiàn)每美元性能提升80%,有效降低云端規(guī)模化推理成本,精準解決大模型商業(yè)化落地的高能耗、高成本痛點。
![]()
(Google TPU 8t,圖源:Google)
商業(yè)化層面,谷歌TPU生態(tài)已對外開放。Anthropic承諾未來五年投入約2000億美元采購TPU算力,黑石集團聯(lián)合谷歌成立AI云公司、將TPU作為核心算力底座。頭部客戶落地采購,證明TPU已擺脫內(nèi)部自用屬性,與英偉達GPU形成通用兜底、專用提效的互補格局。在Token經(jīng)濟加速普及的背景下,能效比、單位算力成本成為行業(yè)選型核心標準,也讓TPU的專用技術(shù)優(yōu)勢進一步凸顯。
市場重構(gòu),算力時代催生GPU、TPU雙主流格局
過去,英偉達GPU長期壟斷AI算力市場,市占率一度超90%,谷歌TPU以谷歌內(nèi)部自用為主,市場規(guī)模有限。如今,市場將迎來重構(gòu)。市場預測,2026年谷歌TPU出貨量將達600萬片,與英偉達同期700萬至750萬片的出貨量合計占據(jù)全球約80%的市場份額。
在性能方面,GPU勝在通用性、靈活性、終端適配性,覆蓋圖形渲染、通用計算、端側(cè)輕量化AI任務;TPU依托脈動陣列架構(gòu),在超大規(guī)模集群訓練、高密度云端推理場景具備壓倒性能效優(yōu)勢。以谷歌TPU v7為例,公開信息顯示,其峰值算力與英偉達B200相當,能效比達后者2至4倍,每美元性能高出1.4倍,搜索類負載速度可達5倍,大規(guī)模集群算力還能線性擴展,適配AI大模型長期穩(wěn)定訓推需求。
當前,Meta、蘋果、亞馬遜等全球頭部科技企業(yè),紛紛入局專用TPU芯片自研與規(guī)模化采購,進一步印證GPU與TPU深度協(xié)同已成為全球AI算力布局的主流標準與產(chǎn)業(yè)共識。
國產(chǎn)破局,中昊芯英填補自主算力版圖空白
放眼國內(nèi)算力市場,當前AI芯片領(lǐng)域呈現(xiàn)通用GPU與TPU專用算力協(xié)同發(fā)展的格局,而TPU賽道尚處在規(guī)模化落地的成長階段,仍有廣闊提升與發(fā)展空間。“如果中國在TPU路線上長期缺失,不僅會錯失全球AI算力結(jié)構(gòu)轉(zhuǎn)型的窗口期,更可能在未來形成新的‘卡脖子’節(jié)點。”業(yè)內(nèi)人士指出。
在此背景下,中昊芯英作為國內(nèi)唯一掌握高性能TPU架構(gòu)AI專用算力芯片核心技術(shù)并實現(xiàn)芯片量產(chǎn)落地的本土企業(yè),率先填補國內(nèi)賽道空白。
據(jù)了解,中昊芯英自研的剎那TPU芯片已于2023年實現(xiàn)規(guī)模化量產(chǎn),目前企業(yè)已搭建完善軟件適配與行業(yè)生態(tài),全面兼容DeepSeek、Qwen、GLM等國內(nèi)主流大模型,在多個千卡級算力集群先后落地,賦能金融、傳媒、教育、醫(yī)療等行業(yè),為國產(chǎn)TPU商業(yè)化應用蹚出可行路徑。
![]()
(中國首枚高性能TPU架構(gòu)AI專用算力芯片剎那?)
補齊TPU專用算力短板,是完善國內(nèi)AI算力產(chǎn)業(yè)體系、實現(xiàn)GPU與TPU雙核并行的關(guān)鍵一步。以中昊芯英為代表的本土企業(yè)率先實現(xiàn)技術(shù)落地與規(guī)模化商用,正在穩(wěn)步填補國內(nèi)產(chǎn)業(yè)鏈短板。未來,國產(chǎn)TPU如若依托產(chǎn)業(yè)政策引導、市場化資本賦能持續(xù)完善軟硬件生態(tài),完成全產(chǎn)業(yè)鏈突圍,國內(nèi)算力產(chǎn)業(yè)將形成GPU、TPU雙線并行、協(xié)同互補的完整布局,進一步夯實我國AI產(chǎn)業(yè)自主根基,在全球AI主權(quán)競爭中掌握更多發(fā)展主動權(quán)。
如今,GPU一家獨大的時代已然落幕,GPU+TPU的雙線并行成為全球算力行業(yè)的新趨勢。海外玩家早早完成布局并建立優(yōu)勢,國內(nèi)TPU產(chǎn)業(yè)如今也迎來規(guī)模化落地的新階段。在新一輪全球算力競賽中,持續(xù)攻堅核心技術(shù)、補齊生態(tài)短板,將決定國產(chǎn)算力產(chǎn)業(yè)未來的發(fā)展高度。在這一進程中,中昊芯英等本土TPU企業(yè)正以技術(shù)自研與生態(tài)建設(shè),成為推動技術(shù)自主與規(guī)模化落地的重要力量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.