網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請入駐

太初元碁洪源：異構(gòu)計(jì)算能力將成為未來AI算力基礎(chǔ)設(shè)施的重要方向

2026-05-20 21:09:09　來源: 量子位

北京舉報(bào)

分享至

編輯部整理自 AIGC2026
量子位 | 公眾號(hào) QbitAI

2026年，AI產(chǎn)業(yè)正在進(jìn)入新一輪高強(qiáng)度算力周期。

隨著Agentic AI、代碼助手、智能辦公等應(yīng)用加速落地，AI正在從Demo走向真實(shí)任務(wù)，Token也隨之成為AI時(shí)代最核心的資源消耗單位。

因此，算力能否支撐更高頻、更復(fù)雜的AI應(yīng)用，正在成為產(chǎn)業(yè)下一階段能否繼續(xù)向前的關(guān)鍵問題。在太初元碁首席產(chǎn)品官、高級(jí)副總裁洪源看來：

在Token經(jīng)濟(jì)加速到來的背景下，AI算力需要更好地向上兼容框架、模型與應(yīng)用，為大模型訓(xùn)練、推理和行業(yè)落地提供更穩(wěn)定、高效、易用的基礎(chǔ)支撐。
伴隨大模型能力躍遷和AI應(yīng)用快速增加，Token調(diào)用需求正在持續(xù)釋放，國產(chǎn)算力也迎來了新的發(fā)展機(jī)遇。

這意味著，未來算力將不再只是模型訓(xùn)練背后的基礎(chǔ)資源，而會(huì)貫穿從模型研發(fā)、應(yīng)用部署到行業(yè)場景落地的全鏈路，成為Token智能時(shí)代最關(guān)鍵的新型基礎(chǔ)設(shè)施。

在本次量子位AIGC2026上，洪源圍繞國產(chǎn)算力、Token應(yīng)用、Agentic AI計(jì)算效率等關(guān)鍵詞，分享了自己對國產(chǎn)AI算力建設(shè)的看法。

為了完整體現(xiàn)洪源的思考，在不改變原意的基礎(chǔ)上，量子位對演講內(nèi)容進(jìn)行了編輯整理，希望能給你帶來更多啟發(fā)。

AIGC2026是由量子位主辦的行業(yè)峰會(huì)，近20位產(chǎn)業(yè)代表與會(huì)討論。線下參會(huì)觀眾超千人，線上直播觀眾近400萬，獲得了主流媒體的廣泛關(guān)注與報(bào)道。

核心觀點(diǎn)梳理

隨著Agentic AI、行業(yè)大模型和智能應(yīng)用進(jìn)入真實(shí)業(yè)務(wù)場景，AI計(jì)算正在從「生成內(nèi)容」走向「生成任務(wù)」，對算力系統(tǒng)的穩(wěn)定性、效率和協(xié)同能力提出更高要求，未來需要解決的是多種計(jì)算單元之間相互配合、協(xié)同調(diào)度，以及降低等待和通信成本的問題。
國產(chǎn)AI算力迎來新的發(fā)展機(jī)會(huì)，但真正的突破點(diǎn)不只在單點(diǎn)性能，更在大規(guī)模集群服務(wù)能力、計(jì)算效率和生態(tài)易用性。
大模型訓(xùn)練與推理正在走向萬卡乃至更大規(guī)模集群，算力廠商需要從硬件、互聯(lián)、軟件、調(diào)度、運(yùn)維等全鏈條提升系統(tǒng)能力。
Agent任務(wù)執(zhí)行過程中，CPU調(diào)度、GPU計(jì)算、通信和數(shù)據(jù)處理等環(huán)節(jié)需要高效協(xié)同，異構(gòu)計(jì)算能力將成為未來AI算力基礎(chǔ)設(shè)施的重要方向。
未來AI算力將像Token經(jīng)濟(jì)中的「制氧機(jī)」，持續(xù)支撐模型、應(yīng)用和行業(yè)場景運(yùn)行。

以下為洪源演講全文：

Token經(jīng)濟(jì)加速到來，國產(chǎn)AI算力迎來新機(jī)遇

從2022年底ChatGPT發(fā)布以來，整個(gè)大模型行業(yè)的迭代速度明顯加快，尤其今年以來，主流大模型的更新頻次進(jìn)一步提升。

對于算力廠商來說，這意味著我們需要持續(xù)圍繞主流大模型做適配和優(yōu)化。

從模型數(shù)量、訓(xùn)練數(shù)據(jù)規(guī)模、所需算力規(guī)模，到模型本身的參數(shù)規(guī)模，都可以看到非常明顯的增長趨勢。

在這一背景下，今年行業(yè)也越來越頻繁地談到Token經(jīng)濟(jì)，隨著大語言模型調(diào)用量快速增長，Token正在成為AI時(shí)代非常核心的消耗單位，尤其是國產(chǎn)模型相關(guān)調(diào)用量，也在持續(xù)提升。

從OpenRouter相關(guān)數(shù)據(jù)預(yù)測來看，從2025年到2026年，再到2030年，整體Token調(diào)用量預(yù)測會(huì)出現(xiàn)大幅增長。

增幅將達(dá)到212倍，可以預(yù)見，未來無論是C端應(yīng)用，還是B端行業(yè)應(yīng)用，都會(huì)帶來更大規(guī)模的Token消耗。

伴隨Token調(diào)用快速增加，AI應(yīng)用市場也在快速增長，越來越多應(yīng)用正在走向真實(shí)場景，辦公、代碼、醫(yī)療、教育、能源、電力等行業(yè)都在加速引入AI能力。

這也意味著，底層算力基礎(chǔ)設(shè)施必須支撐更高頻、更復(fù)雜、更大規(guī)模的AI調(diào)用需求。

在這個(gè)過程中，算力效率提升會(huì)進(jìn)一步釋放需求，生產(chǎn)效率提高之后，應(yīng)用場景會(huì)變多，調(diào)用頻次會(huì)變高，最終帶來的反而是算力需求的持續(xù)增加。

從IDC以及國內(nèi)一些調(diào)研機(jī)構(gòu)的數(shù)據(jù)來看，到2030年，全球算力規(guī)模預(yù)計(jì)會(huì)以每年60%的速度增長，其中90%以上將是智能算力。

對于國產(chǎn)AI算力而言，這是一輪非常重要的發(fā)展機(jī)會(huì)，大模型能力不斷增強(qiáng)，Token需求快速釋放，行業(yè)應(yīng)用加速落地，都在推動(dòng)國產(chǎn)算力走向更廣闊的產(chǎn)業(yè)場景。

大模型進(jìn)入任務(wù)時(shí)代，AI算力需要解決三大關(guān)鍵問題

當(dāng)然，在新的機(jī)會(huì)面前，國產(chǎn)AI算力也需要解決一些關(guān)鍵問題，整體來看，我認(rèn)為主要有三個(gè)方面。

第一個(gè)問題，是大規(guī)模集群的服務(wù)能力。

現(xiàn)在大模型訓(xùn)練和推理對集群規(guī)模的要求越來越高，動(dòng)輒就是萬卡，甚至更大規(guī)模的集群，在這樣的大規(guī)模系統(tǒng)中，如何保證訓(xùn)練效率、系統(tǒng)穩(wěn)定性、成本控制和可靠性，是算力企業(yè)必須解決的問題。

第二個(gè)問題，是計(jì)算效率。

在Agent任務(wù)執(zhí)行過程中，用戶輸入一個(gè)任務(wù)后，系統(tǒng)需要進(jìn)行任務(wù)規(guī)劃、工具調(diào)用、多輪執(zhí)行和結(jié)果反饋。在這個(gè)過程中，GPU真正用于計(jì)算的時(shí)間可能只占整體的10%左右，大量時(shí)間會(huì)消耗在CPU調(diào)度、通信、數(shù)據(jù)處理等環(huán)節(jié)。

CPU更多承擔(dān)串行計(jì)算和調(diào)度任務(wù)，GPU更擅長并行計(jì)算，未來AI算力系統(tǒng)需要更好地發(fā)揮CPU和GPU等不同計(jì)算單元的協(xié)同效率，讓整個(gè)任務(wù)執(zhí)行鏈路更加高效。

第三個(gè)問題，是生態(tài)問題。

對于國產(chǎn)算力企業(yè)來說，芯片設(shè)計(jì)本身只是第一步，真正決定用戶能不能用起來、開發(fā)者愿不愿意用、模型和應(yīng)用能不能快速遷移的，是背后的軟件生態(tài)。

國產(chǎn)算力要服務(wù)好Token經(jīng)濟(jì)，就必須為開發(fā)者和行業(yè)客戶提供更好用、更易用的生態(tài)能力，無論是底層開發(fā)者，還是上層模型廠商、應(yīng)用廠商，都需要更順暢地完成模型遷移、訓(xùn)練、微調(diào)和推理部署。

AI算力的發(fā)展已經(jīng)不能單一堆性能、堆算力。尤其在Agentic AI快速發(fā)展的背景下，AI計(jì)算正在從生成內(nèi)容走向生成任務(wù)，這對算力系統(tǒng)提出了新的要求，未來AI算力需要解決異構(gòu)協(xié)同、高效可用和生態(tài)適配等系統(tǒng)性問題。

當(dāng)AI計(jì)算從「生成內(nèi)容」走向「生成任務(wù)」，異構(gòu)協(xié)同會(huì)變得越來越重要，未來需要解決的是多種計(jì)算單元之間相互配合、協(xié)同調(diào)度，以及降低等待和通信成本的問題。

從超算積累到生態(tài)適配，打造AI產(chǎn)業(yè)「制氧機(jī)」

針對這些問題，太初元碁也在持續(xù)進(jìn)行探索和實(shí)踐。

首先，在大規(guī)模集群方面，我們有高性能計(jì)算領(lǐng)域長期的技術(shù)積累，特別是面對大規(guī)模并行計(jì)算任務(wù)，往往涉及10萬核甚至數(shù)十萬核級(jí)別的協(xié)同計(jì)算，這些經(jīng)驗(yàn)為我們今天做AI算力集群提供了重要基礎(chǔ)。

其次，在異構(gòu)計(jì)算方面，我們從芯片設(shè)計(jì)層面做了相關(guān)布局。

我們在核心芯片設(shè)計(jì)中包含不同計(jì)算模塊，比如面向通用計(jì)算的模塊、數(shù)據(jù)處理核心，以及面向并行計(jì)算的模塊。這些不同計(jì)算單元通過片上網(wǎng)絡(luò)進(jìn)行連接，從而提升CPU、GPU等不同計(jì)算單元之間的協(xié)同效率。

這類架構(gòu)設(shè)計(jì)，主要是為了適應(yīng)未來AI任務(wù)越來越復(fù)雜的趨勢，讓AI應(yīng)用不再只是單一模型推理，而會(huì)涉及任務(wù)拆解、工具調(diào)用、數(shù)據(jù)處理、多輪交互和結(jié)果反饋。面對這種任務(wù)鏈路，底層算力系統(tǒng)必須具備更強(qiáng)的協(xié)同能力。

此外，在生態(tài)方面，我們也認(rèn)為這是非常重要的一環(huán)。

從底層能力來看，我們提供了自研編程框架和編程語言支持，同時(shí)也參考成熟開發(fā)生態(tài)，為開發(fā)者提供更容易上手的開發(fā)方式。對于熟悉Python的開發(fā)者，也可以依托相關(guān)工具能力進(jìn)行開發(fā)。

再往上，我們也在探索基于自然語言交互的自動(dòng)生成算子能力，幫助用戶降低開發(fā)門檻，圍繞訓(xùn)練、微調(diào)和推理等不同環(huán)節(jié)，我們希望提供更完整的一體化方案。

同時(shí)，太初元碁還提供了一系列工具組件，幫助用戶在不同框架之間完成模型一鍵遷移。

從框架到模型，我們也適配了多種第三方框架庫和模型庫，幫助模型廠商、應(yīng)用廠商和行業(yè)客戶更順暢地使用國產(chǎn)算力。

Token經(jīng)濟(jì)到來之后，算力相對于整個(gè)AI產(chǎn)業(yè)，就像氧氣對于人類一樣重要，我們正在建設(shè)的新型基礎(chǔ)設(shè)施，就像持續(xù)供氧的系統(tǒng)。

太初元碁一直在做，也會(huì)持續(xù)做的一件事，就是希望和產(chǎn)業(yè)伙伴一起，發(fā)揮各自優(yōu)勢，協(xié)同上下游資源，為整個(gè)中國AI產(chǎn)業(yè)提供穩(wěn)定、高效、自主可控的新型算力基礎(chǔ)設(shè)施。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.