![]()
作者 | 孫芮
郵箱 | sunrui@pingwest.com
隨著大模型進入工程化與規(guī)模化階段,越來越多資本開始關(guān)注底層基礎設施能力。
硅星人獲悉,5月7日,人工智能基礎設施企業(yè)無問芯穹宣布此前已再獲超7億元融資。本輪融資中,聯(lián)合領(lǐng)投方為杭州高新金投集團和惠遠資本,跟投方包括國興資本、秦淮數(shù)據(jù)、廣發(fā)乾和、力合清瞳、中保投資、AEF NextGen、騰瑞資本、卡萊特、中信建投資本和寬德智能學習實驗室 (Will),老股東君聯(lián)資本、上海國投孚騰和元智未來追加投資。
無問芯穹于2023年5月由清華大學電子工程系推動成立,創(chuàng)始成員來自清華大學、上海交通大學、阿里云與曠視科技等頂尖高校與AI企業(yè)。
在無問芯穹成立的三年中,全球 AI 行業(yè)經(jīng)歷了“百模大戰(zhàn)”、推理模型爆發(fā)、智能體興起等多個階段,而隨著模型快速迭代,如何更高效地生產(chǎn)和利用token,逐漸成為行業(yè)關(guān)注的核心問題之一。
1
01模型運行效率與系統(tǒng)能力成為新焦點
當外界討論“中國大模型性能”時,注意力往往集中在模型本身,比如Kimi K2.6 的 Agent Swarm 智能體集群協(xié)作與超長程工程能力,智譜 GLM-5.1 在 AutoGLM 端到端自主操作以及 8 小時長程任務執(zhí)行上的突破。
但在這些頭部模型背后,支撐其高效運轉(zhuǎn)的基礎設施層,其實都有無問芯穹的身影。
2026年3月,在中關(guān)村論壇上,無問芯穹聯(lián)合創(chuàng)始人兼 CEO 夏立雪與月之暗面創(chuàng)始人楊植麟、智譜 CEO 張鵬同臺對話時,首次公開提到:無問芯穹已經(jīng)成為 Kimi、智譜等眾多頭部大模型企業(yè)的核心基礎設施與 Token 服務商。
大模型競爭演進至今,已不再局限于模型能力強弱的比拼,模型運行效率與系統(tǒng)承載能力的較量同樣重要。
對于 Kimi、智譜這類頭部模型公司來說,真正昂貴的并不只是訓練,而是持續(xù)不斷的推理成本。用戶每一次提問、生成回答或調(diào)用 Agent,本質(zhì)上都在消耗 GPU 算力和 Token 資源。隨著調(diào)用量暴漲,推理系統(tǒng)會迅速變成一個極其復雜的工程問題。
理論上,這些公司當然可以全部自建。但現(xiàn)實是,自建意味著巨額 GPU 投入、數(shù)據(jù)中心建設、算力調(diào)度、系統(tǒng)優(yōu)化,以及長期運維成本。相比之下,如果有一家能夠提供更低成本、更高效率的基礎設施平臺,很多模型公司更愿意把這部分能力外包。
這也是無問芯穹切入的位置。它并不直接參與最強模型的競爭,而是成為這些模型背后的基礎設施支撐者。
1
02 大模型時代的“Token 工廠”
在某種程度上,AI Infra像大模型時代的“Token工廠”。用戶在使用AI產(chǎn)品寫代碼、做分析、調(diào)用 Agent 完成任務時,背后會涉及到大量 Token 的生產(chǎn)、推理資源的調(diào)度,以及不同芯片之間的適配,這些都是無問芯穹在做的工作。
而這類基礎設施的價值,會隨著 AI 使用量增長被不斷放大。
夏立雪曾提到,當 Kimi、智譜等頭部模型調(diào)用量出現(xiàn)幾十倍增長時,無問芯穹作為其 Token 服務商,也同步實現(xiàn)了幾十倍增長。在當下這個階段,AI Infra企業(yè)已經(jīng)深度嵌入中國頭部 AI 公司的生產(chǎn)鏈路之中。
在中國 AI 行業(yè)中,算力環(huán)境本身就極其復雜。不同公司使用不同 GPU,不同芯片之間的軟件棧、編譯框架、通信協(xié)議并不統(tǒng)一。很多模型雖然訓練出來了,卻未必能在不同硬件環(huán)境中高效穩(wěn)定運行。
比如在英偉達 GPU 上完成訓練與優(yōu)化的大模型,在遷移到國產(chǎn)推理芯片時,常常會遇到算子不兼容、顯存調(diào)度方式不同等問題,需要重新做算子適配與推理圖優(yōu)化,否則在實際部署中可能出現(xiàn)吞吐下降、延遲上升,甚至無法穩(wěn)定服務請求的情況。
無問芯穹的核心價值之一,就是在不同芯片與算力環(huán)境之間建立統(tǒng)一的“運行層”,通過底層調(diào)度與優(yōu)化能力,讓大模型能夠在異構(gòu)算力上以接近一致的方式穩(wěn)定運行與高效推理。
目前,無問芯穹的 Agentic MaaS 大模型服務平臺已經(jīng)對GLM、Kimi、DeepSeek、通義千問、MiniMax 等國產(chǎn)主流模型進行了高性能服務優(yōu)化,精度對齊率超過99.9%,吞吐量提升2-3倍,時延縮減50%,首字延遲低于500ms,企業(yè)級高可用性達到99.95%。
這些技術(shù)層面的參數(shù),會體現(xiàn)在非常具體的系統(tǒng)體驗與業(yè)務能力上——響應速度是否足夠及時,系統(tǒng)在高并發(fā)情況下是否穩(wěn)定,峰值流量下是否仍可持續(xù)服務,以及企業(yè)級場景中能否可靠完成模型的規(guī)模化部署與落地應用。
1
03 AI 基礎設施進入“跨圈層共識”階段
本輪融資中,無問芯穹再獲超 7 億元融資,累計融資規(guī)模超過 22 億元,持續(xù)位居中國 AI 原生基礎設施賽道前列。但相比數(shù)字本身,更具信號意義的是本輪投資方結(jié)構(gòu)的顯著外擴。
從資方構(gòu)成來看,對 AGI 基礎設施核心價值的認同,正在從科技投資圈,擴展至更廣泛的產(chǎn)業(yè)與戰(zhàn)略資本體系之中。
![]()
從資方構(gòu)成來看,這一輪融資呈現(xiàn)出三個層面的結(jié)構(gòu)性變化。
第一類是政策與產(chǎn)業(yè)導向資本的進入。以杭州高新金投集團、惠遠資本為代表的政府產(chǎn)業(yè)資本參與,使這一輪融資帶有明顯的區(qū)域產(chǎn)業(yè)戰(zhàn)略屬性。其關(guān)注重點不只是企業(yè)成長性,而是將 AGI 基礎設施視為數(shù)字經(jīng)濟底座能力的一部分,從“支持科技企業(yè)”轉(zhuǎn)向“配置基礎設施能力”。
第二類是國家級資本的參與。中保投資等國家隊資金的進入,讓這一輪融資具備更強的長期屬性,其核心邏輯更接近基礎設施級別的配置判斷,即圍繞技術(shù)自主可控與長期系統(tǒng)能力進行布局,而非短期商業(yè)回報。
第三類是產(chǎn)業(yè)側(cè)與應用側(cè)資本的跨界進入。秦淮數(shù)據(jù)等數(shù)據(jù)中心運營商的參與,反映出上游算力基礎設施正在從“資源供給方”向“AI系統(tǒng)協(xié)同方”演進,其投資邏輯不再只是機柜、電力與帶寬,而是希望通過與 AI Infra 層協(xié)同提升整體算力利用效率。
與此同時,卡萊特、量化基金等制造業(yè)與金融資本的進入,則意味著實體產(chǎn)業(yè)與金融體系開始以更直接方式參與 Token 經(jīng)濟,一方面作為投資者,另一方面也可能成為實際使用者。
1
04 Token經(jīng)濟時代,無問芯穹想做什么
截至 2026 年 4 月底,無問芯穹 Agentic MaaS 平臺的日均 Token 調(diào)用量,相較 2025 年底增長超過 20 倍。這一增長并不是線性擴張,而是一種基礎設施級應用的指數(shù)級放大。
![]()
夏立雪在中關(guān)村論壇上提到,“上一次看到這樣的增速,還是 3G 時代移動互聯(lián)網(wǎng)流量爆發(fā)的時候。”Token 正在成為類似“流量”的基礎資源單位,其增長曲線本身就代表著 AI 使用方式的結(jié)構(gòu)性變化。
從行業(yè)整體來看,這一趨勢并非孤立現(xiàn)象。根據(jù)國家統(tǒng)計局相關(guān)數(shù)據(jù),截至 2026 年 3 月,全國日均 Token 調(diào)用量已突破 140 萬億,較上年末增長超過 40%。在這一背景下,無問芯穹平臺 20 倍的增長幅度,意味著其并非簡單跟隨行業(yè)擴張,而是在頭部模型調(diào)用與企業(yè)級場景中形成了更高密度的承載與聚集效應。
而支撐這一增長的,并不只是流量本身的擴張,也是底層技術(shù)體系的同步演進。本輪融資所指向的三大技術(shù)方向,實際上構(gòu)成了其增長背后的基礎支撐結(jié)構(gòu)。
首先,是多元異構(gòu)算力體系的持續(xù)強化,通過技術(shù)極致優(yōu)化的可用算力規(guī)模,在 Token 經(jīng)濟時代實現(xiàn)更高利用率的資源供給;
其次,是軟硬件協(xié)同能力的進一步深化,通過優(yōu)化推理鏈路與系統(tǒng)調(diào)度機制,加快從“電能到 Token”的轉(zhuǎn)化效率,即在相同物理資源下生成更多有效 Token 輸出;
再次,是面向應用層的基礎設施升級,通過企業(yè)級智能體服務平臺,將模型能力嵌入不同行業(yè)場景,使 Token 不再只是計算結(jié)果,而是進入業(yè)務流程本身,完成從“Token 到生產(chǎn)力”的轉(zhuǎn)化。
這三條路徑分別對應算力供給、運行效率與應用轉(zhuǎn)化三個層面,共同指向同一個目標:在更大規(guī)模 Token 調(diào)用增長的背景下,持續(xù)提升 AI 基礎設施的整體運行效率。
可以看到,Token 正在從“模型輸出單位”逐步演化為支撐產(chǎn)業(yè)系統(tǒng)運行的基礎資源,而基礎設施能力則成為影響其規(guī)模化效率的關(guān)鍵變量。
當 Token 進一步成為基礎資源單元,資源調(diào)配與系統(tǒng)運行效率開始直接決定 AI 能力的實際邊界。融資、增長與技術(shù)路線在此交匯,所指向的并不是單一公司的階段性擴張,而是一個更清晰的行業(yè)趨勢——AI 基礎設施正從支撐性角色,轉(zhuǎn)向決定 AI 規(guī)模化能力的核心底座。
在這一意義上,無問芯穹的角色也不再僅是基礎設施公司,而是在持續(xù)擴張的 Token 經(jīng)濟體系中,成為一個被不斷放大的運行樞紐。
![]()
點個“愛心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.