![]()
![]()
![]()
來源:獵云網(wǎng)
國內(nèi)全自研GPGPU創(chuàng)新企業(yè)「北京行云集成電路有限公司」(以下簡稱"行云")宣布連續(xù)完成Pre-A及Pre-A+多輪融資,融資金額超4億元。本輪由五源資本、賽富投資基金、春華資本聯(lián)合領(lǐng)投,北京、江蘇等地方國資、佰維存儲、金沙江聯(lián)合帶動全球知名GPU企業(yè)創(chuàng)始人家辦、創(chuàng)維資本等產(chǎn)業(yè)資本跟投。云岫資本連續(xù)多輪服務(wù)并擔(dān)任下一輪獨(dú)家融資財務(wù)顧問。
行云成立于2024年,專注面向大模型推理的新一代GPGPU芯片。技術(shù)上打造超大顯存規(guī)格、極致CUDA兼容的全自研產(chǎn)品,公司目標(biāo)直指AI大模型推理的普惠化。
創(chuàng)始人季宇博士,清華大學(xué)計算機(jī)系博士,"華為天才少年"計劃成員,曾在華為海思深度參與昇騰AI芯片的編譯器與架構(gòu)研發(fā)。CTO余洪敏博士,中科院半導(dǎo)體所博士,曾深度參與包括兩款國產(chǎn)AI芯片在內(nèi)的多款芯片的研發(fā)與量產(chǎn),擁有十余款芯片成功流片經(jīng)驗。一位是站在算法×編譯器交界處的架構(gòu)師,一位是十余次走完"實(shí)驗室到量產(chǎn)"全流程的芯片老兵——這恰好對應(yīng)了行云技術(shù)路線的兩個重點(diǎn):架構(gòu)判斷要不要賭錯、工程交付能不能扛住。
要理解行云芯片的邏輯,必須先承認(rèn)一個正在被業(yè)內(nèi)默認(rèn)、但還未被公眾充分定價的事實(shí):2026年的大模型,已經(jīng)不再是"應(yīng)用",而是"生產(chǎn)資料"。
從Chatbot到Agent,從一次性問答到長鏈路、多輪自主執(zhí)行的任務(wù)交付,模型正在變成知識工作的底層引擎。一旦角色從"產(chǎn)品"轉(zhuǎn)換為"生產(chǎn)資料",關(guān)于"誰擁有它、誰定價它、誰被它替代"的討論就避無可避。而當(dāng)這個問題向下追問到基礎(chǔ)設(shè)施層,三個結(jié)構(gòu)性矛盾立刻浮現(xiàn)。
矛盾一:從玩具到工具的鴻溝,門檻是千億參數(shù)
Chatbot時代,7B、13B的小模型勉強(qiáng)夠用。但真正能被Agent場景委以重任的模型,幾乎全部集中在200B–700B的千億參數(shù)區(qū)間——只有這個量級,才能撐得住超長上下文、穩(wěn)定的工具調(diào)用鏈和可接受的幻覺率。
用戶用錢投票已經(jīng)把這一點(diǎn)說得很清楚:2026年初,Anthropic以行業(yè)最高的API定價把營收推到300億美元ARR,其中Claude Code單產(chǎn)品ARR即達(dá)25億美元。"最貴的模型反而最賺錢",恰恰說明在"真正能干活"的場景里,模型質(zhì)量是一道硬門檻,而這道門檻,今天的消費(fèi)級硬件夠不著。
矛盾二:成本結(jié)構(gòu)性失衡,大廠和用戶被同時擠壓
為了把千億模型留在云端,OpenAI、Anthropic、Google 等頭部廠商過去兩年的資本開支呈指數(shù)級增長——更大的集群、更貴的HBM、更密的液冷機(jī)房。這些成本最終必然向用戶端傳導(dǎo):訂閱制的代價是限流、降智、高峰排隊,海外API計費(fèi)的代價是Agent長鏈任務(wù)下指數(shù)級增長的Token賬單,月支出動輒數(shù)千美元。
這是一場不對稱的雙向擠壓:大廠在賭自己能撐到回本那一天,用戶在賭自己付得起下一張賬單。任何能在這局之外另開一條算力供給路徑的玩家,都會給目前的產(chǎn)業(yè)界帶來新的思考。
矛盾三:數(shù)據(jù)主權(quán)與崗位反噬的不對稱交換
云端API在數(shù)據(jù)流向上是單向透明的。用戶每一次與Agent的深度協(xié)作,都在把職業(yè)Know-how免費(fèi)轉(zhuǎn)交給模型公司。海外大廠一邊組建"反蒸餾聯(lián)盟"嚴(yán)防所謂競爭對手,一邊肆無忌憚地從所有用戶身上蒸餾經(jīng)驗。"個人經(jīng)驗→模型能力→崗位替代"的閉環(huán)就此閉合。
對一名知識工作者來說,這已經(jīng)不只是隱私問題,而是生存問題。只要推理還完全構(gòu)筑于云端,數(shù)據(jù)和生產(chǎn)關(guān)系的主權(quán)就總有歸零的一天。
上述矛盾,過去并非沒人看到,但在稠密Transformer時代,"把千億模型搬回本地"在物理上就不成立——稠密模型每次前向都要全量激活,對帶寬的需求讓HBM成為不可繞開的剛需,消費(fèi)級的LPDDR/DDR根本進(jìn)不了場。
而MoE稀疏架構(gòu)的普及,把這套法則改寫了。MoE用更大的總?cè)萘垦b下更多"專家",但每次推理只激活一小部分。結(jié)果是瓶頸從"極致帶寬"遷移到"超大容量",單次激活的算力和帶寬需求驟降。帶寬需求第一次回落到LPDDR/DDR的"甜點(diǎn)區(qū)間"。再配合Attention的稀疏性和超長上下文的需求,算力,容量,顯存帶寬,互聯(lián)的關(guān)系在不斷發(fā)生改變。
換句話說,是算法演進(jìn)給硬件留出了一個歷史性的窗口期。能不能踩準(zhǔn)這個窗口,決定了一家芯片公司是順著潮水走還是逆著潮水走。
行云的技術(shù)路徑,可以拆成"介質(zhì)替換"和"系統(tǒng)級工程"兩層。
介質(zhì)層面,行云放棄成本高昂的HBM,轉(zhuǎn)而采用LPDDR乃至NAND(SSD顆粒)作為顯存介質(zhì),使顯存成本下降1到2個數(shù)量級。低成本介質(zhì)單顆粒帶寬較低,行云用多顆粒、多通道并行架構(gòu)把整體帶寬堆疊到TB級,匹配大模型推理的吞吐需求。
系統(tǒng)層面,公司通過Prefill / Decode分離(PD分離)、KV Cache稀疏化、分布式擴(kuò)展、極致CUDA兼容等手段,在系統(tǒng)級構(gòu)建軟硬件協(xié)同壁壘。CTO余洪敏強(qiáng)調(diào),行云的設(shè)計優(yōu)先級已經(jīng)從"追求單芯片極致性能"轉(zhuǎn)向"從板級系統(tǒng)角度追求可擴(kuò)展性與供應(yīng)鏈穩(wěn)定性"——通過分布式設(shè)計與成熟工藝、低成本存儲的組合,在系統(tǒng)層面實(shí)現(xiàn)成本最優(yōu)與體驗一致。
物化到產(chǎn)品,就是行云即將推出的首款消費(fèi)級桌面計算產(chǎn)品,CUDA極致兼容,面向消費(fèi)級價位點(diǎn)設(shè)計。它不是一張被裁剪過的計算卡,而是從底層就為"在端側(cè)跑千億模型"重新設(shè)計的芯片,讓用戶可以在萬元價位高吞吐運(yùn)行萬億級別參數(shù)的大模型。
行云援引一個產(chǎn)業(yè)類比:當(dāng)19世紀(jì)的交通革命中鐵路剛出現(xiàn)的時候,英國產(chǎn)生了巨大的鐵路泡沫,認(rèn)為所有的道路將通過鐵路流通,并最終留下了商業(yè)模型的崩潰出清。但最后并不是只靠貫穿大洲的鐵路干線完成所有的交通需求,更依賴于深入毛細(xì)血管的汽車與公路。今天的AI算力網(wǎng)絡(luò)也站在同樣的分岔口——是走向超算壟斷的"中心化鐵軌",還是走向端側(cè)普惠的"分布式公路"?
行云給出的答案是后者。在公司的產(chǎn)品路線里,首顆芯片只是第一個錨點(diǎn)。當(dāng)技術(shù)路徑進(jìn)一步推向NAND介質(zhì),端側(cè)算力設(shè)備的價位有望下探到千元級,覆蓋主流千億乃至萬億參數(shù)模型,并在單用戶場景下反超云端體驗,最終讓AI算力設(shè)備的普及率接近今天的智能手機(jī)。
與此對應(yīng),季宇明確表示,公司今年的核心目標(biāo)是完成芯片量產(chǎn)并盡快推向市場,以芯片產(chǎn)品作為商業(yè)化的主要抓手。OpenClaw 和Hermers這類Agent平臺的現(xiàn)象級傳播也已經(jīng)印證了下游需求——市場對"消費(fèi)級硬件承載高質(zhì)量AI"的渴望,已經(jīng)具備實(shí)際購買力。
—— 芯榜 ——
芯榜成立于 2015 年,是半導(dǎo)體垂直領(lǐng)域的產(chǎn)業(yè)媒體與數(shù)字化服務(wù)平臺。全網(wǎng)覆蓋超 100 萬垂直行業(yè)用戶,核心提供專業(yè)榜單發(fā)布、原創(chuàng)訪談、產(chǎn)業(yè)報告、峰會活動及研究咨詢等服務(wù)。已合作近千家半導(dǎo)體生態(tài)企業(yè),聯(lián)動多家基金公司與產(chǎn)業(yè)媒體,助力硬科技產(chǎn)業(yè)發(fā)展。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.