![]()
真正的智能化效能躍遷,是讓AI智能體接管優化全流程,將計算加速任務從“工程實驗”轉化為“可計算的優化問題”。
「甲子光年」獲悉,智子芯元(深圳)科技有限公司已完成數千萬元天使輪融資,本輪由同創偉業、鈞山資本領投,老股東英諾天使與松禾資本超額跟投。
成立僅半年,連續獲得知名投資機構青睞,這背后指向一個正在加速成型的產業判斷:
國產AI基礎設施正在經歷一場底層范式遷移——計算加速的實現路徑,正從“依賴稀缺專家手工調優”,轉向“由AI接管全流程開發的復雜度”。
這一轉變的意義不止于效率提升,更關乎國產算力能否真正從“紙面峰值”走向“業務可用”的結構性躍遷。嗅覺敏銳的資本,正在押注這一轉變的確定性。
1.國產算力進入深水區,智子芯元用“AI+運籌”解決AI計算生態難題
近兩年,國產AI芯片供給能力持續提升,規模化落地進程加速。但一個關鍵矛盾隨之浮現:算力的物理供給已具備規模,工程側的適配能力卻嚴重滯后。
模型在國產芯片上的遷移部署,通常需要跨越兩道工程門檻:
- 快速讓模型跑起來:兼容硬件環境、PyTorch模型、國產芯片已有算子庫;
- 讓模型運行速度更快:定位推理鏈路瓶頸,進行從應用場景、到框架、再到算子的系統性優化。
傳統流程往往依賴人工經驗與反復試錯,難以支撐多模型版本、持續迭代的交付節奏。導致國產芯片使用方時常陷于跨生態遷移、手工算子調優的工程泥沼,紙面上的算力峰值并未有效轉化為業務側可感知的效率提升。
這一困境的成因是結構性的:
- 全球主要AI資產原生于CUDA生態,遷移成本高;
- 國產芯片因制裁導致架構通用性不足,軟件生態建設起步晚;
- AI時代算子多樣性與復雜度急劇增加,而掌握底層計算開發能力的工程人才極度稀缺。
智子芯元認為,上述因素共同指向一個不可回避的結論:構建國產芯片“好用”的生態,不能再依賴人類專家手工堆砌,必須用AI全面接管底層計算加速的復雜度。
2.技術路徑:運籌學 x 大模型,把算子開發變成可求解的優化問題
智子芯元是國內最早系統性探索“AI for 計算加速”方向的創業公司,其核心技術路徑是:運籌學 x 大模型。
這一路徑的底層邏輯在于,將算子開發重新定義為一個約束尋優問題:大模型負責理解需求、劃定搜索空間或生成搜索算法模板;運籌學算法在硬件約束下尋找最優參數組合。兩者分工明確——運籌學提供數學嚴謹性與效率來源,大模型提供快速試驗執行能力與先驗知識。
與通用AI Coding項目不同,算子開發并非代碼補全,而是需要在真實硬件上反復編譯、運行、測試性能,通過實際報錯信息與性能數據持續迭代。智子芯元基于硬件特性的等效數學建模,將物理系統轉化為等效數學邊界,構建了“硬件在環”的閉環實驗機制,能有效遏制大模型的幻覺問題,保障輸出結果的工程可用性和性能穩定性。
據「甲子光年」了解,智子芯元從創立之初便堅持“Build for Agent”路線——不是將AI嵌入產品,而是賦予AI足夠原生的能力,將其打造為能夠真正掌控工作環境的智能體。用聯合創始人丁添的話說:“AI和人類的結合,10%是結合, 100%也是結合,而我們想走到90%以上。”
丁添曾任職于華為2012實驗室,從事復雜系統的“黑盒優化”研究,后進入深圳市大數據研究院工作。長期浸潤于底層系統優化領域,讓他敏銳捕捉到了國產芯片生態在工具鏈和適配效率上的斷層。智子芯元正是在這一背景下,從計算加速切入,試圖把優化能力從“靠人堆”轉向“靠系統做”。
3.將技術理念轉化為確定性的商業交付
承載這套方法論的,是智子芯元自研的智能引擎KernelCAT,它并非傳統編程工具,而是智子芯元各項產品能力背后的統一技術底座,包含著團隊自行構建的混合模型、運籌優化底座與計算加速智能體框架。
KernelCAT能實現從需求理解、代碼生成到編譯驗證的全流程自主執行,開發者只需通過自然語言描述需求,KernelCAT即可完成完整的工程交付,并具備連續運行數十小時、持續迭代直至達成目標的工程穩定性。
主流模型自動化遷移
在實際應用中,KernelCAT的交付能力令人驚嘆。據「甲子光年」了解,在DeepSeek-V4正式發布后,智子芯元的工程師讓KernelCAT自主設計模型遷移方案,當天快速完成了DeepSeek-V4-Flash在昇騰平臺上的部署和跑通。在傳統的“模型Day0適配”工作模式中,芯片廠商的技術團隊往往會在模型正式發布前的幾周,甚至數個月,開啟模型適配工作,以此保障能同步進行“Day0適配”宣發。而智子芯元對于“Day0適配”的追求是,在模型正式對外發布后再開啟適配工作,擊破芯片廠商的“時間焦慮”。
這樣顛覆性的效率并非偶然,在此之前,KernelCAT已實現幫助客戶在38分鐘內將多模態模型DeepSeek-OCR-2全自動遷移到華為昇騰平臺并完成推理驗證;僅用4小時完成深度架構適配優化,性能較基礎方案提升35倍;而同樣的工作量,傳統方式需要10~15人天才能完成。
對已遷移模型的深度性能調優
對于已遷移模型的深度性能調優,KernelCAT同樣表現出色。Qwen 3.5系列模型在社區Day 0適配版本中,單并發場景下僅有6-8tokens/s,KernelCAT僅用40分鐘便將其自動優化至40tokens/s,充分保障了商業場景下的可用性。通過“運籌優化”能力,對用戶問答、翻譯、編程、長文本等各類使用場景進行深度調優,對比社區發布的深度優化后的最佳實踐,KernelCAT優化后的Qwen在吞吐、首字延遲等關鍵指標上實現了40%~500%的性能提升。
模型批量遷移
在規模化落地層面,KernelCAT已批量完成超過15個主流SOTA開源模型在昇騰NPU上的全流程適配,覆蓋文本檢測、圖像分類、OCR、語音等多個技術方向。交付周期從“周”級壓縮至“小時”級,同時輸出包含精度驗證報告與性能基準測試的完整交付件。這一突破標志著智子芯元交付給客戶的不再是零散的“定制化服務”,而是可復制的“標準化效率產線”。
前沿模型適配攻關
在前沿模型攻關和AI for Science領域內,KernelCAT的表現同樣亮眼。在KernelCAT的介入下,僅用時數小時,便實現了JAX框架模型到昇騰框架的自動化適配,使能torchfold的長序列預測,這類模型通常對計算圖復雜度、資源調度和性能穩定性有著極高要求,被視為檢驗智能交付能力的關鍵樣本。據行業經驗,達成這樣的成果通常需要人類專家團隊投入數月時間。
更具商業想象空間的是,當AI native的研發理念真正落地于產品,KernelCAT展現出的不僅是系統性交付能力,更是適用各類硬件平臺的出色泛化性。
目前,智子芯元幾乎完成了在全部主流國產算力芯片上的計算加速任務的交付驗證,芯片類型覆蓋了數據中心場景的推訓芯片、端側高性能芯片,以及CPU超算芯片。
在軟硬件創新“百花齊放”卻“高度分散”的產業現狀下,這種通用性,正是KernelCAT成為計算加速領域基礎設施級工具的關鍵前提。它既能服務于國產計算生態的整體繁榮,也能為各類芯片使用方提供跨場景的堅實保障,真正實現了從技術理念到商業價值的確定性轉化。
4.結語
成立僅半年的智子芯元,憑借其核心引擎KernelCAT,已成功推出兩款戰略級產品:Kerminal直擊算力生態的系統性痛點,為芯片廠商和AI企業構建“開箱即用”的算力基礎設施;KerWork則前瞻布局“AI+運籌”在計算加速延長線上的更多高價值應用,打開第二增長空間。
據悉,智子芯元將持續押注“AI+運籌”這條技術主線,加速產品迭代與場景滲透。生產力級AI智能體的能力除了被“基礎模型和Harness提升”,也正在被“運籌優化范式”所拓展。
對投資者而言,這家公司所踩中的,恰是中國AI產業從“勉強能用”翻越至“真正好用”的那道分水嶺——國產替代的浪潮越深入,軟硬協同的生態價值就越稀缺,而稀缺,從來都是最好的估值敘事。
(封面圖來源:智子芯元)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.