文/海峰看科技
當下,AI很火,大家熱議算力芯片和模型。但很多AI開發者,正在陷入一種“無效內卷”:集群規模越堆越大,Agent啟動卻越來越慢;向量檢索動不動卡死,加再多服務器也解決不了問題。這不是算力不夠,是架構不對。
很多人有個誤區——一提到AI Agent,就覺得是GPU/NPU的事。但實際上,Agent的冷啟動、記憶檢索、沙箱拉起、多任務調度,這些高并發、低時延的“臟活累活”,全跑在通用計算底座上。AI芯片負責“算得快”,通用計算負責“管得住、調得動、跑得穩”。智能體時代,已經從智算主導進入到智算與通算協同的新階段。
那通用計算要如何變革,才能應對開發者痛點?
我最近追了鯤鵬昇騰開發者大會(KADC 2026)會前的鯤鵬昇騰創享月的多場直播,發現涉及通用計算鯤鵬系統的干貨密度很高,幾位專家先講解,后解答問題,直播形式很新穎。而且,鯤鵬專家對上述開發者痛點的答案很清晰:不只是造更快的CPU,而是重新定義算力的組織方式——超節點架構+軟件全面開源,讓開發者真正做到“開箱即用”。
![]()
臨近5月22日-23日即將在北京中關村國際創新中心舉行的KADC 2026,我們從AI開發者的核心痛點出發思考一下,通用算力體系應該怎樣變革,才能為產業提供一個超越傳統體系、更適應AI未來的新選擇和新基石?
三大痛點:堆服務器換不來好Agent
從AI應用開發者的吐槽來看,目前他們主要面臨三大痛點。先細說第一個痛點,規模與效率的矛盾。傳統思路很簡單——算力不夠,服務器來湊。但Agent場景下,每個實例啟動都要拉鏡像、讀數據、初始化內存。你加再多的機器,冷啟動延遲還是下不來;向量檢索的數據量一大,照樣卡成狗。很多開發者感覺集群越搭越大,效率不升反降。
第二個痛點是記憶和安全的“基礎設施真空”。Agent要干活就得有記憶。但現在大部分方案是把記憶當“緩存”扔給Redis或者簡單文本處理——數據散落在各處,Agent想讀取信息效率極低;共享與隔離機制不健全,出了問題沒法追責;多Agent之間記憶更新完全是靜態的,沒有版本控制和事務保證,一個Agent改了狀態,另一個根本感知不到。更別提安全問題了——記憶被篡改怎么辦?企業敢用嗎?
第三個痛點:遷移和調優的門檻太高。很多開發者不是不想嘗試新架構,而是遷移工作太復雜:改代碼、適配中間件、調參數……光SQL改造就能耗掉好幾天。開發者真正想做的,是使用計算基礎設施快速把業務跑起來,而且要跑得很穩定、很安全,而不是花大量時間死磕底層適配。
三個痛點總結成一句話,舊的通用計算架構和工具鏈,已經撐不起Agent時代的需求了。
硬件應對:鯤鵬超節點,架構變革
鯤鵬生態給出的解法,不是簡單地發布一款更快的CPU,而是從兩個維度同時動手:硬件上重構系統架構,軟件上全面開源開放。
先說硬件。此次創享月第一場直播的主題就是“鯤鵬超節點,為AI Infra而生”。核心技術就是大家熟悉的靈衢互聯——它打破了傳統服務器的物理邊界,實現以數據為中心的全互聯架構。
這是什么意思呢?以前每臺服務器守著自己的一畝三分地,內存、設備都是獨享的,跨節點訪問慢得要命。現在通過靈衢互聯,內存可以跨節點借、設備可以跨節點用、訪問路徑大幅縮短——大帶寬、低時延、內存統一編址、內存語義訪問,把一堆獨立的服務器變成一個“緊耦合的大系統”。
也就是說,靈衢帶來的內存語義直接訪問,不是“打電話”要等接通,而是“直接走過去拿”。這就是消息語義和內存語義的本質區別。
這個變化落到實際場景,提升非常直觀,一是AI Agent場景,實現容器冷啟動達到亞秒級,百億千維向量檢索性能提升20%;二是在搜推廣場景,實現RPC時延下降50%,內存池帶寬提升4倍,KVC/Emb時延下降60%;三是數據庫、大數據、虛擬化等傳統業務也能獲得全新解決方案。
舉個例子,在金融交易場景,鼠標點擊一瞬間的時延,對投資機構意味著大筆資金的得與失。鯤鵬超節點的低時延能力,正在滿足這些極速交易的需求。
可以看出,鯤鵬不是在修修補補,而是在重新蓋一套房子——把原來各自為政的服務器,變成一個全局調度的資源池。這不是“堆數量”,這是“改架構”。
![]()
軟件應對:記憶可回滾、沙箱秒拉起
計算系統硬件只是底座,真正讓開發者覺得“好用”的,是上層能力的落地。這次創享月直播里,印象最深的是圍繞AI Agent展開的記憶系統和沙箱系統。
先聊記憶系統。企業用AI,最大的問題不是模型不夠強,而是“不敢用”。不敢用的原因有三個:數據散落各處,Agent獲取信息效率極低;共享與隔離機制不健全;多Agent之間的記憶更新沒有版本控制和事務保證。
鯤鵬專家在直播里,基于openGauss給出了一個叫“oG-Memory”的企業級Agent記憶系統。它不是簡單把記憶存進數據庫,而是把“無狀態的上下文”升級為“可管理的企業資源”。openGauss原生支持關系型、向量、知識圖譜、全文檢索等多模態數據的存儲與融合檢索,權限、事務、版本控制這些能力都是數據庫內核自帶的,不是后來打補丁。上層再通過分層漸進檢索、記憶按需加載等技術,讓Agent的上下文窗口裝進更精準的信息。
在直播里,專家說了句大實話,別人做的是記憶的應用,鯤鵬做的是記憶的基礎設施。再加上安全層面的硬件級隔離和閃回技術,發現異常行為可以一鍵回滾——企業級Agent才敢真正上生產。
再說沙箱系統。Agent執行任務需要安全隔離的運行環境,沙箱拉起頻率極高。傳統方案有個笨辦法:在每臺服務器本地預留大量緩沖和預熱鏡像,用“資源換速度”——成本高,跨節點共享還慢。
專家在直播里,用openEuler+openFuyao給出了新解法:利用超節點的低時延、高帶寬特性構建共享內存池。效果是鏡像分發和沙箱啟動速度獲得數量級提升,上萬并發的秒級拉起成為現實。再加上openEuler從硬件到應用層的縱深安全防護,讓Agent從“黑箱失控”走向“可控、可知、可恢復”。
在筆者看來,面向Agent時代,鯤鵬生態圍繞記憶系統和沙箱系統兩大方向持續構筑能力,讓各類Agent在鯤鵬上跑得更順、更穩、更安心。鯤鵬生態想做的是讓眼花繚亂的各類Agent跑好——給它們提供一個穩定、安全、可控、低成本的運行環境。
![]()
工具鏈應對:兩大工具讓你“零基礎變專家”
計算硬實力有了,軟實力也得跟上。很多開發者對鯤鵬感興趣,但卡在遷移和調優的門檻上。這次直播里,鯤鵬生態拿出了兩個實打實的“開發者友好”工具。
一是BoostKit(性能加速器)。面向AI時代,在AI數據工程、推理端KVCache緩存加速、搜推+AI編譯器等場景持續發力,把CPU的性能榨到極致,開發者不用自己手調。
二是DevKit(AI智能化遷移開發調優)。這個要重點說。通過AI輔助系統自動遷移,單系統遷移僅需5人天就能搞定不兼容源碼和SQL語句改造;AI輔助代碼自動優化能識別計算熱點并轉換為向量化代碼,效率提升30%以上;AI輔助系統性能分析,1天就能完成100輪自動迭代尋參。
也就是說,開發者不用翻幾百頁文檔,不用一行行改代碼到崩潰,工具替開發者干了。專家把這叫“零基礎也能快速變身鯤鵬專家”。在我看來,這不是口號,是真能用的東西。
KADC 2026還有什么值得期待?
幾場直播看下來,我對即將到來的KADC 2026更期待了。本屆大會定于5月22日-23日在北京舉辦,包含兩場開發者峰會、openEuler、BoostKit等10場細分領域的技術分論壇。
從前期預熱內容來看,大會將聚焦算力基礎設施、系統架構、操作系統、AI應用、開發工具、行業落地等核心方向,沒有空泛造勢,全是實打實的技術分享與生態進展,值得開發者與行業人士重點關注。我認為有三大方向值得關注。
第一,真實Demo現場跑。之前專家講的亞秒級冷啟動、向量檢索提升20%,到現場可以親眼看到跑出來的效果,甚至親手操作。技術吹牛沒意義,跑出來才算數。
第二,開源開放的生態協同。靈衢、openEuler、openGauss社區持續壯大。這次峰會會有真實的技術分享和社區動態,不是虛的。
![]()
第三,動手體驗區。從公開信息可以看到, 2000多平方米沉浸式主題展區,鯤鵬昇騰創享月技術直播講到的記憶系統、沙箱系統、BoostKit加速、DevKit智能遷移,都可以現場上手。“Agent Skill玩轉體驗營”和Codelabs實戰區,能把直播里聽到的干貨變成真能用的技能。還有算子挑戰賽總決賽,從3000多名選手中脫穎而出的高手隊伍現場對決,喜歡看技術的別錯過。
總結:讓開發者好用、易用,讓鯤鵬開箱即用
回顧鯤鵬昇騰創享月的技術直播,我的整體感受是:鯤鵬不是在搞替代,而是在提供一套“架構更先進、軟件更開放、開發者更省心”的全新計算基座。
超節點通過靈衢互聯打破服務器邊界,讓資源全局調度;openGauss和openEuler從記憶管理到沙箱隔離,把Agent的“基礎設施能力”補齊;BoostKit和DevKit用AI加持性能優化和開發體驗,讓開發者真正聚焦業務而不是底層適配。
總體看,鯤鵬生態的想法,是成為Agentic AI時代的“水電煤”——讓開發者忘記算力,專注智能。你不需要關心電怎么發出來的,插上就能用。說了這么多,你對KADC 2026是否更期待了?咱們現場見。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.