![]()
過去兩年,AI產業的敘事中心一直圍繞大模型展開:參數規模、訓練效率、推理成本、模型能力邊界。
可當OpenClaw代表的Agent落地到千行百業,越來越多的問題浮出水面:一個能夠理解任務、調用工具、訪問數據、編排流程、持續執行的智能體,需要的不僅是基礎算力和模型,而是一套完整的運行體系。
問題在于,什么是適合Agent的運行體系呢?
5月22日的KADC2026鯤鵬開發者峰會上,天翼云聯合鯤鵬給出了清晰的答案——構建Runtime、Token與Data協同的AI全棧云底座。
01 底座重構,企業AI正在從“調API”走向Agent Native
很多企業做AI應用,本質上是在“調接口”:前端套一個聊天框,后端接一個大模型API,再接幾個業務插件。
這樣的模式,曾是兩年前的主流思路,但在Agent時代已經行不通。
因為企業業務不是單輪問答,常常是跨系統、跨角色、跨流程、跨權限的連續任務,一個真正可用的Agent,既要能理解任務,也要能調用ERP、OA、CRM、知識庫、瀏覽器、代碼環境等工具。折射到企業的IT架構上,AI不能停留在“外掛能力”的階段,必須變成云原生架構中的一層運行時。
![]()
天翼云公有云事業部研發專家周望在演講中提到,天翼公有云當前的AI全棧產品體系被劃分為三個模塊。
第一個是Agent Infra,提供Agent Runtime、Agent沙箱、流程模式、中間件、Serverless底座等核心運行能力。可以理解為智能體運行的“水電煤”,解決了任務怎么拆解、工具怎么調用、狀態怎么保存、異常怎么回滾、權限怎么隔離、多個Agent之間怎么協同等應用和運行問題。
第二個是AI Infra,包含異構算力池化調度、推理加速、密態計算、智算網絡等算力與引擎能力。簡單來說,就是為Agent提供穩定、高效、低成本的“動力系統”,解決的是怎么讓每一個Token生成得更快、更便宜、更安全,怎么讓每一個Agent任務跑得更穩、更流暢、更可持續。
第三個是Data Infra,涵蓋向量存儲、極速緩存、可信數據空間等數據服務。Agent執行任務的過程中,需要持續調用企業內部的知識庫、業務數據、歷史記錄和外部信息,Data Infra的價值正是讓Agent在執行任務時能夠快速檢索、精準調用、穩定讀寫,并且保證數據安全和權限可控。
三個模塊實現了上層應用到底層算力的全覆蓋,同時也揭示了Agent時代的生存法則:影響智能體能否落地的因素,不只是模型本身,關系到運行、數據、安全與成本控制在內的全套能力。
企業需要的不是一個個孤立的Agent應用,而是一個能夠承載智能體開發、部署、運行、治理和運營的統一底座,企業的AI基礎設施正在從“Model Native”走向“Agent Native”。
在Model Native的架構下,主要提供算力、模型訓練、推理接口、API調用,目標是讓企業“用上大模型”;而Agent Native架構的要求,進一步升維到智能體運行所需的能力,需要原生融入云基礎設施中,涉及任務編排、工具調用、上下文管理、長期記憶、權限隔離、數據訪問……不再是應用層臨時拼接出來的功能,而是AI基礎設施的標準能力。
就像天翼云所示范的:Agent Infra解決運行框架,AI Infra解決推理效率,Data Infra解決數據支撐,三者合在一起,才讓Agent從一個“會對話的應用”,變成了適合千行百業的生產力引擎。
02 跨越瓶頸,軟硬協同攻克“失憶癥”與“成本陷阱”
Agent進入企業的生產環境后,擺在案頭的是一個更加棘手的問題:一份份近乎“天價”的算力賬單。
和AI進行對話時,每次只需要完成一次回答,但企業Agent要處理長任務、多輪交互、多工具調用、多步驟規劃。一旦任務鏈條變長,問題就會集中爆發,其中被詬病最多的瓶頸有兩個:
一個是“失憶癥”,由于初期任務信息易丟失、缺少全局最優規劃、缺乏自我修正機制等,導致長序列任務準確度較低。
另一個是“成本陷阱”,因為歷史上下文不可壓縮、失敗重試與冗余路徑增加等原因,Token消耗隨對話輪次指數級膨脹。
![]()
面對橫亙在千行百業面前的難題,天翼云和鯤鵬的合作沒有止步于算力:天翼云自研的智能體應用AgentDesk與鯤鵬智能體記憶系統進行了協同增強,用軟硬協同方式消除了Agent長任務場景的系統瓶頸。
核心思路是引入鯤鵬oG-Memory管理框架,通過記憶壓縮、上下文緩存、精細提取、按需漸進加載、歷史會話摘要、記憶共享/隔離等能力,以及openGauss的向量存儲,鯤鵬的檢索加速、Embedding CPU加速、存儲加速等能力,在保留關鍵記憶的同時,降低推理過程中的Token開銷。
![]()
以LoCoMo長序列任務測試為例,AgentDesk+鯤鵬智能體記憶系統組合交出了一份實打實的高分答卷:在長序列任務中的準確度達到90.8%,較原生OpenClaw提升了37%,較AgentDesk提升了36%;輸入Token消耗僅236萬,比原生OpenClaw降低了68%,比AgentDesk降低了30%。
隱藏在數字背后的,是軟硬協同的融合創新范式。
不少Agent框架處理長期任務,采用的是“堆上下文”的方式。結果就是,任務越長,塞進去的歷史越多,Token成本越高,模型注意力越分散。看似記憶比較完整,實際效率隨著對話輪次越來越低。
天翼云和鯤鵬的實踐,沒有簡單地把歷史對話塞回上下文,而是把記憶從上下文窗口里“拆出來”,變成一套可檢索、可壓縮、可分層、可隔離、可加速的數據基礎設施。在Agent執行任務的過程中,模型不需要每次吞下全部歷史對話,可以在需要時按需加載關鍵記憶。
把視角再放大一些,天翼云和鯤鵬明確了一個方向:Agent的能力邊界,不只由模型決定,Runtime、Memory與算力基礎設施的協同,將是AI從對話機器人走向數字員工的分水嶺。
不只是長期記憶系統,在Agent的安全治理方面,天翼云和鯤鵬有著相同的原則——“讓AI在邊界內行動”
天翼云的智能體引擎AGE打造了瀏覽器、代碼、手機等沙箱系統,鯤鵬超節點的沙箱系統進一步實現了快速啟動、高密部署和快速回滾,正在以雙向奔赴的形式讓Agent既能高效、準確、低成本執行任務,且始終被限制在可隔離、可回滾、可審計的安全邊界內。
03 寫在最后
智能體時代的AI基礎設施,將從“應用中心”轉向“Agent中心”,從“模型接入”轉向“運行體系”,從“單點智能”轉向“全棧協同”。
大模型并沒有消失,而是退到了幕后,成為AI計算底座中的一項基礎能力。左右決定企業AI落地速度的,是能否把模型、算力、數據、工具、記憶、安全和成本統一起來。誰先擁抱Runtime、Token與Data協同的AI全棧云底座,誰就更有機會拿到Agentic AI時代的“船票”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.