網易首頁 > 網易號 > 正文申請入駐

天翼云聯手鯤鵬，為企業Agent補上“長期記憶”的關鍵拼圖

2026-05-29 17:19:22　來源: Alter聊科技

浙江舉報

分享至

過去兩年，AI產業的敘事中心一直圍繞大模型展開：參數規模、訓練效率、推理成本、模型能力邊界。

可當OpenClaw代表的Agent落地到千行百業，越來越多的問題浮出水面：一個能夠理解任務、調用工具、訪問數據、編排流程、持續執行的智能體，需要的不僅是基礎算力和模型，而是一套完整的運行體系。

問題在于，什么是適合Agent的運行體系呢？

5月22日的KADC2026鯤鵬開發者峰會上，天翼云聯合鯤鵬給出了清晰的答案——構建Runtime、Token與Data協同的AI全棧云底座。

01 底座重構，企業AI正在從“調API”走向Agent Native

很多企業做AI應用，本質上是在“調接口”：前端套一個聊天框，后端接一個大模型API，再接幾個業務插件。

這樣的模式，曾是兩年前的主流思路，但在Agent時代已經行不通。

因為企業業務不是單輪問答，常常是跨系統、跨角色、跨流程、跨權限的連續任務，一個真正可用的Agent，既要能理解任務，也要能調用ERP、OA、CRM、知識庫、瀏覽器、代碼環境等工具。折射到企業的IT架構上，AI不能停留在“外掛能力”的階段，必須變成云原生架構中的一層運行時。

天翼云公有云事業部研發專家周望在演講中提到，天翼公有云當前的AI全棧產品體系被劃分為三個模塊。

第一個是Agent Infra，提供Agent Runtime、Agent沙箱、流程模式、中間件、Serverless底座等核心運行能力。可以理解為智能體運行的“水電煤”，解決了任務怎么拆解、工具怎么調用、狀態怎么保存、異常怎么回滾、權限怎么隔離、多個Agent之間怎么協同等應用和運行問題。

第二個是AI Infra，包含異構算力池化調度、推理加速、密態計算、智算網絡等算力與引擎能力。簡單來說，就是為Agent提供穩定、高效、低成本的“動力系統”，解決的是怎么讓每一個Token生成得更快、更便宜、更安全，怎么讓每一個Agent任務跑得更穩、更流暢、更可持續。

第三個是Data Infra，涵蓋向量存儲、極速緩存、可信數據空間等數據服務。Agent執行任務的過程中，需要持續調用企業內部的知識庫、業務數據、歷史記錄和外部信息，Data Infra的價值正是讓Agent在執行任務時能夠快速檢索、精準調用、穩定讀寫，并且保證數據安全和權限可控。

三個模塊實現了上層應用到底層算力的全覆蓋，同時也揭示了Agent時代的生存法則：影響智能體能否落地的因素，不只是模型本身，關系到運行、數據、安全與成本控制在內的全套能力。

企業需要的不是一個個孤立的Agent應用，而是一個能夠承載智能體開發、部署、運行、治理和運營的統一底座，企業的AI基礎設施正在從“Model Native”走向“Agent Native”。

在Model Native的架構下，主要提供算力、模型訓練、推理接口、API調用，目標是讓企業“用上大模型”；而Agent Native架構的要求，進一步升維到智能體運行所需的能力，需要原生融入云基礎設施中，涉及任務編排、工具調用、上下文管理、長期記憶、權限隔離、數據訪問……不再是應用層臨時拼接出來的功能，而是AI基礎設施的標準能力。

就像天翼云所示范的：Agent Infra解決運行框架，AI Infra解決推理效率，Data Infra解決數據支撐，三者合在一起，才讓Agent從一個“會對話的應用”，變成了適合千行百業的生產力引擎。

02 跨越瓶頸，軟硬協同攻克“失憶癥”與“成本陷阱”

Agent進入企業的生產環境后，擺在案頭的是一個更加棘手的問題：一份份近乎“天價”的算力賬單。

和AI進行對話時，每次只需要完成一次回答，但企業Agent要處理長任務、多輪交互、多工具調用、多步驟規劃。一旦任務鏈條變長，問題就會集中爆發，其中被詬病最多的瓶頸有兩個：

一個是“失憶癥”，由于初期任務信息易丟失、缺少全局最優規劃、缺乏自我修正機制等，導致長序列任務準確度較低。

另一個是“成本陷阱”，因為歷史上下文不可壓縮、失敗重試與冗余路徑增加等原因，Token消耗隨對話輪次指數級膨脹。

面對橫亙在千行百業面前的難題，天翼云和鯤鵬的合作沒有止步于算力：天翼云自研的智能體應用AgentDesk與鯤鵬智能體記憶系統進行了協同增強，用軟硬協同方式消除了Agent長任務場景的系統瓶頸。

核心思路是引入鯤鵬oG-Memory管理框架，通過記憶壓縮、上下文緩存、精細提取、按需漸進加載、歷史會話摘要、記憶共享/隔離等能力，以及openGauss的向量存儲，鯤鵬的檢索加速、Embedding CPU加速、存儲加速等能力，在保留關鍵記憶的同時，降低推理過程中的Token開銷。

以LoCoMo長序列任務測試為例，AgentDesk+鯤鵬智能體記憶系統組合交出了一份實打實的高分答卷：在長序列任務中的準確度達到90.8%，較原生OpenClaw提升了37%，較AgentDesk提升了36%；輸入Token消耗僅236萬，比原生OpenClaw降低了68%，比AgentDesk降低了30%。

隱藏在數字背后的，是軟硬協同的融合創新范式。

不少Agent框架處理長期任務，采用的是“堆上下文”的方式。結果就是，任務越長，塞進去的歷史越多，Token成本越高，模型注意力越分散。看似記憶比較完整，實際效率隨著對話輪次越來越低。

天翼云和鯤鵬的實踐，沒有簡單地把歷史對話塞回上下文，而是把記憶從上下文窗口里“拆出來”，變成一套可檢索、可壓縮、可分層、可隔離、可加速的數據基礎設施。在Agent執行任務的過程中，模型不需要每次吞下全部歷史對話，可以在需要時按需加載關鍵記憶。

把視角再放大一些，天翼云和鯤鵬明確了一個方向：Agent的能力邊界，不只由模型決定，Runtime、Memory與算力基礎設施的協同，將是AI從對話機器人走向數字員工的分水嶺。

不只是長期記憶系統，在Agent的安全治理方面，天翼云和鯤鵬有著相同的原則——“讓AI在邊界內行動”

天翼云的智能體引擎AGE打造了瀏覽器、代碼、手機等沙箱系統，鯤鵬超節點的沙箱系統進一步實現了快速啟動、高密部署和快速回滾，正在以雙向奔赴的形式讓Agent既能高效、準確、低成本執行任務，且始終被限制在可隔離、可回滾、可審計的安全邊界內。

03 寫在最后

智能體時代的AI基礎設施，將從“應用中心”轉向“Agent中心”，從“模型接入”轉向“運行體系”，從“單點智能”轉向“全棧協同”。

大模型并沒有消失，而是退到了幕后，成為AI計算底座中的一項基礎能力。左右決定企業AI落地速度的，是能否把模型、算力、數據、工具、記憶、安全和成本統一起來。誰先擁抱Runtime、Token與Data協同的AI全棧云底座，誰就更有機會拿到Agentic AI時代的“船票”。

聲明：內容由AI生成

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.