網易首頁 > 網易號 > 正文申請入駐

Google 想為 AI Agent 打造下一個 Kubernetes

2026-05-30 10:08:30　來源: InfoQ

北京舉報

分享至

作者｜ Phillip de Wet

譯者｜田橙

策劃｜ Tina

兩個新的 Apache 2.0 項目讓具有突發性的 Agent 工作負載硬件效率提升了 97%。

Google 表示，面向希望在大規模企業環境中高效運行 Agent 工作負載、又不想重新發明 Kubernetes 的組織，它已經拿出了一個早期方案。

目前，Google 已經開源 Agent Substrate，以及構建在其上的分布式 Agent 運行時 Agent eXecutor，簡稱 AX。兩個項目均采用較為寬松的 Apache-2.0 許可證。不過，Agent Substrate 仍處于非常早期的開發階段，相關能力和接口都可能繼續變化。

Agent Substrate 是一種在 Kubernetes 之上構建 Agent 專屬控制能力的方式。它讓用戶可以借助一個輕量級控制平面來管理 Agent 生命周期。這個控制平面專門面向 Agent 場景中的高頻交互設計，可應對數百萬次亞秒級工具調用。

與之配套的 AX，則是一個子系統或運行時，用于協調 Agentic 循環、通過事件日志管理執行，并與本地和遠程 Actor 通信……原生支持恢復和執行續跑，即使是在復雜的分布式環境中也是如此。

1 來自 Kubernetes 的經驗？

GKE 工程師 Tim Hockin 和產品經理 Brandon Royal 在談到為何開放這些早期項目時表示：“在 Kubernetes 早期，來自不同貢獻者的反饋和視角至關重要，他們在解決類似挑戰的過程中幫助項目走向成功。我們認為，Agent 基礎設施正處在一個類似的拐點。”

Google 在 5 月下旬發布了這兩個項目，版本分別為 v0.0.0 和 v0.1.0。兩者都附帶了大量關于破壞性變更和整體不成熟的提示。

Substrate 文檔警告稱：“在這一階段，我們不對向后兼容性作出任何保證，本項目中的一切都可能發生變化。”這也強調了它仍處于非常早期的孕育階段。

配套的視頻演示展示了 AX 和 Substrate 的實際運行效果：對于突發式工作負載的 Agent，它們能夠帶來巨大的效率提升。這類場景在 Agent 等待人類交互、外部工具或數據源時很常見。

Google 表示，在傳統模型下，每一個活躍對話通常都會將計算和內存資源綁定到一個專用進程或容器上，即使它正在等待緩慢的外部事件。

借助 Substrate 對非活躍 Agent 的掛起能力，Google 演示了這樣一種效果：如果從統計上看任意時刻只有一個 Agent 正在執行，那么最多 30 個邏輯 Agent 會話實際上可以共享同一份物理執行容量。

推理本身并不會變得更快，但對于大量間歇性活躍的 Agent 來說，Agent Substrate 的目標是在沒有冷啟動開銷的情況下釋放硬件資源，從而帶來顯著的效率收益。

項目負責人表示，Agent Substrate 位于 Kubernetes 之上，同時也在 Agent 執行層之下，目的是繞開 Kubernetes 的一些短板，而不是重新發明它。AX 則作為一個位于其上的 Agent 運行時，不綁定特定協議和計算形態，但針對 K8s 做了優化。

2 為那些因人類太慢而空閑的 Agent 提供底座

Google 表示，規模越大，Agent 花在等待人類、工具或其他來源輸入上的時間就越多。

在傳統基礎設施中，選擇通常只有兩個：要么為硬件買單，把 Agent 狀態持續保存在內存中；要么接受一次以秒計的冷啟動。

Agent Substrate 將 Agent 的邏輯生命周期與底層計算資源解耦。當 Agent 進入非活躍狀態時，它的執行狀態會被快照保存，處理它的 Worker 則返回共享池。當對話恢復時，Agent 可以在任意可用 Worker 上快速恢復，通常只需幾百毫秒，而不是經歷一次完整冷啟動。

Google 將其描述為一種“零空閑”架構。硬件資源保持流動，而 Agent 會話則獨立于其下方的基礎設施持續存在。由于構建在 Kubernetes 之上，恢復后的 Agent 可以運行在一個全新的 Pod 上，同時不丟失上下文。

Google 表示，Kubernetes 非常擅長編排大量相對穩定、長期運行的服務，但真正大規模運行的 Agentic 系統會產生數百萬次亞秒級工具調用，并呈現出高度突發式的執行模式。

AX 位于這一層之上，作為運行時和執行環境，用于承載不同類型的 Agent 和工具，同時依賴 Substrate 完成調度、隔離、掛起和狀態恢復。

Google 表示，擺脫傳統的無狀態微服務模型還能帶來其他好處。例如，該系統會為 Agent 會話強制執行單寫者一致性，避免為處理多個請求同時命中同一會話狀態而引入鎖層和分布式協調機制。

3 與 Google 集成，但也保持廠商中立

AX 內置了一個 Gemini Agent，用于處理自然語言請求；在其路線圖的優先事項中，還包括與 Google Antigravity Agentic 開發平臺集成。該項目提到，GKE 在調度和恢復等領域的工作，以及 Google DeepMind 在分布式 harness 方面的工作，是其早期影響來源。

不過，Google 的思路和當年的 Kubernetes 類似：先把核心組件開放出來，做成不綁定特定生態的基礎設施，再借助社區參與推動項目成熟，最終也為自家云服務創造需求。

產品管理總監 Nathan Beach 表示：“我們選擇以開放方式構建這一項目，是因為我們相信，未來的 AI 基礎設施必須廠商中立、可移植，并由社區共同推動。”

原文連接：

https://www.thestack.technology/google-chases-kubernetes-moment-for-ai-agents/

聲明：本文由 InfoQ 翻譯，未經許可禁止轉載。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.