網易首頁 > 網易號 > 正文申請入駐

騰訊云全棧開源Cube沙箱！支持零代碼遷移Agent環境

2026-04-22 11:30:15　來源: 智東西

北京舉報

分享至

智東西
作者陳佳
編輯程茜

智東西4月22日消息，昨日，騰訊云宣布將面向AI Agent的代碼執行沙箱Cube（Cube Sandbox）以Apache 2.0協議完整開源。這意味著，騰訊云通過服務級開源的方式，對外開放一套已經在內部生產環境驗證過的沙箱服務技術棧，開發者可以直接部署，用于承載AI Agent的代碼執行和工具調用。

根據騰訊云官方消息，Cube沙箱是業內唯一兼顧硬件級強隔離與亞百毫秒啟動的開源AI Agent沙箱服務，兼容OpenAI Python SDK與E2B SDK，開發者無需修改代碼或更換框架，只需將運行時指向Cube，即可把Agent的代碼執行和工具調用遷移到該環境，并支持私有化部署。

▲騰訊云CubeSandbox開源項目GitHub主頁（圖源：GitHub）

這類沙箱本質上是Agent運行的最后一層隔離環境。隨著Agent開始頻繁調用外部工具、執行代碼，底層執行環境不僅要保證安全隔離，還要能應對大規模并發調度，否則一旦擴展到成千上萬實例，系統成本和穩定性都會成為瓶頸。

針對這一行業痛點，騰訊云Cube沙箱將硬件級安全隔離、高性能體驗與輕量化部署能力深度融合，可全面適配AI Agent從研發訓練、應用開發到企業規模化部署的全流程需求。

此次開源的內容也圍繞這一定位展開。騰訊云已對外開放Cube的完整技術棧，包括運行時、調度系統、一鍵部署腳本以及配套文檔和示例工程，支持Shell執行、文件操作、瀏覽器自動化和強化學習訓練等常見場景，開發者可以直接使用或二次修改。

從開源方式看，騰訊云這次開源的重點不在單點技術，而是將一整套可直接部署的服務能力整體釋放，目標是為全球AI Agent開發者、企業提供安全、高效、低成本的執行環境底座，支撐海量Agent從實驗室Demo走向規模化量產。

這一開源計劃此前已有鋪墊。早在3月27日的騰訊云上海峰會上，騰訊集團高級執行副總裁湯道生（Dowson Tong）就已披露該開源計劃，此次屬于正式代碼落地。

一、把“執行環境”做成獨立系統，兼容現有Agent框架無須改代碼

Cube沙箱對現有開發體系的改動非常有限。它原生兼容OpenAI Python SDK和E2B SDK，開發者只需要把原本的執行環境指向Cube，就可以把Agent的代碼執行和工具調用遷移過去，不需要改業務邏輯，也不需要更換框架。

這意味著它切入的位置很明確，不碰模型層，也不改Agent邏輯，而是專門替代“代碼在哪跑”這一層。對于已經搭好Agent系統的團隊來說，遷移成本被壓低。

在性能上，據騰訊云，Cube沙箱實際場景冷啟動速度僅60ms，比行業均值（150ms）低三分之二；具有行業最高的并發能力，分鐘級拉起數萬沙箱，平臺瞬時調度能力超過100K實例；

在安全架構上，Cube沙箱構建了三重防御體系，具有毫秒級事件級快照與狀態回滾能力，為Agent不可預測行為提供了關鍵的“撤回”機制。在穩定性上，Cube沙箱經過超大規模生產級驗證，核心性能均經過生產環節實測。

▲騰訊云Cube沙箱分層架構圖（圖源：騰訊云）

二、五大突破，構建Agent專屬“硬件級安全駕駛艙”

在核心技術上，Cube沙箱圍繞執行環境的隔離、性能和調度能力方面實現了五大突破。

1、Cube在隔離機制上沒有采用Docker共享內核方案，而是為每個沙箱實例提供獨立的Guest OS內核，并基于KVM硬件虛擬化實現隔離。同時，系統通過eBPF內核態虛擬交換機對網絡進行控制，實現沙箱之間的網絡隔離以及出站流量的細粒度過濾，從而降低單個實例異常對整體系統的影響。

2、Cube沙箱針對啟動速度做了專項優化，據騰訊云實測，其冷啟動耗時可控制在百毫秒以內，在行業中排名第一。系統通過資源池化預置、快照克隆、EPT Lazy Load、全棧鎖優化等技術，將冷啟動時間壓縮至60毫秒以內。在50并發場景下，平均啟動時間約為67毫秒，P95約為90毫秒，整體延遲控制在百毫秒級，相比傳統虛擬機的秒級啟動和容器約200毫秒的水平有所降低。

▲CubeSandbox冷啟動速度對比數據（圖源：騰訊云）

3、通過CoW內存復用、Rust底層極致裁剪、reflink磁盤共享技術，Cube在資源占用上進行了壓縮，單個沙箱實例的內存開銷控制在5MB以內。據騰訊云，一臺96vCPU物理機可以運行2000多個沙箱實例，存儲消耗較傳統方案降低90%+，算力成本下降。

▲CubeSandbox內存開銷對比數據（圖源：騰訊云）

4、Cube還對調度系統進行了設計優化，分鐘級拉起數十萬實例。通過分布式調度與單機裝箱聯合設計，結合資源池化預置與快照克隆技術，Cube沙箱實現了平臺瞬時調度10萬+實例、單臺96vCPU物理機100并發下P99延遲低于200ms的極端并發能力。

5、Cube引入了快照與回滾機制，用于應對Agent執行過程中的異常情況。系統支持在百毫秒級完成狀態快照，以及Checkpoint保存、任意狀態回滾、快速分叉與數據無損恢復，從而減少不可預測行為帶來的影響。騰訊云方面稱，這一功能仍在完善中，后續將在完成后對外開源。

三、面向三類場景切入，從模型訓練到企業私有化部署

從應用場景看，Cube主要覆蓋三類用戶。

第一類是做模型訓練的公司，例如MiniMax Agentic RL訓練要求同時支撐數十萬異構沙箱并發運行，且沙箱鏡像涵蓋Linux、Windows、Android等多種系統形態。Cube通過鏡像去重和三級緩存按需加載降低存儲與IO壓力，并結合分布式調度，使平臺可在1分鐘內調度數十萬沙箱實例。

第二類是Agent開發者和中小團隊。Cube沙箱提供了無需Kubernetes集群、無需綁定特定云平臺的極簡部署體驗。一鍵部署腳本可在數分鐘內完成環境搭建，通過MCP、API、SDK或CLI均可平滑接入現有Agent體系，無需重寫上層代碼。

第三類是看重數據隔離和合規能力的政企客戶。Cube沙箱支持完整私有化部署，數據不出企業邊界，滿足等保與合規要求。此外，Apache 2.0協議保障商業使用友好，代碼完全可審計，不依賴任何海外云服務商，為數據主權敏感場景提供可信的Agent執行環境。

結語：推理、執行、緩存逐漸拆開，Agent基礎設施競爭新階段

這次開源的意義在于，Agent系統的基礎設施正在從單一模型競爭，拆分為多個獨立層級。推理加速、執行環境、緩存系統開始分別演進，而不再是一個統一黑盒。

騰訊云后續計劃把Cube沙箱與推理加速和緩存系統結合，形成完整的Agent基礎設施組合。這種拆分意味著，不同廠商可以在不同層做優化，而不是全部圍繞模型能力競爭。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.