![]()
智東西
作者 陳佳
編輯 程茜
智東西4月22日消息,昨日,騰訊云宣布將面向AI Agent的代碼執行沙箱Cube(Cube Sandbox)以Apache 2.0協議完整開源。這意味著,騰訊云通過服務級開源的方式,對外開放一套已經在內部生產環境驗證過的沙箱服務技術棧,開發者可以直接部署,用于承載AI Agent的代碼執行和工具調用。
根據騰訊云官方消息,Cube沙箱是業內唯一兼顧硬件級強隔離與亞百毫秒啟動的開源AI Agent沙箱服務,兼容OpenAI Python SDK與E2B SDK,開發者無需修改代碼或更換框架,只需將運行時指向Cube,即可把Agent的代碼執行和工具調用遷移到該環境,并支持私有化部署。
![]()
▲騰訊云CubeSandbox開源項目GitHub主頁(圖源:GitHub)
這類沙箱本質上是Agent運行的最后一層隔離環境。隨著Agent開始頻繁調用外部工具、執行代碼,底層執行環境不僅要保證安全隔離,還要能應對大規模并發調度,否則一旦擴展到成千上萬實例,系統成本和穩定性都會成為瓶頸。
針對這一行業痛點,騰訊云Cube沙箱將硬件級安全隔離、高性能體驗與輕量化部署能力深度融合,可全面適配AI Agent從研發訓練、應用開發到企業規模化部署的全流程需求。
此次開源的內容也圍繞這一定位展開。騰訊云已對外開放Cube的完整技術棧,包括運行時、調度系統、一鍵部署腳本以及配套文檔和示例工程,支持Shell執行、文件操作、瀏覽器自動化和強化學習訓練等常見場景,開發者可以直接使用或二次修改。
從開源方式看,騰訊云這次開源的重點不在單點技術,而是將一整套可直接部署的服務能力整體釋放,目標是為全球AI Agent開發者、企業提供安全、高效、低成本的執行環境底座,支撐海量Agent從實驗室Demo走向規模化量產。
這一開源計劃此前已有鋪墊。早在3月27日的騰訊云上海峰會上,騰訊集團高級執行副總裁湯道生(Dowson Tong)就已披露該開源計劃,此次屬于正式代碼落地。
一、把“執行環境”做成獨立系統,兼容現有Agent框架無須改代碼
Cube沙箱對現有開發體系的改動非常有限。它原生兼容OpenAI Python SDK和E2B SDK,開發者只需要把原本的執行環境指向Cube,就可以把Agent的代碼執行和工具調用遷移過去,不需要改業務邏輯,也不需要更換框架。
這意味著它切入的位置很明確,不碰模型層,也不改Agent邏輯,而是專門替代“代碼在哪跑”這一層。對于已經搭好Agent系統的團隊來說,遷移成本被壓低。
在性能上,據騰訊云,Cube沙箱實際場景冷啟動速度僅60ms,比行業均值(150ms)低三分之二;具有行業最高的并發能力,分鐘級拉起數萬沙箱,平臺瞬時調度能力超過100K實例;
在安全架構上,Cube沙箱構建了三重防御體系,具有毫秒級事件級快照與狀態回滾能力,為Agent不可預測行為提供了關鍵的“撤回”機制。在穩定性上,Cube沙箱經過超大規模生產級驗證,核心性能均經過生產環節實測。
![]()
▲騰訊云Cube沙箱分層架構圖(圖源:騰訊云)
二、五大突破,構建Agent專屬“硬件級安全駕駛艙”
在核心技術上,Cube沙箱圍繞執行環境的隔離、性能和調度能力方面實現了五大突破。
1、Cube在隔離機制上沒有采用Docker共享內核方案,而是為每個沙箱實例提供獨立的Guest OS內核,并基于KVM硬件虛擬化實現隔離。同時,系統通過eBPF內核態虛擬交換機對網絡進行控制,實現沙箱之間的網絡隔離以及出站流量的細粒度過濾,從而降低單個實例異常對整體系統的影響。
2、Cube沙箱針對啟動速度做了專項優化,據騰訊云實測,其冷啟動耗時可控制在百毫秒以內,在行業中排名第一。系統通過資源池化預置、快照克隆、EPT Lazy Load、全棧鎖優化等技術,將冷啟動時間壓縮至60毫秒以內。在50并發場景下,平均啟動時間約為67毫秒,P95約為90毫秒,整體延遲控制在百毫秒級,相比傳統虛擬機的秒級啟動和容器約200毫秒的水平有所降低。
![]()
▲CubeSandbox冷啟動速度對比數據(圖源:騰訊云)
3、通過CoW內存復用、Rust底層極致裁剪、reflink磁盤共享技術,Cube在資源占用上進行了壓縮,單個沙箱實例的內存開銷控制在5MB以內。據騰訊云,一臺96vCPU物理機可以運行2000多個沙箱實例,存儲消耗較傳統方案降低90%+,算力成本下降。
![]()
▲CubeSandbox內存開銷對比數據(圖源:騰訊云)
4、Cube還對調度系統進行了設計優化,分鐘級拉起數十萬實例。通過分布式調度與單機裝箱聯合設計,結合資源池化預置與快照克隆技術,Cube沙箱實現了平臺瞬時調度10萬+實例、單臺96vCPU物理機100并發下P99延遲低于200ms的極端并發能力。
5、Cube引入了快照與回滾機制,用于應對Agent執行過程中的異常情況。系統支持在百毫秒級完成狀態快照,以及Checkpoint保存、任意狀態回滾、快速分叉與數據無損恢復,從而減少不可預測行為帶來的影響。騰訊云方面稱,這一功能仍在完善中,后續將在完成后對外開源。
三、面向三類場景切入,從模型訓練到企業私有化部署
從應用場景看,Cube主要覆蓋三類用戶。
第一類是做模型訓練的公司,例如MiniMax Agentic RL訓練要求同時支撐數十萬異構沙箱并發運行,且沙箱鏡像涵蓋Linux、Windows、Android等多種系統形態。Cube通過鏡像去重和三級緩存按需加載降低存儲與IO壓力,并結合分布式調度,使平臺可在1分鐘內調度數十萬沙箱實例。
第二類是Agent開發者和中小團隊。Cube沙箱提供了無需Kubernetes集群、無需綁定特定云平臺的極簡部署體驗。一鍵部署腳本可在數分鐘內完成環境搭建,通過MCP、API、SDK或CLI均可平滑接入現有Agent體系,無需重寫上層代碼。
第三類是看重數據隔離和合規能力的政企客戶。Cube沙箱支持完整私有化部署,數據不出企業邊界,滿足等保與合規要求。此外,Apache 2.0協議保障商業使用友好,代碼完全可審計,不依賴任何海外云服務商,為數據主權敏感場景提供可信的Agent執行環境。
結語:推理、執行、緩存逐漸拆開,Agent基礎設施競爭新階段
這次開源的意義在于,Agent系統的基礎設施正在從單一模型競爭,拆分為多個獨立層級。推理加速、執行環境、緩存系統開始分別演進,而不再是一個統一黑盒。
騰訊云后續計劃把Cube沙箱與推理加速和緩存系統結合,形成完整的Agent基礎設施組合。這種拆分意味著,不同廠商可以在不同層做優化,而不是全部圍繞模型能力競爭。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.