網易首頁 > 網易號 > 正文申請入駐

戰勝Mythos 5，OpenAI安全專用GPT-5.5-Cyber完全體來了

2026-06-23 13:45:00　來源: 機器之心Pro

天津舉報

分享至

機器之心編輯部

OpenAI 在網絡安全領域又往前推了一步。

今天，OpenAI 宣布擴展 Daybreak 安全計劃，推出更新版 GPT-5.5-Cyber、Codex Security 插件、Daybreak Cyber Partner Program，以及面向開源生態的 Patch the Planet 計劃等。

其中最受關注的，是 GPT-5.5-Cyber 完整版的發布。OpenAI 稱，更新后的 GPT-5.5-Cyber 在 CyberGym 上取得 85.6% 的成績，高于 GPT-5.5 的 81.8%。這一成績也超過了 Anthropic Mythos 5 的 83.8%。

OpenAI CEO 奧特曼表示，「OpenAI 希望與美國政府和安全生態合作，幫助所有企業提升安全性。GPT-5.5-Cyber 完整版現已發布，并在 CyberGym 上取得當前 SOTA 表現。」

OpenAI 總裁 Greg Brockman 寫到，「通過 OpenAI Daybreak，我們正在用新的工具和模型加速漏洞修補，而不只是加速漏洞發現。OpenAI 的模型現在已經能夠為主流瀏覽器、網絡基礎設施和操作系統中的關鍵漏洞發現并生成補丁，涉及 FreeBSD、Linux 內核等系統；同時也幫助 cURL、Go、Python、Sigstore 等項目推進漏洞修復。」

不過，網友們似乎并不買賬，大家更期待 OpenAI 發布的是 GPT-5.6。

此次的幾大更新包括如下：

GPT-5.5-Cyber：在最初僅開放預覽版之后，OpenAI 將通過持續的受限發布機制，向可信防守方推出 GPT-5.5-Cyber 的完整版本。該模型在 CyberGym 上取得了新的最佳表現，得分達到 85.6%，高于 GPT-5.5 的 81.8%。
Codex Security：OpenAI 將發布 Codex Security 插件更新，把其從內部使用和客戶使用模型過程中積累的經驗，整合成一套解決方案，用于加速現有系統中漏洞的發現與修復，并自動阻止新的漏洞進入生產環境。
Patch the Planet：這是 OpenAI 與 Trail of Bits 共同發起的項目，并與 HackerOne、Calif、研究人員和維護者合作，幫助被廣泛使用的開源項目從發現漏洞走向真正修復。
Daybreak Cyber Partner Program：OpenAI 將通過這一計劃，讓安全合作伙伴在自己的產品和服務中，以可信訪問方式使用其最強的模型，把這些能力擴展到更多組織。

更新 GPT-5.5-Cyber：能力與更開放的使用邊界并行

OpenAI 正在發布 GPT-5.5-Cyber 的更新版本。這是一個面向高級、授權網絡安全工作的模型，既更具能力，也更少出現不必要拒答。

GPT-5.5-Cyber 的最初預覽版，主要目標是減少專業工作流中的不必要拒絕。這次更新更進一步。它是 OpenAI 迄今在發現并幫助修補軟件漏洞方面最強的模型，同時保留了 GPT-5.5 的通用智能，以及處理長期、復雜任務的能力。

該模型可以在大型代碼庫中持續進行更深入分析：識別與安全相關的組件，追蹤存在漏洞的代碼是否可達，在受控環境中驗證可能的問題，開發并測試補丁，并為人工審查準備證據。目標是幫助防守方走完整個修復閉環，而不只是產生更多漏洞發現。

在 CyberGym 上，更新后的 GPT-5.5-Cyber 在單模型評估中達到 85.6%，高于 GPT-5.5 的 81.8%。CyberGym 衡量的是一個智能體能否在軟件環境中復現已知漏洞。這也是 OpenAI 測得的單模型最高 CyberGym 分數。

GPT-5.5-Cyber 在另外兩個要求很高的真實安全基準上也超過了 GPT-5.5。在 ExploitGym 上，GPT-5.5-Cyber 得分 39.5%，高于 GPT-5.5 的 25.95%。ExploitGym 測試的是智能體能否把已知漏洞轉化為可工作的漏洞利用，并實現未經授權的代碼執行。在 SEC-bench Pro 上，GPT-5.5-Cyber 得分 69.8%，高于 GPT-5.5 的 63.1%。SEC-bench Pro 評估的是復雜軟件目標上的長周期漏洞發現和概念驗證生成能力。

基準測試只是故事的一部分。真正重要的是，在實際場景中，模型能否發現真實漏洞，能否從噪聲中識別出可行動的問題，并幫助防守方安全地完成修復。隨著協調披露工作的結束，OpenAI 會繼續在復雜代碼庫和真實修復工作流中評估該模型的表現。

圍繞 OpenAI 的網絡安全方法，包括今天發布的內容，以及即將發布模型前的準備工作，OpenAI 一直與美國政府保持溝通。這包括繼續與 Center for AI Standards and Innovation，即 CAISI，在 GPT-5.5 和 GPT-5.5-Cyber 的部署前測試方面展開合作；也包括與 Office of the National Cyber Director，即 ONCD，以及 Office of Science and Technology Policy，即 OSTP，就近期行政令和相關行業標準的落地展開合作。

對大多數防守方來說，GPT-5.5 加 Trusted Access for Cyber，再配合 Codex Security，仍然是合適的起點。GPT-5.5-Cyber 面向的是經過驗證的防守方，他們的授權工作需要 OpenAI 最先進的網絡安全能力和更寬松的模型行為，同時也需要更強的驗證、監控、范圍控制和審查機制。在早期 Daybreak 工作中，GPT-5.5 和 Codex Security 已經幫助防守方在多個廣泛使用的系統中識別并驗證漏洞，包括 Firefox、V8、Safari、OpenBSD、FreeBSD 和 HTTP/2 實現。

用 Codex Security 把發現變成修復

自 3 月 Codex Security 云端版以研究預覽形式推出以來，它已經掃描了超過 3000 萬次提交，覆蓋 3 萬多個代碼庫；人工審查者已經手動將 7 萬多個發現標記為已修復，另有超過 50 萬個發現被自動判定為已修復。

這正是今天漏洞修補所需要達到的規模。

OpenAI 構建 Codex Security 時，基于一個簡單前提：通過直接集成到 Codex 中，把相當于一名安全工程師的能力放到每一位軟件開發者身邊。

Codex Security 不只是生成告警。它會理解團隊的代碼及其威脅模型；如果威脅模型不存在，它也可以生成一個；它會識別可能存在的漏洞，判斷受影響代碼是否可達，收集證據并提供驗證步驟，開發有針對性的補丁，并驗證修復結果。人類仍然掌控關鍵決策：調查哪些發現、應用哪些變更、分享哪些信息。

今天，OpenAI 正在發布 Codex Security 插件更新，使其支持開箱即用的防御型安全工作流。開發者可以運行深度掃描，也可以審查近期變更；可以生成包含嚴重程度、受影響代碼位置、驗證證據和修復建議的報告；可以追蹤攻擊路徑，構建威脅模型，驗證發現，并生成面向具體代碼庫的補丁供審查。

用戶可以設置掃描范圍，覆蓋整個代碼庫、代碼庫的一部分，或某個特定變更和提交。

該插件還可以對來自掃描器、安全公告、漏洞賞金報告或工單系統的既有發現進行分級和驗證，然后大規模自動生成補丁，幫助快速清理積壓漏洞。當 Codex Security 完成掃描后，它還可以導出到現有漏洞管理系統，或通過 SARIF 文件、CodeQL 查詢等方式接入其他工具。該插件讓這些能力更容易被使用，既可以配合 Codex CLI 支持自動化流水線，也可以集成進 Codex 應用中的開發者工作流。

Patch the Planet：讓開源修復真正落地

Patch the Planet 是一個幫助維護者從漏洞發現走向真正修復的項目。該項目由 OpenAI 與 Trail of Bits 共同發起，并與 HackerOne 和 Calif 合作。OpenAI 將資助專業安全研究人員，并為他們配備 Codex Security 和高級模型，讓他們直接與開源維護者合作。

開源軟件支撐著各行各業的產品、公共服務、開發者工具和關鍵基礎設施。一個被廣泛使用的網絡庫中的漏洞，可能影響數千個下游系統。然而，許多這類項目由規模很小的團隊維護，時間和資金都非常有限。Linux Foundation 和 Harvard 的研究發現，在其研究的廣泛使用項目中，94% 的項目由不到 10 名開發者負責一年內新增代碼的 90% 以上。

隨著 AI 讓更快發現和修補更多漏洞成為可能，它也給維護者帶來了更多工作。維護者需要從成千上萬份報告中篩選真正有價值的問題，其中很多報告質量很低，甚至是誤報。維護者不應該只得到更多報告，卻沒有更多能力去修復。因此，Patch the Planet 的核心是專家級人工安全審查。

每一次合作都會先從安全研究人員與受幫助維護者之間的溝通開始。維護者會定義自己的優先事項、偏好和既有披露流程。隨后，Patch the Planet 的安全研究人員會端到端管理相關工作，在漏洞和補丁提交給維護者之前，先完成驗證和去重，從而顯著降低維護者負擔，并加快修復速度。

參與項目的開源項目將獲得 ChatGPT Pro、Codex Security 的條件訪問權限，以及用于核心開發、維護者自動化和發布工作流的 API 額度。

首個為期五天、覆蓋多個項目的沖刺工作，已經發現了數百個待審查問題，合并了數十個補丁，并推動更多補丁繼續推進。同時，該項目還構建了可復用的模糊測試、變體分析、差分測試和基于規范的測試工作流。

發現漏洞很重要，但真正保護世界的，是讓修復落地。而這需要協作，也需要社區支持。

與安全生態合作

作為此次擴展的一部分，OpenAI 還將與領先的安全軟件和服務提供商共同推出 OpenAI Daybreak Cyber Partner Program。

通過該計劃，參與合作伙伴可以在其提供給客戶的安全產品和服務中，使用帶有 Trusted Access for Cyber 的 GPT-5.5。這是 OpenAI 面向大多數防御型網絡安全工作流的主力模型。這樣一來，客戶可以受益于模型的防御能力，提升軟件韌性，同時直接模型訪問仍然掌握在參與計劃的合作伙伴手中。

OpenAI 還將與該計劃的合作伙伴協作，繼續強化在安全生態中負責任部署這些能力所需的保障措施、監控機制和防濫用標準。OpenAI 將首先與一批初始合作伙伴推出該計劃，并計劃在未來幾個月繼續擴展到更多組織。

接下來

Daybreak 將模型、Codex Security、Patch the Planet、專家研究人員、維護者、安全合作伙伴、關鍵基礎設施運營方和可信訪問控制整合在一起，幫助人類防守方面對這一挑戰。

公共部門和私營部門組織都可以與 OpenAI Daybreak 合作，識別、驗證并修復它們構建和依賴的軟件中的漏洞。開發者和維護者可以在自己擁有的代碼上運行 Codex Security，審查發現，并推動修復落地。安全合作伙伴和從業者可以使用 OpenAI 的前沿模型，強化自己的防御工具，并把這些能力快速帶給更多組織。

目標是超越「用模型發現更多漏洞」這一階段，走向一個軟件更安全、網絡韌性更強的世界。

https://x.com/OpenAI/status/2069104283824640023

https://openai.com/index/daybreak-securing-the-world/

https://x.com/sama/status/2069121360744550796

https://x.com/gdb/status/2069112120206332130

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.