无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

戰勝Mythos 5,OpenAI安全專用GPT-5.5-Cyber完全體來了

0
分享至

機器之心編輯部


OpenAI 在網絡安全領域又往前推了一步。

今天,OpenAI 宣布擴展 Daybreak 安全計劃,推出更新版 GPT-5.5-Cyber、Codex Security 插件、Daybreak Cyber Partner Program,以及面向開源生態的 Patch the Planet 計劃等。

其中最受關注的,是 GPT-5.5-Cyber 完整版的發布。OpenAI 稱,更新后的 GPT-5.5-Cyber 在 CyberGym 上取得 85.6% 的成績,高于 GPT-5.5 的 81.8%。這一成績也超過了 Anthropic Mythos 5 的 83.8%。



OpenAI CEO 奧特曼表示,「OpenAI 希望與美國政府和安全生態合作,幫助所有企業提升安全性。GPT-5.5-Cyber 完整版現已發布,并在 CyberGym 上取得當前 SOTA 表現。」



OpenAI 總裁 Greg Brockman 寫到,「通過 OpenAI Daybreak,我們正在用新的工具和模型加速漏洞修補,而不只是加速漏洞發現。OpenAI 的模型現在已經能夠為主流瀏覽器、網絡基礎設施和操作系統中的關鍵漏洞發現并生成補丁,涉及 FreeBSD、Linux 內核等系統;同時也幫助 cURL、Go、Python、Sigstore 等項目推進漏洞修復。」



不過,網友們似乎并不買賬,大家更期待 OpenAI 發布的是 GPT-5.6。



此次的幾大更新包括如下:

  • GPT-5.5-Cyber:在最初僅開放預覽版之后,OpenAI 將通過持續的受限發布機制,向可信防守方推出 GPT-5.5-Cyber 的完整版本。該模型在 CyberGym 上取得了新的最佳表現,得分達到 85.6%,高于 GPT-5.5 的 81.8%。
  • Codex Security:OpenAI 將發布 Codex Security 插件更新,把其從內部使用和客戶使用模型過程中積累的經驗,整合成一套解決方案,用于加速現有系統中漏洞的發現與修復,并自動阻止新的漏洞進入生產環境。
  • Patch the Planet:這是 OpenAI 與 Trail of Bits 共同發起的項目,并與 HackerOne、Calif、研究人員和維護者合作,幫助被廣泛使用的開源項目從發現漏洞走向真正修復。
  • Daybreak Cyber Partner Program:OpenAI 將通過這一計劃,讓安全合作伙伴在自己的產品和服務中,以可信訪問方式使用其最強的模型,把這些能力擴展到更多組織。

更新 GPT-5.5-Cyber:能力與更開放的使用邊界并行

OpenAI 正在發布 GPT-5.5-Cyber 的更新版本。這是一個面向高級、授權網絡安全工作的模型,既更具能力,也更少出現不必要拒答。

GPT-5.5-Cyber 的最初預覽版,主要目標是減少專業工作流中的不必要拒絕。這次更新更進一步。它是 OpenAI 迄今在發現并幫助修補軟件漏洞方面最強的模型,同時保留了 GPT-5.5 的通用智能,以及處理長期、復雜任務的能力。

該模型可以在大型代碼庫中持續進行更深入分析:識別與安全相關的組件,追蹤存在漏洞的代碼是否可達,在受控環境中驗證可能的問題,開發并測試補丁,并為人工審查準備證據。目標是幫助防守方走完整個修復閉環,而不只是產生更多漏洞發現。

在 CyberGym 上,更新后的 GPT-5.5-Cyber 在單模型評估中達到 85.6%,高于 GPT-5.5 的 81.8%。CyberGym 衡量的是一個智能體能否在軟件環境中復現已知漏洞。這也是 OpenAI 測得的單模型最高 CyberGym 分數。



GPT-5.5-Cyber 在另外兩個要求很高的真實安全基準上也超過了 GPT-5.5。在 ExploitGym 上,GPT-5.5-Cyber 得分 39.5%,高于 GPT-5.5 的 25.95%。ExploitGym 測試的是智能體能否把已知漏洞轉化為可工作的漏洞利用,并實現未經授權的代碼執行。在 SEC-bench Pro 上,GPT-5.5-Cyber 得分 69.8%,高于 GPT-5.5 的 63.1%。SEC-bench Pro 評估的是復雜軟件目標上的長周期漏洞發現和概念驗證生成能力。



基準測試只是故事的一部分。真正重要的是,在實際場景中,模型能否發現真實漏洞,能否從噪聲中識別出可行動的問題,并幫助防守方安全地完成修復。隨著協調披露工作的結束,OpenAI 會繼續在復雜代碼庫和真實修復工作流中評估該模型的表現。

圍繞 OpenAI 的網絡安全方法,包括今天發布的內容,以及即將發布模型前的準備工作,OpenAI 一直與美國政府保持溝通。這包括繼續與 Center for AI Standards and Innovation,即 CAISI,在 GPT-5.5 和 GPT-5.5-Cyber 的部署前測試方面展開合作;也包括與 Office of the National Cyber Director,即 ONCD,以及 Office of Science and Technology Policy,即 OSTP,就近期行政令和相關行業標準的落地展開合作。

對大多數防守方來說,GPT-5.5 加 Trusted Access for Cyber,再配合 Codex Security,仍然是合適的起點。GPT-5.5-Cyber 面向的是經過驗證的防守方,他們的授權工作需要 OpenAI 最先進的網絡安全能力和更寬松的模型行為,同時也需要更強的驗證、監控、范圍控制和審查機制。在早期 Daybreak 工作中,GPT-5.5 和 Codex Security 已經幫助防守方在多個廣泛使用的系統中識別并驗證漏洞,包括 Firefox、V8、Safari、OpenBSD、FreeBSD 和 HTTP/2 實現。

用 Codex Security 把發現變成修復

自 3 月 Codex Security 云端版以研究預覽形式推出以來,它已經掃描了超過 3000 萬次提交,覆蓋 3 萬多個代碼庫;人工審查者已經手動將 7 萬多個發現標記為已修復,另有超過 50 萬個發現被自動判定為已修復。

這正是今天漏洞修補所需要達到的規模。



OpenAI 構建 Codex Security 時,基于一個簡單前提:通過直接集成到 Codex 中,把相當于一名安全工程師的能力放到每一位軟件開發者身邊。

Codex Security 不只是生成告警。它會理解團隊的代碼及其威脅模型;如果威脅模型不存在,它也可以生成一個;它會識別可能存在的漏洞,判斷受影響代碼是否可達,收集證據并提供驗證步驟,開發有針對性的補丁,并驗證修復結果。人類仍然掌控關鍵決策:調查哪些發現、應用哪些變更、分享哪些信息。

今天,OpenAI 正在發布 Codex Security 插件更新,使其支持開箱即用的防御型安全工作流。開發者可以運行深度掃描,也可以審查近期變更;可以生成包含嚴重程度、受影響代碼位置、驗證證據和修復建議的報告;可以追蹤攻擊路徑,構建威脅模型,驗證發現,并生成面向具體代碼庫的補丁供審查。



用戶可以設置掃描范圍,覆蓋整個代碼庫、代碼庫的一部分,或某個特定變更和提交。

該插件還可以對來自掃描器、安全公告、漏洞賞金報告或工單系統的既有發現進行分級和驗證,然后大規模自動生成補丁,幫助快速清理積壓漏洞。當 Codex Security 完成掃描后,它還可以導出到現有漏洞管理系統,或通過 SARIF 文件、CodeQL 查詢等方式接入其他工具。該插件讓這些能力更容易被使用,既可以配合 Codex CLI 支持自動化流水線,也可以集成進 Codex 應用中的開發者工作流。

Patch the Planet:讓開源修復真正落地

Patch the Planet 是一個幫助維護者從漏洞發現走向真正修復的項目。該項目由 OpenAI 與 Trail of Bits 共同發起,并與 HackerOne 和 Calif 合作。OpenAI 將資助專業安全研究人員,并為他們配備 Codex Security 和高級模型,讓他們直接與開源維護者合作。

開源軟件支撐著各行各業的產品、公共服務、開發者工具和關鍵基礎設施。一個被廣泛使用的網絡庫中的漏洞,可能影響數千個下游系統。然而,許多這類項目由規模很小的團隊維護,時間和資金都非常有限。Linux Foundation 和 Harvard 的研究發現,在其研究的廣泛使用項目中,94% 的項目由不到 10 名開發者負責一年內新增代碼的 90% 以上。

隨著 AI 讓更快發現和修補更多漏洞成為可能,它也給維護者帶來了更多工作。維護者需要從成千上萬份報告中篩選真正有價值的問題,其中很多報告質量很低,甚至是誤報。維護者不應該只得到更多報告,卻沒有更多能力去修復。因此,Patch the Planet 的核心是專家級人工安全審查。

每一次合作都會先從安全研究人員與受幫助維護者之間的溝通開始。維護者會定義自己的優先事項、偏好和既有披露流程。隨后,Patch the Planet 的安全研究人員會端到端管理相關工作,在漏洞和補丁提交給維護者之前,先完成驗證和去重,從而顯著降低維護者負擔,并加快修復速度。

參與項目的開源項目將獲得 ChatGPT Pro、Codex Security 的條件訪問權限,以及用于核心開發、維護者自動化和發布工作流的 API 額度。

首個為期五天、覆蓋多個項目的沖刺工作,已經發現了數百個待審查問題,合并了數十個補丁,并推動更多補丁繼續推進。同時,該項目還構建了可復用的模糊測試、變體分析、差分測試和基于規范的測試工作流。

發現漏洞很重要,但真正保護世界的,是讓修復落地。而這需要協作,也需要社區支持。

與安全生態合作

作為此次擴展的一部分,OpenAI 還將與領先的安全軟件和服務提供商共同推出 OpenAI Daybreak Cyber Partner Program。

通過該計劃,參與合作伙伴可以在其提供給客戶的安全產品和服務中,使用帶有 Trusted Access for Cyber 的 GPT-5.5。這是 OpenAI 面向大多數防御型網絡安全工作流的主力模型。這樣一來,客戶可以受益于模型的防御能力,提升軟件韌性,同時直接模型訪問仍然掌握在參與計劃的合作伙伴手中。



OpenAI 還將與該計劃的合作伙伴協作,繼續強化在安全生態中負責任部署這些能力所需的保障措施、監控機制和防濫用標準。OpenAI 將首先與一批初始合作伙伴推出該計劃,并計劃在未來幾個月繼續擴展到更多組織。

接下來

Daybreak 將模型、Codex Security、Patch the Planet、專家研究人員、維護者、安全合作伙伴、關鍵基礎設施運營方和可信訪問控制整合在一起,幫助人類防守方面對這一挑戰。

公共部門和私營部門組織都可以與 OpenAI Daybreak 合作,識別、驗證并修復它們構建和依賴的軟件中的漏洞。開發者和維護者可以在自己擁有的代碼上運行 Codex Security,審查發現,并推動修復落地。安全合作伙伴和從業者可以使用 OpenAI 的前沿模型,強化自己的防御工具,并把這些能力快速帶給更多組織。

目標是超越「用模型發現更多漏洞」這一階段,走向一個軟件更安全、網絡韌性更強的世界。

https://x.com/OpenAI/status/2069104283824640023

https://openai.com/index/daybreak-securing-the-world/

https://x.com/sama/status/2069121360744550796

https://x.com/gdb/status/2069112120206332130

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
我要求加薪被拒,老板說我不懂感恩,離職后,老板叫我回來

我要求加薪被拒,老板說我不懂感恩,離職后,老板叫我回來

人間百態大全
2026-06-23 06:40:03
登貝萊解鎖世界杯首球,姆巴佩的舉動引熱議!金球獎之爭懸念再起

登貝萊解鎖世界杯首球,姆巴佩的舉動引熱議!金球獎之爭懸念再起

球場沒跑道
2026-06-23 09:42:29
印度極端高溫絕非天災,正在醞釀一場中國必須嚴防的巨大危機!

印度極端高溫絕非天災,正在醞釀一場中國必須嚴防的巨大危機!

毛豆新鮮
2026-06-08 10:40:39
搞笑自行車冷笑話,北大某一同學買了一輛新的自行車為防被盜,每晚用五條鐵鏈將自行車鎖在柱子上一天早上!

搞笑自行車冷笑話,北大某一同學買了一輛新的自行車為防被盜,每晚用五條鐵鏈將自行車鎖在柱子上一天早上!

天天明星
2026-06-22 13:15:30
李想列10問“劇透”全新理想L8:增程的盡頭是什么?

李想列10問“劇透”全新理想L8:增程的盡頭是什么?

CNMO科技
2026-06-23 15:15:05
喊了幾十年節約用水,為何突然沒聲?原來中國水危機是這樣翻盤的

喊了幾十年節約用水,為何突然沒聲?原來中國水危機是這樣翻盤的

混沌錄
2026-06-21 21:39:13
芒特加練欲后撤接班胖虎!曼聯愿小虧賣烏加特,其恐已是第五替補

芒特加練欲后撤接班胖虎!曼聯愿小虧賣烏加特,其恐已是第五替補

羅米的曼聯博客
2026-06-23 12:02:00
越吃陽氣越足,建議中老年:夏至后常吃5樣,增強體質少生病

越吃陽氣越足,建議中老年:夏至后常吃5樣,增強體質少生病

愛生活的陶哥
2026-06-22 07:20:59
鬧大了!央視被冤枉了!日球迷:侮辱旭日旗等同嘲諷全日本

鬧大了!央視被冤枉了!日球迷:侮辱旭日旗等同嘲諷全日本

安海客
2026-06-23 11:14:14
南通小學生源斷崖下跌,看完心里五味雜陳

南通小學生源斷崖下跌,看完心里五味雜陳

南通樓市說說
2026-06-23 12:37:47
美國也沒想到,轉為中國籍僅6年,谷愛凌竟已成美國頭號勁敵

美國也沒想到,轉為中國籍僅6年,谷愛凌竟已成美國頭號勁敵

青煙小先生
2026-01-31 19:10:22
多股漲停!英偉達砸重金擴產磷化銦,光芯片核心賽道迎價值重估|點金回顧

多股漲停!英偉達砸重金擴產磷化銦,光芯片核心賽道迎價值重估|點金回顧

第一財經資訊
2026-06-23 08:10:53
森保一親口說出輪換計劃!戰瑞典最多換 8 人,這是要放棄比賽?

森保一親口說出輪換計劃!戰瑞典最多換 8 人,這是要放棄比賽?

體壇狗哥
2026-06-23 10:00:24
孫繼海:當年在英超防亨利最讓我咬牙切齒,他是很恐怖的存在

孫繼海:當年在英超防亨利最讓我咬牙切齒,他是很恐怖的存在

懂球帝
2026-06-23 11:06:19
如果一個縣,半數以上的干部都出身紀委,會有哪些影響?

如果一個縣,半數以上的干部都出身紀委,會有哪些影響?

職場資深秘書
2026-06-23 14:20:02
阿根廷提前晉級!梅西雙響,董路辣評:不派專人盯防梅西,不理解

阿根廷提前晉級!梅西雙響,董路辣評:不派專人盯防梅西,不理解

舟望停云
2026-06-23 08:45:20
印度高種姓為何盛產美女?看看她們被混血多少次就知道了

印度高種姓為何盛產美女?看看她們被混血多少次就知道了

老謝談史
2026-05-06 02:50:58
遼寧民營金融大案兩度開庭,疑因省政法委調查省部級干部問題引發

遼寧民營金融大案兩度開庭,疑因省政法委調查省部級干部問題引發

法治邊角料
2026-06-23 11:23:41
15倍光纖大牛股,兩連板

15倍光纖大牛股,兩連板

第一財經資訊
2026-06-23 11:56:10
家里有這些保健品趕緊停,央視已點名,全是造假貨,快扔掉

家里有這些保健品趕緊停,央視已點名,全是造假貨,快扔掉

醫學科普匯
2026-06-14 09:55:14
2026-06-23 15:56:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
13334文章數 142677關注度
往期回顧 全部

科技要聞

48名中國開發者聯名舉報蘋果

頭條要聞

飛機提前10分鐘起飛大學生起訴航司 海航承諾調整規則

頭條要聞

飛機提前10分鐘起飛大學生起訴航司 海航承諾調整規則

體育要聞

揚尼斯去了邁阿密:凱爾特人怎么辦?

娛樂要聞

內娛95后頂流格局發生潛移默化的變化

財經要聞

智譜萬億市值,國產Anthropic真來了?

汽車要聞

華為智駕ADS限時優惠月底結束 7月1日前下訂立省3000元

態度原創

本地
親子
手機
健康
公開課

本地新聞

吃一次廣東龍舟飯,才懂什么是豪華盛宴

親子要聞

生娃前沒聊完這5件事,小心產后抑郁!

手機要聞

直播續航超26小時,榮耀X80 Pro Max正式發布,硬核可靠

粽子還沒吃完?專家教你“清庫存”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版