无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

打破“神話”壟斷?英國研究證實GPT-5.5在網絡安全領域展現頂尖實力

0
分享至

由于不可抗力的限流導致無法接收推送文章的問題,我們迫切需要以下操作:

點擊標題下方藍字 “一半杯 ” → 點擊右上角“...” → 點選“設為星標★”,這樣就更容易找到我們和收到推送文章

保持愛讀文章,保持領先


人工智能領域的網絡安全競賽正進入白熱化階段。上個月,人工智能企業Anthropic對其名為Mythos Preview(預覽版)的大語言模型進行了高調宣傳,聲稱該模型在網絡安全方面構成了巨大的威脅,并以此為由決定將其初始版本僅限“關鍵行業合作伙伴”使用。然而,這一“神話”的獨特性似乎已被打破。根據英國人工智能安全研究所(AISI)發布的最新研究結果表明,OpenAI于上周公開發布的GPT-5.5模型在網絡安全評估中,已經達到了與Mythos Preview相似的性能水平。

評估數據曝光:GPT-5.5在極高難度挑戰中表現搶眼

自2023年以來,英國人工智能安全研究所(AISI)一直致力于通過95項不同的“奪旗賽”挑戰來測試各類前沿AI模型的網絡安全能力。這些復雜的測試涵蓋了逆向工程、網絡漏洞利用以及密碼學等多個關鍵的專業領域。

在最高級別的“專家(Expert)”難度任務中,測試數據揭示了令人矚目的結果:新近推出的GPT-5.5平均通過率達到了71.4%,這一成績甚至略高于Anthropic公司Mythos Preview模型所取得的68.6%的平均通過率(盡管研究人員指出該差距仍在誤差范圍之內)。

在其中一項極其困難的特定任務中,AI需要構建一個反匯編程序來解碼一段Rust二進制代碼。AISI的研究報告特別指出,GPT-5.5在沒有任何人類協助的情況下,僅耗時10分鐘零22秒就成功解決了這項挑戰,并且在此過程中產生的API調用成本僅為微乎其微的1.73美元。這一驚人的效率和低廉的成本充分展示了其在自動化代碼解析和逆向工程方面的深厚實力。

深度滲透與破壞測試:突破防線與尚存的技術瓶頸

除了基礎的任務外,模型們還接受了更為復雜和貼近實戰的模擬攻擊測試。在一個名為“The Last Ones (TLO)”的AISI測試靶場中,研究人員設置了一個針對企業網絡的32步數據提取攻擊模擬。在以往的測試中,沒有任何一個早期的AI模型能夠成功完成過哪怕一次這樣的測試。

然而,在此次較量中,GPT-5.5在10次嘗試中成功了3次,不僅打破了以往零成功的記錄,還與Mythos Preview的表現(10次嘗試中成功2次)旗鼓相當,甚至略勝一籌。

盡管如此,這并不意味著這些頂級AI已經可以在網絡世界中為所欲為。在AISI設計的難度更高的“冷卻塔”模擬測試中——該測試旨在模擬對發電廠控制軟件的破壞企圖——GPT-5.5同樣未能成功實施破壞,這也是此前所有接受測試的AI模型共同面臨的技術瓶頸。

業界觀察:這是“特定模型突破”還是“行業整體進化”?

面對GPT-5.5交出的這份亮眼答卷,AISI在報告中給出了他們的專業洞察。研究人員指出,這些新的結果表明,在網絡安全風險方面,Mythos Preview之前展現出的強大能力可能并非是“特定于某一個模型的突破”。相反,這反映出前沿AI技術在“長期自主性、推理能力和編程能力方面普遍提升的副產品”。這說明整個大模型行業的基礎能力正在全面進化。

恐懼營銷”惹爭議:OpenAI CEO薩姆·奧特曼的犀利回應

伴隨著模型能力的躍升,業界對于“模型過于危險而不能公開發布”的討論也日益激烈。OpenAI首席執行官薩姆·奧特曼(Sam Altman)在最近接受《Core Memory》播客采訪時,對這種現象表達了明確的看法。他嚴厲批評了某些公司在推廣有限發布的AI模型時所采用的“基于恐懼的營銷”策略。

奧特曼在采訪中坦言,他“確信Mythos在網絡安全方面是一個偉大的模型”,但他一針見血地指出:“說‘我們制造了一顆炸彈。我們打算把它扔到你的頭上。然后我們將以1億美元的價格賣給你一個防空洞’,這顯然是令人難以置信的營銷手段。”

奧特曼進一步預測,“未來將會有更多關于模型過于危險而不能發布的言論出現。”但他同時也承認了客觀存在的行業風險,表示“確實也會有一些非常危險的模型,必須以不同的方式進行發布。”

受限發布的未來:OpenAI的“網絡防御者”專屬模型計劃

事實上,雖然批評了同行的營銷話術,OpenAI自身也在積極推進針對高風險網絡安全模型的受控制發布機制。今年2月,OpenAI推出了“網絡可信訪問”試點計劃。該機制允許安全研究人員和企業驗證其身份,并注冊他們研究OpenAI前沿模型以進行“合法的防御性工作”的意向。

利用這份可信訪問名單,OpenAI在上個月嚴格控制了GPT-5.4-Cyber模型的有限發布。據OpenAI官方介紹,這是一個專為增強網絡能力而有意進行微調的模型變體,并且減少了部分能力限制。

這一安全防御戰略正在進一步延續。本周四,OpenAI首席執行官薩姆·奧特曼在社交媒體上正式宣布,GPT-5.5-Cyber的初始版本也將采取類似的受限發布策略,在接下來的幾天內“僅限于關鍵的網絡防御者”使用。

這場關于AI與網絡安全的博弈,顯然才剛剛拉開序幕。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
今日!讓路世界杯,CCTV5+直播NBA尼克斯PK馬刺 文班亞馬背水一戰

今日!讓路世界杯,CCTV5+直播NBA尼克斯PK馬刺 文班亞馬背水一戰

晚池
2026-06-14 02:09:01
都罵董潔看走眼,但沒人知道,王大治除了外貌低配,其他全是頂配

都罵董潔看走眼,但沒人知道,王大治除了外貌低配,其他全是頂配

山谷里的怒吼
2026-06-12 13:22:54
布倫森16+2!尼克斯37-42馬刺,看數據:你就是頭號罪人!

布倫森16+2!尼克斯37-42馬刺,看數據:你就是頭號罪人!

運籌帷幄的籃球
2026-06-14 09:57:16
4400萬輛車在“蹭路”?央媒連發三炮,電車養路費這回真要來了

4400萬輛車在“蹭路”?央媒連發三炮,電車養路費這回真要來了

混沌錄
2026-06-11 21:00:07
網友曬出清北鵝腿群聊天記錄,一群學生刷:姨姨,腿腿,餓餓

網友曬出清北鵝腿群聊天記錄,一群學生刷:姨姨,腿腿,餓餓

映射生活的身影
2026-06-13 18:24:17
他來了!NBA官方公布總決賽G5裁判:福斯特回歸擔任主裁判

他來了!NBA官方公布總決賽G5裁判:福斯特回歸擔任主裁判

懂球帝
2026-06-13 22:33:07
范喬丹清空火箭動態!謝潑德+小賈陷交易流言 休城一號位要真空?

范喬丹清空火箭動態!謝潑德+小賈陷交易流言 休城一號位要真空?

顏小白的籃球夢
2026-06-14 09:46:36
外媒:FIFA要求埃及隊調整球衣設計,取消象征7次非洲冠軍的星標

外媒:FIFA要求埃及隊調整球衣設計,取消象征7次非洲冠軍的星標

懂球帝
2026-06-13 13:54:05
扳平比分,維尼修斯當選巴西vs摩洛哥全場最佳球員

扳平比分,維尼修斯當選巴西vs摩洛哥全場最佳球員

懂球帝
2026-06-14 08:52:02
“別選計算機!”211女生哭訴,引來前輩勸退:我從1.4w混成了7k

“別選計算機!”211女生哭訴,引來前輩勸退:我從1.4w混成了7k

妍妍教育日記
2026-06-13 09:35:06
SpaceX上市馬斯克成首位萬億富豪,中國卻用長征五號每次只打10顆衛星:太空競賽的真正差距

SpaceX上市馬斯克成首位萬億富豪,中國卻用長征五號每次只打10顆衛星:太空競賽的真正差距

商道童言
2026-06-13 20:05:25
NBA總決賽戰報:福克斯一級惡犯!馬刺16分優勢變3分,卡斯爾7中0

NBA總決賽戰報:福克斯一級惡犯!馬刺16分優勢變3分,卡斯爾7中0

球場沒跑道
2026-06-14 10:01:38
曇花六現!張雪機車奪賽季第6冠 德比斯最后一圈反超+逆轉絕殺

曇花六現!張雪機車奪賽季第6冠 德比斯最后一圈反超+逆轉絕殺

念洲
2026-06-13 20:33:46
大膽做愛,利國利民利自己!千萬別憋著!

大膽做愛,利國利民利自己!千萬別憋著!

喬志峰
2026-06-13 11:58:07
頭一回,我被工信部的新車干沉默了。

頭一回,我被工信部的新車干沉默了。

差評XPIN
2026-06-14 00:05:30
歷史首隊!馬刺5場總決賽首節全領先10+ 限制尼克斯22中4創新低

歷史首隊!馬刺5場總決賽首節全領先10+ 限制尼克斯22中4創新低

醉臥浮生
2026-06-14 09:15:57
總決賽G5:馬刺主場強壓尼克斯 文班哈珀發揮出色,福克斯拖后腿

總決賽G5:馬刺主場強壓尼克斯 文班哈珀發揮出色,福克斯拖后腿

南海浪花
2026-06-14 09:49:55
1571天,俄烏沖突悄然變局

1571天,俄烏沖突悄然變局

上觀新聞
2026-06-14 06:16:29
日媒:韓國決定申請加入CPTPP

日媒:韓國決定申請加入CPTPP

參考消息
2026-06-13 12:18:28
“寶媽”回鄉考編排名第一,沒等來入職通知卻被別人遞補,多次維權后崗位直接取消;相關部門立案調查

“寶媽”回鄉考編排名第一,沒等來入職通知卻被別人遞補,多次維權后崗位直接取消;相關部門立案調查

大風新聞
2026-06-13 18:34:21
2026-06-14 10:24:49
一半杯 incentive-icons
一半杯
分享有趣兼具價值的文章,嚴謹思辨的文字。
498文章數 152關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

牛彈琴:一不小心美國又創造歷史 英格蘭隊被"一鍋端"

頭條要聞

牛彈琴:一不小心美國又創造歷史 英格蘭隊被"一鍋端"

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

教育
健康
旅游
數碼
公開課

教育要聞

在方框里填上六個連續的自然數,使得等式成立

老人、小孩、孕婦,吃粽子有啥風險

旅游要聞

探秘西班牙旅游科技之旅;酒店業大內卷誰該負責 | 一周視頻速遞

數碼要聞

藍粉動漫風!映眾推出RTX 5070櫻花限定版:隱藏供電+磁吸背板

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版