亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英國政府AI安全評估:Mythos AI網(wǎng)絡(luò)攻擊能力究竟幾何?

0
分享至


上周,Anthropic宣布將其Mythos Preview模型的初始發(fā)布限定在"少數(shù)關(guān)鍵行業(yè)合作伙伴"范圍內(nèi),理由是該模型"在計算機安全任務(wù)上的表現(xiàn)極為突出"。如今,英國政府旗下的AI安全研究所(AISI)發(fā)布了一份針對該模型網(wǎng)絡(luò)攻擊能力的初步評估報告,為Anthropic的說法提供了獨立的公開驗證。

AISI的研究結(jié)果顯示,在單項網(wǎng)絡(luò)安全相關(guān)任務(wù)的測試中,Mythos與近期其他前沿模型相比并無顯著差異。然而,Mythos的獨特之處在于,它能夠有效地將多個任務(wù)串聯(lián)成多步驟攻擊鏈,而這正是全面滲透某些系統(tǒng)所必需的能力。

"最后關(guān)卡"終告攻克

AISI自2023年初便開始對各類AI模型進行專門設(shè)計的奪旗(CTF)挑戰(zhàn)測試。彼時,GPT-3.5 Turbo連難度較低的"學(xué)徒級"任務(wù)都難以完成。此后,歷代模型的表現(xiàn)持續(xù)提升,直至Mythos Preview在這些學(xué)徒級CTF任務(wù)中的完成率突破85%。

盡管這在技術(shù)層面刷新了AISI CTF測試的最高紀(jì)錄,但近期的競爭模型——如GPT-5.4、Anthropic自家的Opus 4.6以及Codex 5.3——在近幾個月的多個CTF難度等級測試中均表現(xiàn)相近,精度差距僅在5%至10%之間。這一改進幅度,似乎還不足以構(gòu)成Anthropic對Mythos Preview實施限量發(fā)布的充分理由。

然而,在模擬實戰(zhàn)場景中,Mythos展現(xiàn)出了更為突出的相對優(yōu)勢。在AISI專門搭建的"最后關(guān)卡"(TLO)測試中,該場景模擬了一次針對企業(yè)網(wǎng)絡(luò)、多達32個步驟的數(shù)據(jù)竊取攻擊。這一測試要求模型"跨越多個主機和網(wǎng)段,將數(shù)十個步驟串聯(lián)執(zhí)行",AISI估計,完成整個流程需要經(jīng)過專業(yè)訓(xùn)練的人員耗費約20小時。

在這一測試中,Mythos的表現(xiàn)遠(yuǎn)超所有此前模型,成為"首個從頭到尾完整解決TLO挑戰(zhàn)的模型"。盡管Anthropic的新模型在10次嘗試中僅成功3次,但即便是Mythos Preview的平均表現(xiàn),也完成了32個滲透步驟中的22個,遠(yuǎn)高于Claude 4.6所達到的16步平均水平。

Mythos Preview目前仍存在一定局限。AISI指出,該模型在名為"冷卻塔"的更高難度測試中依然表現(xiàn)吃力——這是一個共七步的測試,旨在模擬對發(fā)電廠控制軟件的攻擊破壞。不過,AISI也表示,若將測試中設(shè)定的1億Token計算預(yù)算進一步提升,預(yù)計"模型的評估表現(xiàn)將隨之持續(xù)改善"。

小型弱防御系統(tǒng)面臨潛在威脅

綜合來看,Mythos在TLO測試中的表現(xiàn)表明,該模型"至少具備在已獲得網(wǎng)絡(luò)訪問權(quán)限的前提下,自主攻擊規(guī)模較小、防御薄弱且存在漏洞的企業(yè)系統(tǒng)的能力",AISI如此評估。盡管如此,AISI也提醒,其模擬網(wǎng)絡(luò)環(huán)境缺乏真實關(guān)鍵系統(tǒng)中通常配備的主動防御機制和防御工具。此外,TLO測試場景中預(yù)設(shè)了特定漏洞,這些漏洞在真實環(huán)境中未必存在;測試也不會對模型觸發(fā)檢測警報的行為進行懲罰,而在真實滲透場景中,一旦暴露便意味著行動失敗。

正因如此,AISI表示尚無法確定Mythos Preview能否突破"防御完備的系統(tǒng)"。但隨著未來模型的能力不斷追平甚至超越Mythos,AISI警告稱,系統(tǒng)安全的設(shè)計者同樣應(yīng)當(dāng)借助AI模型來強化自身防御體系。

Q&A

Q1:AISI對Mythos Preview的評估結(jié)論是什么?

A:AISI的評估顯示,Mythos Preview在單項網(wǎng)絡(luò)安全任務(wù)上與其他主流前沿模型表現(xiàn)相近,差距在5%至10%之間。但在模擬32步企業(yè)網(wǎng)絡(luò)滲透攻擊的"最后關(guān)卡"(TLO)測試中,Mythos成為首個完整通關(guān)的模型,平均可完成22個步驟,顯著優(yōu)于前代模型。整體而言,AISI認(rèn)為該模型具備自主攻擊小型、弱防御企業(yè)系統(tǒng)的能力。

Q2:Mythos Preview為什么只向少數(shù)合作伙伴開放?

A:Anthropic認(rèn)為Mythos Preview在計算機安全任務(wù)上表現(xiàn)"極為突出",因此將其初始發(fā)布限定于少數(shù)關(guān)鍵行業(yè)合作伙伴,給相關(guān)方留出時間做好準(zhǔn)備。但從AISI的獨立評估來看,Mythos在多數(shù)單項測試中與競爭模型差距不大,限量發(fā)布的必要性存在一定爭議。

Q3:Mythos Preview對現(xiàn)實中的網(wǎng)絡(luò)安全有多大威脅?

A:AISI指出,Mythos能夠在已獲得網(wǎng)絡(luò)訪問權(quán)限的情況下,自主攻擊防御薄弱的小型企業(yè)系統(tǒng)。但由于測試環(huán)境缺乏真實的主動防御機制,AISI無法確認(rèn)其能否突破防御完備的系統(tǒng)。AISI建議,系統(tǒng)安全設(shè)計者應(yīng)同步引入AI模型來強化防御能力,以應(yīng)對未來更強大模型帶來的潛在威脅。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
格里芬調(diào)侃快船被淘汰:泰倫-盧現(xiàn)在有時間和保羅見面了

格里芬調(diào)侃快船被淘汰:泰倫-盧現(xiàn)在有時間和保羅見面了

懂球帝
2026-04-17 11:57:33
蘇林搭火車回國,臨走前向中國借飛機,越南出大事,燒毀2節(jié)列車

蘇林搭火車回國,臨走前向中國借飛機,越南出大事,燒毀2節(jié)列車

愛下廚的阿釃
2026-04-17 21:40:02
他曾是江蘇省副省長,連任了兩屆中央委員,1980年卻主動辭去職務(wù)

他曾是江蘇省副省長,連任了兩屆中央委員,1980年卻主動辭去職務(wù)

歷史的煙火
2026-04-17 15:08:08
第一次和男友同居:我直接震驚.原來男女私下這么可愛到犯規(guī)

第一次和男友同居:我直接震驚.原來男女私下這么可愛到犯規(guī)

藝鑒在線
2026-04-17 13:57:55
成都“牽手門”事件女主現(xiàn)今狀況曝光,太慘了......

成都“牽手門”事件女主現(xiàn)今狀況曝光,太慘了......

許三歲
2026-03-17 07:34:05
藍(lán)營定調(diào)!鄭麗文正面回應(yīng)參選,盧秀燕釋分歧,雙強攜手

藍(lán)營定調(diào)!鄭麗文正面回應(yīng)參選,盧秀燕釋分歧,雙強攜手

大統(tǒng)一
2026-04-16 20:22:10
騰訊新總部“企鵝島”04地塊西區(qū),比效果圖還震撼!

騰訊新總部“企鵝島”04地塊西區(qū),比效果圖還震撼!

GA環(huán)球建筑
2026-04-17 23:31:43
9換1!史詩級交易!正式完成!

9換1!史詩級交易!正式完成!

志輝說史
2026-04-18 00:33:50
牌面!趙心童占據(jù)克魯斯堡海報C位 英媒潑冷水:墨菲會送他回家

牌面!趙心童占據(jù)克魯斯堡海報C位 英媒潑冷水:墨菲會送他回家

風(fēng)過鄉(xiāng)
2026-04-17 09:28:22
伊朗警告美:若繼續(xù)封鎖伊朗港口,將阻斷紅海貿(mào)易

伊朗警告美:若繼續(xù)封鎖伊朗港口,將阻斷紅海貿(mào)易

參考消息
2026-04-16 13:58:05
52歲大媽再嫁67歲大爺,阿姨:他太不要臉了,大爺:是她自愿的

52歲大媽再嫁67歲大爺,阿姨:他太不要臉了,大爺:是她自愿的

熱心柚子姐姐
2026-04-16 16:43:24
詹妮弗?洛佩茲洛杉磯出街 風(fēng)衣造型颯爽又貴氣

詹妮弗?洛佩茲洛杉磯出街 風(fēng)衣造型颯爽又貴氣

述家娛記
2026-04-17 10:11:16
2年和領(lǐng)導(dǎo)開房410次!從臨時工“睡”成處長,南航女經(jīng)理升遷之路

2年和領(lǐng)導(dǎo)開房410次!從臨時工“睡”成處長,南航女經(jīng)理升遷之路

就一點
2026-03-28 17:42:50
600703,最新宣布:終止收購!

600703,最新宣布:終止收購!

證券時報e公司
2026-04-17 19:24:44
二手CD播放器漲到天價!閑魚賣5999元,比當(dāng)年全新還貴

二手CD播放器漲到天價!閑魚賣5999元,比當(dāng)年全新還貴

金科技觀察家
2026-04-06 18:03:53
我今年55了,想用血淚教訓(xùn)告訴你:不要跟任何人,包括你的父母、子女、枕邊人,分享這4件事

我今年55了,想用血淚教訓(xùn)告訴你:不要跟任何人,包括你的父母、子女、枕邊人,分享這4件事

東林夕亭
2026-03-27 09:07:57
國際油價暴跌

國際油價暴跌

閃電新聞
2026-04-18 00:28:01
男人追女人,就是為了睡她

男人追女人,就是為了睡她

加油丁小文
2026-04-09 11:00:11
耗資2.6億!曾經(jīng)全球最大“天眼”,如今卻像個“廢棄垃圾場”?

耗資2.6億!曾經(jīng)全球最大“天眼”,如今卻像個“廢棄垃圾場”?

一姐說軍史
2026-04-03 13:28:53
一周多達8次,36歲男子不幸猝死,妻子:多次勸說,他就是不聽

一周多達8次,36歲男子不幸猝死,妻子:多次勸說,他就是不聽

荊醫(yī)生科普
2026-04-17 15:36:26
2026-04-18 04:24:49
至頂頭條 incentive-icons
至頂頭條
記錄和推動數(shù)字化創(chuàng)新
17750文章數(shù) 49699關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺被罰沒35.97億元

頭條要聞

知情人:伊朗為霍爾木茲海峽通行設(shè)定三個條件

頭條要聞

知情人:伊朗為霍爾木茲海峽通行設(shè)定三個條件

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

又快又穩(wěn)的開掛動力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

旅游
家居
本地
游戲
公開課

旅游要聞

三月三登泰山!蟠桃會+古風(fēng)巡游驚艷出圈

家居要聞

法式線條 時光靜淌

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

PS5完全獨占新作曝光!科樂美為索尼傾力打造

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版