英國政府AI安全評估：Mythos AI網(wǎng)絡(luò)攻擊能力究竟幾何？

2026-04-15 22:48:05　來源: 至頂頭條

北京舉報

分享至

上周，Anthropic宣布將其Mythos Preview模型的初始發(fā)布限定在"少數(shù)關(guān)鍵行業(yè)合作伙伴"范圍內(nèi)，理由是該模型"在計算機安全任務(wù)上的表現(xiàn)極為突出"。如今，英國政府旗下的AI安全研究所（AISI）發(fā)布了一份針對該模型網(wǎng)絡(luò)攻擊能力的初步評估報告，為Anthropic的說法提供了獨立的公開驗證。

AISI的研究結(jié)果顯示，在單項網(wǎng)絡(luò)安全相關(guān)任務(wù)的測試中，Mythos與近期其他前沿模型相比并無顯著差異。然而，Mythos的獨特之處在于，它能夠有效地將多個任務(wù)串聯(lián)成多步驟攻擊鏈，而這正是全面滲透某些系統(tǒng)所必需的能力。

"最后關(guān)卡"終告攻克

AISI自2023年初便開始對各類AI模型進行專門設(shè)計的奪旗（CTF）挑戰(zhàn)測試。彼時，GPT-3.5 Turbo連難度較低的"學(xué)徒級"任務(wù)都難以完成。此后，歷代模型的表現(xiàn)持續(xù)提升，直至Mythos Preview在這些學(xué)徒級CTF任務(wù)中的完成率突破85%。

盡管這在技術(shù)層面刷新了AISI CTF測試的最高紀(jì)錄，但近期的競爭模型——如GPT-5.4、Anthropic自家的Opus 4.6以及Codex 5.3——在近幾個月的多個CTF難度等級測試中均表現(xiàn)相近，精度差距僅在5%至10%之間。這一改進幅度，似乎還不足以構(gòu)成Anthropic對Mythos Preview實施限量發(fā)布的充分理由。

然而，在模擬實戰(zhàn)場景中，Mythos展現(xiàn)出了更為突出的相對優(yōu)勢。在AISI專門搭建的"最后關(guān)卡"（TLO）測試中，該場景模擬了一次針對企業(yè)網(wǎng)絡(luò)、多達32個步驟的數(shù)據(jù)竊取攻擊。這一測試要求模型"跨越多個主機和網(wǎng)段，將數(shù)十個步驟串聯(lián)執(zhí)行"，AISI估計，完成整個流程需要經(jīng)過專業(yè)訓(xùn)練的人員耗費約20小時。

在這一測試中，Mythos的表現(xiàn)遠(yuǎn)超所有此前模型，成為"首個從頭到尾完整解決TLO挑戰(zhàn)的模型"。盡管Anthropic的新模型在10次嘗試中僅成功3次，但即便是Mythos Preview的平均表現(xiàn)，也完成了32個滲透步驟中的22個，遠(yuǎn)高于Claude 4.6所達到的16步平均水平。

Mythos Preview目前仍存在一定局限。AISI指出，該模型在名為"冷卻塔"的更高難度測試中依然表現(xiàn)吃力——這是一個共七步的測試，旨在模擬對發(fā)電廠控制軟件的攻擊破壞。不過，AISI也表示，若將測試中設(shè)定的1億Token計算預(yù)算進一步提升，預(yù)計"模型的評估表現(xiàn)將隨之持續(xù)改善"。

小型弱防御系統(tǒng)面臨潛在威脅

綜合來看，Mythos在TLO測試中的表現(xiàn)表明，該模型"至少具備在已獲得網(wǎng)絡(luò)訪問權(quán)限的前提下，自主攻擊規(guī)模較小、防御薄弱且存在漏洞的企業(yè)系統(tǒng)的能力"，AISI如此評估。盡管如此，AISI也提醒，其模擬網(wǎng)絡(luò)環(huán)境缺乏真實關(guān)鍵系統(tǒng)中通常配備的主動防御機制和防御工具。此外，TLO測試場景中預(yù)設(shè)了特定漏洞，這些漏洞在真實環(huán)境中未必存在；測試也不會對模型觸發(fā)檢測警報的行為進行懲罰，而在真實滲透場景中，一旦暴露便意味著行動失敗。

正因如此，AISI表示尚無法確定Mythos Preview能否突破"防御完備的系統(tǒng)"。但隨著未來模型的能力不斷追平甚至超越Mythos，AISI警告稱，系統(tǒng)安全的設(shè)計者同樣應(yīng)當(dāng)借助AI模型來強化自身防御體系。

Q&A

Q1：AISI對Mythos Preview的評估結(jié)論是什么？

A：AISI的評估顯示，Mythos Preview在單項網(wǎng)絡(luò)安全任務(wù)上與其他主流前沿模型表現(xiàn)相近，差距在5%至10%之間。但在模擬32步企業(yè)網(wǎng)絡(luò)滲透攻擊的"最后關(guān)卡"（TLO）測試中，Mythos成為首個完整通關(guān)的模型，平均可完成22個步驟，顯著優(yōu)于前代模型。整體而言，AISI認(rèn)為該模型具備自主攻擊小型、弱防御企業(yè)系統(tǒng)的能力。

Q2：Mythos Preview為什么只向少數(shù)合作伙伴開放？

A：Anthropic認(rèn)為Mythos Preview在計算機安全任務(wù)上表現(xiàn)"極為突出"，因此將其初始發(fā)布限定于少數(shù)關(guān)鍵行業(yè)合作伙伴，給相關(guān)方留出時間做好準(zhǔn)備。但從AISI的獨立評估來看，Mythos在多數(shù)單項測試中與競爭模型差距不大，限量發(fā)布的必要性存在一定爭議。

Q3：Mythos Preview對現(xiàn)實中的網(wǎng)絡(luò)安全有多大威脅？

A：AISI指出，Mythos能夠在已獲得網(wǎng)絡(luò)訪問權(quán)限的情況下，自主攻擊防御薄弱的小型企業(yè)系統(tǒng)。但由于測試環(huán)境缺乏真實的主動防御機制，AISI無法確認(rèn)其能否突破防御完備的系統(tǒng)。AISI建議，系統(tǒng)安全設(shè)計者應(yīng)同步引入AI模型來強化防御能力，以應(yīng)對未來更強大模型帶來的潛在威脅。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.