![]()
上周,Anthropic宣布將其Mythos Preview模型的初始發(fā)布限定在"少數(shù)關(guān)鍵行業(yè)合作伙伴"范圍內(nèi),理由是該模型"在計算機安全任務(wù)上的表現(xiàn)極為突出"。如今,英國政府旗下的AI安全研究所(AISI)發(fā)布了一份針對該模型網(wǎng)絡(luò)攻擊能力的初步評估報告,為Anthropic的說法提供了獨立的公開驗證。
AISI的研究結(jié)果顯示,在單項網(wǎng)絡(luò)安全相關(guān)任務(wù)的測試中,Mythos與近期其他前沿模型相比并無顯著差異。然而,Mythos的獨特之處在于,它能夠有效地將多個任務(wù)串聯(lián)成多步驟攻擊鏈,而這正是全面滲透某些系統(tǒng)所必需的能力。
"最后關(guān)卡"終告攻克
AISI自2023年初便開始對各類AI模型進行專門設(shè)計的奪旗(CTF)挑戰(zhàn)測試。彼時,GPT-3.5 Turbo連難度較低的"學(xué)徒級"任務(wù)都難以完成。此后,歷代模型的表現(xiàn)持續(xù)提升,直至Mythos Preview在這些學(xué)徒級CTF任務(wù)中的完成率突破85%。
盡管這在技術(shù)層面刷新了AISI CTF測試的最高紀(jì)錄,但近期的競爭模型——如GPT-5.4、Anthropic自家的Opus 4.6以及Codex 5.3——在近幾個月的多個CTF難度等級測試中均表現(xiàn)相近,精度差距僅在5%至10%之間。這一改進幅度,似乎還不足以構(gòu)成Anthropic對Mythos Preview實施限量發(fā)布的充分理由。
然而,在模擬實戰(zhàn)場景中,Mythos展現(xiàn)出了更為突出的相對優(yōu)勢。在AISI專門搭建的"最后關(guān)卡"(TLO)測試中,該場景模擬了一次針對企業(yè)網(wǎng)絡(luò)、多達32個步驟的數(shù)據(jù)竊取攻擊。這一測試要求模型"跨越多個主機和網(wǎng)段,將數(shù)十個步驟串聯(lián)執(zhí)行",AISI估計,完成整個流程需要經(jīng)過專業(yè)訓(xùn)練的人員耗費約20小時。
在這一測試中,Mythos的表現(xiàn)遠(yuǎn)超所有此前模型,成為"首個從頭到尾完整解決TLO挑戰(zhàn)的模型"。盡管Anthropic的新模型在10次嘗試中僅成功3次,但即便是Mythos Preview的平均表現(xiàn),也完成了32個滲透步驟中的22個,遠(yuǎn)高于Claude 4.6所達到的16步平均水平。
Mythos Preview目前仍存在一定局限。AISI指出,該模型在名為"冷卻塔"的更高難度測試中依然表現(xiàn)吃力——這是一個共七步的測試,旨在模擬對發(fā)電廠控制軟件的攻擊破壞。不過,AISI也表示,若將測試中設(shè)定的1億Token計算預(yù)算進一步提升,預(yù)計"模型的評估表現(xiàn)將隨之持續(xù)改善"。
小型弱防御系統(tǒng)面臨潛在威脅
綜合來看,Mythos在TLO測試中的表現(xiàn)表明,該模型"至少具備在已獲得網(wǎng)絡(luò)訪問權(quán)限的前提下,自主攻擊規(guī)模較小、防御薄弱且存在漏洞的企業(yè)系統(tǒng)的能力",AISI如此評估。盡管如此,AISI也提醒,其模擬網(wǎng)絡(luò)環(huán)境缺乏真實關(guān)鍵系統(tǒng)中通常配備的主動防御機制和防御工具。此外,TLO測試場景中預(yù)設(shè)了特定漏洞,這些漏洞在真實環(huán)境中未必存在;測試也不會對模型觸發(fā)檢測警報的行為進行懲罰,而在真實滲透場景中,一旦暴露便意味著行動失敗。
正因如此,AISI表示尚無法確定Mythos Preview能否突破"防御完備的系統(tǒng)"。但隨著未來模型的能力不斷追平甚至超越Mythos,AISI警告稱,系統(tǒng)安全的設(shè)計者同樣應(yīng)當(dāng)借助AI模型來強化自身防御體系。
Q&A
Q1:AISI對Mythos Preview的評估結(jié)論是什么?
A:AISI的評估顯示,Mythos Preview在單項網(wǎng)絡(luò)安全任務(wù)上與其他主流前沿模型表現(xiàn)相近,差距在5%至10%之間。但在模擬32步企業(yè)網(wǎng)絡(luò)滲透攻擊的"最后關(guān)卡"(TLO)測試中,Mythos成為首個完整通關(guān)的模型,平均可完成22個步驟,顯著優(yōu)于前代模型。整體而言,AISI認(rèn)為該模型具備自主攻擊小型、弱防御企業(yè)系統(tǒng)的能力。
Q2:Mythos Preview為什么只向少數(shù)合作伙伴開放?
A:Anthropic認(rèn)為Mythos Preview在計算機安全任務(wù)上表現(xiàn)"極為突出",因此將其初始發(fā)布限定于少數(shù)關(guān)鍵行業(yè)合作伙伴,給相關(guān)方留出時間做好準(zhǔn)備。但從AISI的獨立評估來看,Mythos在多數(shù)單項測試中與競爭模型差距不大,限量發(fā)布的必要性存在一定爭議。
Q3:Mythos Preview對現(xiàn)實中的網(wǎng)絡(luò)安全有多大威脅?
A:AISI指出,Mythos能夠在已獲得網(wǎng)絡(luò)訪問權(quán)限的情況下,自主攻擊防御薄弱的小型企業(yè)系統(tǒng)。但由于測試環(huán)境缺乏真實的主動防御機制,AISI無法確認(rèn)其能否突破防御完備的系統(tǒng)。AISI建議,系統(tǒng)安全設(shè)計者應(yīng)同步引入AI模型來強化防御能力,以應(yīng)對未來更強大模型帶來的潛在威脅。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.