亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Anthropic扔出Mythos Preview:32步網(wǎng)絡(luò)攻擊,人類要20小時

0
分享至


73%的專家級CTF任務(wù)成功率,32步企業(yè)網(wǎng)絡(luò)滲透測試3次完整通關(guān)。英國AI安全研究所(AISI)4月14日發(fā)布的這份評估報告,把Anthropic最新模型Claude Mythos Preview的網(wǎng)絡(luò)安全能力攤在了桌上。

這不是實(shí)驗(yàn)室里的玩具演示。AISI從2023年開始跟蹤AI網(wǎng)絡(luò)能力,評估難度從聊天式探測一路升級到奪旗賽(CTF),再到多步驟攻擊模擬。兩年前頂尖模型連入門級任務(wù)都搞不定,現(xiàn)在Mythos Preview在受控環(huán)境下能自主發(fā)現(xiàn)漏洞、執(zhí)行多階段攻擊——這些活兒人類專業(yè)人員得干上好幾天。

奪旗賽:從0到73%的兩年躍遷

CTF挑戰(zhàn)是網(wǎng)絡(luò)安全界的標(biāo)準(zhǔn)考題:AI需要識別目標(biāo)系統(tǒng)弱點(diǎn),找到并提取隱藏的"flag"。AISI的測試套件按難度分級,Mythos Preview在專家級任務(wù)上的成功率達(dá)到73%。

這個數(shù)字的分量在于時間線。AISI在報告里明確標(biāo)注:2025年4月之前,沒有任何模型能完成專家級CTF任務(wù)。Mythos Preview是第一個破局的。

但CTF有個天然局限——它測的是孤立技能。真實(shí)網(wǎng)絡(luò)攻擊需要跨多臺主機(jī)、多個網(wǎng)段串聯(lián)幾十步操作,人類專家得花數(shù)小時到數(shù)周才能完成。AISI為此搭建了更復(fù)雜的考場。

"The Last Ones":32步企業(yè)網(wǎng)絡(luò)滲透測試

AISI把這個新測試場叫做"The Last Ones"(TLO)。場景設(shè)計很完整:從初始偵察到完全控制企業(yè)網(wǎng)絡(luò),共32個步驟,AISI估計人類完成需要20小時。

Mythos Preview 10次嘗試中3次從頭跑到尾。平均完成22步,而Claude Opus 4.6作為表現(xiàn)第二好的模型,平均只完成16步。

這是第一個跑通TLO全程的模型,差距不是量變是斷層。

測試預(yù)算給得很足:1億token的推理額度。AISI備注說,如果繼續(xù)增加計算資源,表現(xiàn)還可能提升——這話放在這兒,像是給后續(xù)模型留的臺階,也像是對當(dāng)前結(jié)果的保守確認(rèn)。

OT環(huán)境的磕絆:Cooling Tower測試

Mythos Preview并非全線飄紅。在面向運(yùn)營技術(shù)(OT)的網(wǎng)絡(luò)測試"Cooling Tower"上,模型沒能完成。但AISI的措辭很謹(jǐn)慎:這不一定說明模型不擅長OT環(huán)境攻擊,問題出在測試的IT環(huán)節(jié)卡住了。

OT指工業(yè)控制系統(tǒng)、電力電網(wǎng)、制造流水線這類關(guān)鍵基礎(chǔ)設(shè)施。IT環(huán)節(jié)受阻意味著模型在常規(guī)企業(yè)網(wǎng)絡(luò)操作里遇到了障礙,而非OT特有的技術(shù)壁壘。這個區(qū)分很重要——它劃清了能力邊界的位置。

評估框架本身也在進(jìn)化。AISI從2023年的聊天探測起步,2024年引入CTF,2025年上線TLO這類多步驟模擬。難度迭代的速度追著模型能力提升跑,這種動態(tài)調(diào)整本身就是信號:網(wǎng)絡(luò)AI能力的進(jìn)步節(jié)奏,已經(jīng)快到需要持續(xù)加碼測試才能跟上。

Anthropic的發(fā)布時間線

Mythos Preview的發(fā)布日期是4月7日,AISI評估報告發(fā)布于4月14日。一周間隔,節(jié)奏緊湊。Preview版本的定位通常是功能預(yù)覽+安全測試,正式版的能力邊界可能還會有調(diào)整。

AISI的測試方法論有個特點(diǎn):模型被"明確引導(dǎo)"并獲得網(wǎng)絡(luò)訪問權(quán)限。這不是讓AI在黑暗里摸索,而是給定目標(biāo)、提供工具、觀察執(zhí)行。這種設(shè)計測的是"被定向后的能力上限",而非自主發(fā)現(xiàn)目標(biāo)的主動性。

即便如此,32步攻擊鏈的完成度依然超出預(yù)期。人類20小時的工作壓縮到模型運(yùn)行時間,這個效率比本身比成功率數(shù)字更值得玩味。

報告里埋了一個未完成的句子:"We expect that performance on our evaluations would continue to improve with more inference compute: we ran the cyber ranges with a 100M token budget; Mythos Preview's performance contin"——原文在這里截斷,但意圖很明顯:1億token不是天花板,加錢還能更強(qiáng)。

網(wǎng)絡(luò)安全能力的AI化,核心矛盾從來不在"能不能做",而在"做到什么程度需要人類介入"。Mythos Preview的測試結(jié)果顯示,多步驟復(fù)雜攻擊的自主執(zhí)行門檻正在被快速推高。紅隊(duì)(攻擊方)工具的智能化進(jìn)度,明顯跑在藍(lán)隊(duì)(防御方)自動化響應(yīng)的前面。

AISI沒有給出防御側(cè)的對照數(shù)據(jù)。他們的評估聚焦模型攻擊能力,這種單向測試的局限性報告本身也承認(rèn):真實(shí)場景里,攻擊者要面對的是動態(tài)防御、日志審計、行為檢測,而非靜態(tài)靶場。

但靶場成績的意義在于建立基準(zhǔn)線。73%專家CTF成功率、TLO首次通關(guān)、22/32步平均進(jìn)度——這些數(shù)字給后續(xù)模型提供了可比的坐標(biāo)。AISI說他們會"繼續(xù)構(gòu)建 progressively harder evaluations", progressively harder 這個自造詞組,暗示測試難度和模型能力之間的軍備競賽已經(jīng)常態(tài)化。

Claude系列的網(wǎng)絡(luò)能力躍升有個背景:Anthropic在2024年多次強(qiáng)調(diào)AI安全研究,包括紅隊(duì)測試、模型可解釋性、有害輸出過濾。Mythos Preview的發(fā)布節(jié)奏和評估透明度,某種程度上是這種安全話語的延續(xù)——先讓第三方機(jī)構(gòu)測完,再談能力邊界。

對比其他前沿模型,OpenAI的GPT-4系列、Google的Gemini在網(wǎng)絡(luò)安全評估上的公開數(shù)據(jù)相對零散。AISI這份報告的價值在于方法論一致性:同一套CTF套件、同一類TLO場景,可以橫向?qū)Ρ炔煌H、不同廠商模型的進(jìn)步曲線。

報告末尾沒有總結(jié)性判斷,也沒有政策建議。AISI的定位是技術(shù)評估機(jī)構(gòu),不是監(jiān)管方。但數(shù)據(jù)本身會說話:當(dāng)模型能在20小時人類工作量的攻擊鏈里自主完成大部分步驟,"AI輔助網(wǎng)絡(luò)攻擊"這個概念的內(nèi)涵,已經(jīng)和兩年前的腳本小子工具不在一個維度。

Mythos Preview目前還是Preview版本。正式版的能力調(diào)整方向、安全限制加固程度、API開放策略,這些變量還沒落定。AISI的評估是快照,不是預(yù)言。

但快照已經(jīng)夠清晰了。網(wǎng)絡(luò)攻防的自動化水平正在經(jīng)歷一次結(jié)構(gòu)性抬升,而測試機(jī)構(gòu)被迫用" progressively harder "的方式追趕——這個動態(tài)本身,可能比任何單一數(shù)字都更能說明問題。

如果1億token預(yù)算下的表現(xiàn)只是起點(diǎn),那么當(dāng)推理計算繼續(xù)加碼,下一個版本的通關(guān)率會停在多少?AISI在報告截斷處留下的那個"contin",是留給讀者的開放式接口。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
笑不活了!面館過度爆火,文章竟親自下廚,現(xiàn)場齊喊“少帥”調(diào)侃

笑不活了!面館過度爆火,文章竟親自下廚,現(xiàn)場齊喊“少帥”調(diào)侃

冷紫葉
2026-04-16 14:25:50
村霸在我家魚塘電魚,我沒鬧,連夜倒8斤豬血,隔天一早他傻眼了

村霸在我家魚塘電魚,我沒鬧,連夜倒8斤豬血,隔天一早他傻眼了

白淺娛樂聊
2026-04-16 09:22:52
世錦賽正賽簽表出爐:首輪2場德比戰(zhàn),趙心童丁俊暉力爭次輪會師

世錦賽正賽簽表出爐:首輪2場德比戰(zhàn),趙心童丁俊暉力爭次輪會師

全景體育V
2026-04-16 16:09:43
歐冠綜述:拜仁雙殺十人皇馬!總比分6-4進(jìn)4強(qiáng) 阿森納1-0淘汰葡體

歐冠綜述:拜仁雙殺十人皇馬!總比分6-4進(jìn)4強(qiáng) 阿森納1-0淘汰葡體

我愛英超
2026-04-16 05:06:19
中國向全球宣布:又一張國家名片誕生!該技術(shù)全世界只有中國擁有

中國向全球宣布:又一張國家名片誕生!該技術(shù)全世界只有中國擁有

正經(jīng)的燒杯1
2026-04-16 10:56:21
善惡有報,移居英國僅2年,57歲吳秀波再迎噩耗,步入李易峰后塵

善惡有報,移居英國僅2年,57歲吳秀波再迎噩耗,步入李易峰后塵

有范又有料
2025-12-17 14:54:06
年會我遞辭職,領(lǐng)導(dǎo)看我工資單皺眉:只到賬零頭?臺下全看向財務(wù)

年會我遞辭職,領(lǐng)導(dǎo)看我工資單皺眉:只到賬零頭?臺下全看向財務(wù)

侃故事的阿慶
2026-04-16 16:06:39
Lululemon“避孕門”曝光!3億中產(chǎn)天塌了!

Lululemon“避孕門”曝光!3億中產(chǎn)天塌了!

廣告案例精選
2026-04-16 08:28:23
信仰不是法外之地,全國開始雷霆出擊整頓寺廟

信仰不是法外之地,全國開始雷霆出擊整頓寺廟

卷史
2026-04-16 08:06:56
國內(nèi)成品油4月21日24時開啟調(diào)價窗口,汽柴油預(yù)計下調(diào)每噸510元

國內(nèi)成品油4月21日24時開啟調(diào)價窗口,汽柴油預(yù)計下調(diào)每噸510元

金融界
2026-04-16 15:26:01
又援助15600噸,我國第3批援助古巴大米到港!再難也餓不死古巴人

又援助15600噸,我國第3批援助古巴大米到港!再難也餓不死古巴人

科普大世界
2026-04-16 11:33:14
《明朝那些事兒》濃縮成30句精華,狠狠提升你的格局

《明朝那些事兒》濃縮成30句精華,狠狠提升你的格局

尚曦讀史
2026-04-13 09:00:12
互聯(lián)網(wǎng)是有記憶的,她的黑歷史一大堆啊!

互聯(lián)網(wǎng)是有記憶的,她的黑歷史一大堆啊!

BenSir本色說
2026-04-15 22:38:07
特朗普稱相信中國不會停止購買伊朗石油,并稱將對購買伊朗石油的國家實(shí)施制裁,外交部回應(yīng)

特朗普稱相信中國不會停止購買伊朗石油,并稱將對購買伊朗石油的國家實(shí)施制裁,外交部回應(yīng)

大象新聞
2026-04-16 17:21:03
弗洛倫蒂諾賽后批評全隊(duì):連續(xù)兩個賽季無冠是不可接受的

弗洛倫蒂諾賽后批評全隊(duì):連續(xù)兩個賽季無冠是不可接受的

懂球帝
2026-04-16 19:07:06
船記:如果哈登沒有申請交易,快船雖不能奪冠但會是聯(lián)盟前五

船記:如果哈登沒有申請交易,快船雖不能奪冠但會是聯(lián)盟前五

懂球帝
2026-04-16 16:05:10
莊神絕命3分登全美熱搜!美媒高呼關(guān)鍵戰(zhàn)第2巨 僅500萬卻存大心臟

莊神絕命3分登全美熱搜!美媒高呼關(guān)鍵戰(zhàn)第2巨 僅500萬卻存大心臟

顏小白的籃球夢
2026-04-16 10:59:13
2026年修電腦還用微PE?我試了USBOS V3.0,第二天就把舊U盤扔了

2026年修電腦還用微PE?我試了USBOS V3.0,第二天就把舊U盤扔了

小柱解說游戲
2026-04-15 00:05:50
大快人心!浙江4057座寺廟,密集關(guān)停整頓,網(wǎng)友:亂象早該根治

大快人心!浙江4057座寺廟,密集關(guān)停整頓,網(wǎng)友:亂象早該根治

我不叫阿哏
2026-04-16 10:53:56
內(nèi)娛最好命闊太: 住億萬豪宅, 一頓飯賺7000萬, 被老公寵愛30年!

內(nèi)娛最好命闊太: 住億萬豪宅, 一頓飯賺7000萬, 被老公寵愛30年!

趣文說娛
2026-04-15 21:42:55
2026-04-16 21:03:00
爬蟲飼養(yǎng)員
爬蟲飼養(yǎng)員
業(yè)余養(yǎng)了只叫“龍蝦”的AI爬蟲,主業(yè)是給互聯(lián)網(wǎng)打工。
1461文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰在大模型上更高效

頭條要聞

法國通過文物歸還法案 分析傾向法案優(yōu)先針對的非中國

頭條要聞

法國通過文物歸還法案 分析傾向法案優(yōu)先針對的非中國

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰生意迷霧

汽車要聞

空間大五個乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

教育
數(shù)碼
旅游
時尚
本地

教育要聞

5名初三女生霸凌同學(xué)致其骨折,竟然未被拘留,也沒說應(yīng)當(dāng)拘留

數(shù)碼要聞

京東外賣發(fā)布首款智能控溫冷熱餐箱X1:讓外賣吃出堂食味

旅游要聞

接棒!跟著悟空小俠去冒險!上海樂高樂園讓中國故事玩出新花樣

8個監(jiān)控攝像頭,這就是“完美丈夫”對她的愛

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

無障礙瀏覽 進(jìn)入關(guān)懷版