網易首頁 > 網易號 > 正文 申請入駐

AI對抗遷移性評估的「撥亂反正」:那些年效果虛高的攻防算法們

0
分享至



本文第一作者 / 通訊作者趙正宇來自西安交通大學,共同第一作者張焓韡、李仞玨分別來自德國薩爾大學、中科工業人工智能研究院。其他合作者分別來自法國馬賽中央理工、法國 INRIA 國家信息與自動化研究所、德國 CISPA 亥姆霍茲信息安全中心、清華大學、武漢大學、西安交通大學。

對抗樣本(adversarial examples)的遷移性(transferability)—— 在某個模型上生成的對抗樣本能夠同樣誤導其他未知模型 —— 被認為是威脅現實黑盒深度學習系統安全的核心因素。盡管現有研究已提出復雜多樣的遷移攻擊方法,卻仍缺乏系統且公平的方法對比分析:(1)針對攻擊遷移性,未采用公平超參設置的同類攻擊對比分析;(2)針對攻擊隱蔽性,缺乏多樣指標。

為了解決上述問題,本文依據通用機器學習全周期階段,將遷移攻擊方法系統性劃分為五大類,并首次針對 23 種代表性攻擊與 11 種代表性防御方法(包括針對遷移的防御與現實世界的視覺系統 API),在 ImageNet 數據集上開展對抗遷移性綜合評估,并通過大規模用戶實驗評估對抗隱蔽性。

本文證實上述評估缺陷確實導致了理解盲區甚至誤導性結論,而解決這些缺陷后帶來一系列新見解,例如:(1)早期攻擊方法 DI 性能反而超越所有后續同類攻擊;(2) 原本聲稱白盒防御方法 DiffPure 卻極易被(黑盒)遷移方法攻破;(3)幾乎所有攻擊方法在提升遷移性的同時,實則犧牲了(通過多樣化指標量化的)攻擊隱蔽性。



  • 論文題目:Revisiting Transferable Adversarial Images: Systemization, Evaluation, and New Insights
  • 接收期刊:TPAMI 2025
  • 預印本鏈接:https://arxiv.org/abs/2310.11850
  • 代碼鏈接:https://github.com/ZhengyuZhao/TransferAttackEval

研究現狀

對抗樣本的遷移性是研究深度學習系統魯棒性的重要課題。在真實世界中,攻擊者往往無法訪問目標模型的內部參數或訓練集(黑盒情形)。攻擊在一個 / 一類模型上生成后能否在另一個未知模型上保持效力(即攻擊遷移性),直接決定了攻擊的實際威脅水平與防御的有效性。

當前相關研究存在兩個長期被忽略但是影響深遠的問題:

  • 攻擊遷移性(transferability)評估缺乏系統的一對一比較與公平的超參數設定:不同方法常在不同或不對等的超參數下對比,導致結論不可比或誤導性強。
  • 攻擊隱蔽性(stealthiness)幾乎沒有被系統評估: 許多工作只報告 Lp 約束下的成功率,而忽略了視覺 / 感知質量和攻擊可溯源特性的差異;也就是說,攻擊「看上去」是否真實不可察覺并未被充分衡量。

這種不嚴格的比較與不完整的度量導致使得某些方法被高估或低估,進而誤導防御設計與研究方向。



創新發現


依托前文所建立的評估框架,我們得以從實驗結果中更清晰地分析對抗魯棒性的內在因素。以下部分將概述主要發現與啟發性結論:

1.在公平的超參數設定下,早期方法 DI 竟優于后續眾多所謂改進方法:許多后來被認為更強的遷移攻擊,實則得益于更有利的實驗設定。一旦把超參數公平化,DI 類的早期方法便會遙遙領先。因此,我們需要公平對比來避免誤導性結論。這不僅關系到學術層面的研究,更關系到實際系統對抗威脅的判斷與防御優先級的設定。

2.擴散(diffusion)類防御方法依賴 “虛假安全感”:基于擴散原理進行去噪的防御方法雖然聲稱在白盒或某些自適應攻擊下表現很強,但黑盒(遷移)攻擊反而可以很大程度上繞過這些防御。因此,此類防御方法只是由于評估不完善帶來的 “虛假安全感”

3.相同 Lp 約束下,不同攻擊在隱蔽性上有巨大差異,且隱蔽性與遷移性之間呈負相關:即便所有攻擊都受同一 Lp 限制,在視覺感知度量(PSNR/SSIM/LPIPS 等)上依然差距很大。因此,除了常用 Lp 約束外,需要同時報告遷移性與多維度隱蔽性指標,以便合理權衡攻擊遷移性與隱蔽性。

具體評估建議與攻防設計參考如下:



評估框架與結果


本文依據通用機器學習全周期階段,將遷移攻擊方法系統性劃分為五大類,如下圖所示:



本文涉及了 23 種代表性攻擊與 11 種代表性防御方法,如下表所示:





針對攻擊遷移性,本文從兩個維度入手修正與完善現有評估基準:(1)引入完整的遷移攻擊方法分類,并進行公平的類內(intra-category)比較;(2)從 “攻擊溯源(attack traceback)” 角度設計隱蔽性評估。更具體地說,本文拋棄了將不同類攻擊方法直接對比的傳統策略,而是對同類攻擊進行一對一、超參數公平化的對比實驗:統一攻擊強度約束(相同 Lp 限制)、統一優化 / 迭代預算,并在同一組目標模型 / 防御上逐項比較。



針對攻擊隱蔽性,本工作不再僅依靠單一 Lp 值來進行衡量,而是引入多樣化的感知質量指標(例如常用的 PSNR/SSIM/LPIPS 等)并結合更細粒度的隱蔽性特征。另外,本文創新性地引入 “攻擊溯源” 視角,分析攻擊是如何產生可見 / 可追溯的擾動(例如是否集中于圖像某些高頻區域、是否具有結構化模式、擾動是否容易被現有檢測器或去噪機制識別)。









未來展望

我們呼吁研究界在對比任何(攻防)方法時務必采用一對一、超參數合理的公平設計;報告遷移性時同時報告多種感知 / 隱蔽性指標(不僅是 Lp),并分析攻擊的可追溯性特征;在評估防御有效性時,必須納入可遷移黑盒攻擊的考驗,尤其是對擴散 / 去噪類防御要采用更全面的測試;公開代碼、超參數與評估腳本,以便社區復現與累積真實進展。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
上海殘陣都能掀翻山東!8人輪換各個發揮,這陣容厚度太恐怖了!

上海殘陣都能掀翻山東!8人輪換各個發揮,這陣容厚度太恐怖了!

籃球資訊達人
2026-04-24 23:39:49
這張臉,不知道讓多少人,在欣賞中欣賞,并贊不絕口。

這張臉,不知道讓多少人,在欣賞中欣賞,并贊不絕口。

喜歡歷史的阿繁
2026-04-24 03:53:49
閉關2個月!39歲丁俊暉讓趙心童狂點贊:2人都428分 全場觀眾致敬

閉關2個月!39歲丁俊暉讓趙心童狂點贊:2人都428分 全場觀眾致敬

風過鄉
2026-04-25 06:25:15
小玥兒12歲生日冷清!汪小菲馬筱梅毫無表示,往年大排場反差刺眼

小玥兒12歲生日冷清!汪小菲馬筱梅毫無表示,往年大排場反差刺眼

人間煙火記事本
2026-04-25 06:25:08
10億都救不了一命!京東副總裁蔡磊,生命進入倒計時

10億都救不了一命!京東副總裁蔡磊,生命進入倒計時

聽風喃
2026-04-06 11:16:04
國產算力機會來了!DeepSeek V4全量開源,華為寒武紀贏麻了

國產算力機會來了!DeepSeek V4全量開源,華為寒武紀贏麻了

雷科技
2026-04-24 22:21:03
華晨宇撫仙湖演唱會延期,地址是否在生態保護“紅線”范圍內? 湖長省級監督電話回應

華晨宇撫仙湖演唱會延期,地址是否在生態保護“紅線”范圍內? 湖長省級監督電話回應

紅星新聞
2026-04-24 19:23:44
米體頭版:瑟洛特已同意加盟米蘭,米蘭可能報價2000萬歐+獎金

米體頭版:瑟洛特已同意加盟米蘭,米蘭可能報價2000萬歐+獎金

懂球帝
2026-04-25 08:03:07
明明只是戲子,卻把自己當大腕,論“耍大牌”,這5位明星夠丟人

明明只是戲子,卻把自己當大腕,論“耍大牌”,這5位明星夠丟人

青橘罐頭
2026-04-22 09:59:06
伊朗用血淚給中國換來了教訓:最大的敵人,并不是美國和以色列

伊朗用血淚給中國換來了教訓:最大的敵人,并不是美國和以色列

墨印齋
2026-04-23 15:42:00
連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

橙星文娛
2026-04-23 18:58:44
樓市大變天!如果不出意外,2026年二手房,價格將迎來4大新變化

樓市大變天!如果不出意外,2026年二手房,價格將迎來4大新變化

愛看劇的阿峰
2026-04-25 03:42:28
葉新萍被查實!科室1.3億收入賬上只剩5964萬,舉報人以房懸賞舉報

葉新萍被查實!科室1.3億收入賬上只剩5964萬,舉報人以房懸賞舉報

小李子體育
2026-04-25 00:25:18
辟謠!利拉德通過身邊人發聲:不可能在季后賽復出 目標下賽季

辟謠!利拉德通過身邊人發聲:不可能在季后賽復出 目標下賽季

醉臥浮生
2026-04-25 00:01:14
貝克漢姆家終于認清現實:兒子都是廢柴,搞錢還得靠14歲的女兒

貝克漢姆家終于認清現實:兒子都是廢柴,搞錢還得靠14歲的女兒

白露文娛志
2026-04-24 15:10:07
華誼兄弟,被正式申請破產!曾是“中國影視第一股”,坐擁馮小剛、黃曉明等百位明星,8年虧光80多億,如今還不起1000萬

華誼兄弟,被正式申請破產!曾是“中國影視第一股”,坐擁馮小剛、黃曉明等百位明星,8年虧光80多億,如今還不起1000萬

揚子晚報
2026-04-24 12:25:11
美媒稱,革命衛隊總司令瓦希迪成為美軍最新打擊目標

美媒稱,革命衛隊總司令瓦希迪成為美軍最新打擊目標

山河路口
2026-04-24 13:23:02
曼聯官宣德里赫特恢復訓練,欲避免賽季報銷!世界杯沒戲為將來戰

曼聯官宣德里赫特恢復訓練,欲避免賽季報銷!世界杯沒戲為將來戰

羅米的曼聯博客
2026-04-25 09:11:52
日軍最負盛名的坂垣師團,為什么最終擊敗他的卻是一支雜牌軍?

日軍最負盛名的坂垣師團,為什么最終擊敗他的卻是一支雜牌軍?

北海史記
2026-04-24 15:48:48
軍綠緊身裙:那不是制服,是我的戰袍

軍綠緊身裙:那不是制服,是我的戰袍

疾跑的小蝸牛
2026-04-24 20:59:30
2026-04-25 10:04:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12852文章數 142635關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

聲稱考慮效仿伊朗在馬六甲收"過路費"后 印尼財長改口

頭條要聞

聲稱考慮效仿伊朗在馬六甲收"過路費"后 印尼財長改口

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強一季

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

別高估英偉達,別低估DeepSeek

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

家居
旅游
手機
親子
公開課

家居要聞

自然肌理 溫潤美學

旅游要聞

西安周邊最值得去的寶藏小城!游客不多,景點硬核!浪一天0門票

手機要聞

全面回歸OPPO!realme真我商城明日起停止運營

親子要聞

家長需要警惕乙流最近有點波動

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版