无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

微小的圖像變化可以繞過人工智能的防護(hù)機(jī)制,使不安全反應(yīng)的發(fā)生率幾乎翻倍

0
分享至


這是一張使用 JaiLIP 修改過的圖像。JaiLIP 由佛羅里達(dá)國際大學(xué)的研究人員開發(fā),這種圖像處理方法已被證明能夠繞過某些人工智能模型內(nèi)置的安全防護(hù)措施。圖片來源:Taimy Alvarez / 佛羅里達(dá)國際大學(xué)

來源:https://techxplore.com/news/2026-06-microscopic-image-bypass-ai-guardrails.html

在你看來,它可能像是一張熊貓的圖片,但對你公司的 AI 代理來說,它就像一把萬能鑰匙,可以繞過安全措施,并可能導(dǎo)致模型生成有害的、誤導(dǎo)性的或違反政策的輸出。

佛羅里達(dá)國際大學(xué)奈特基金會計(jì)算機(jī)與信息科學(xué)學(xué)院副教授哈迪·阿米尼(Hadi Amini)的最新研究聚焦于這一風(fēng)險(xiǎn)。他與研究生助理穆罕默德·朱埃爾·米亞(Md Jueal Mia)合作,研究篡改后的圖像如何“突破”某些人工智能系統(tǒng)的防線,使其超出內(nèi)置的安全防護(hù)范圍。

阿米尼說:“人工智能模型看待圖像的方式與人類不同。它們看到的是數(shù)字和像素的模式。通過精心操縱這些像素,我們可以影響人工智能對圖像的解讀和反應(yīng)。”

該團(tuán)隊(duì)的研究表明,小語言人工智能模型(小型企業(yè)經(jīng)常使用這類模型來執(zhí)行諸如會計(jì)或客戶服務(wù)等日常任務(wù))特別容易受到基于圖像的攻擊。正如發(fā)表在IEEE Xplore上的研究所示,該團(tuán)隊(duì)發(fā)現(xiàn),通過在圖像中引入稱為“擾動”的微小像素級變化,他們可以誘使這些人工智能系統(tǒng)生成通常會被阻止的響應(yīng)。

阿米尼說:“篡改后的圖像就像一張陌生人的臉。人工智能必須學(xué)會謹(jǐn)慎對待請求才能做出回應(yīng)。為了保護(hù)人工智能系統(tǒng)免受攻擊,我們會嘗試自行破解它們,識別潛在漏洞并設(shè)計(jì)防御機(jī)制。”

研究人員隨后著手探究系統(tǒng)的防御機(jī)制。他們越成功地突破模型的防御屏障,就越能訓(xùn)練系統(tǒng)抵御未來的威脅。為此,阿米尼和他的團(tuán)隊(duì)開發(fā)了一種名為 JaiLIP(基于損失引導(dǎo)的圖像擾動越獄)的方法,該方法使用一種算法來確定像素級操作的最佳程度。

研究人員和開發(fā)人員使用BLIP-2多模態(tài)人工智能模型進(jìn)行測試時(shí),Amini及其團(tuán)隊(duì)發(fā)現(xiàn),經(jīng)JaiLIP修改的圖像顯著增加了系統(tǒng)生成有害或不安全響應(yīng)的可能性。例如,一個(gè)經(jīng)過JaiLIP修改的紅綠燈圖像欺騙了人工智能模型,使其泄露了如何闖紅燈以避免交通罰單的詳細(xì)說明。總體而言,使用JaiLIP圖像使人工智能模型生成的有害響應(yīng)數(shù)量幾乎翻了一番。

風(fēng)險(xiǎn)不僅限于用戶向人工智能系統(tǒng)發(fā)出非法活動指令。隨著企業(yè)越來越多地采用人工智能客服代理、聊天機(jī)器人和自動化工作流程,開源或防護(hù)薄弱的系統(tǒng)中的漏洞可能會對用戶信任度產(chǎn)生負(fù)面影響,或?yàn)榫W(wǎng)絡(luò)攻擊開辟新的途徑。

阿米尼表示:“小型企業(yè)和公司可以利用人工智能來提高效率,但他們必須意識到潛在的漏洞。他們必須確保部署足夠的防護(hù)措施,以維護(hù)人工智能工具的安全性和完整性。”

阿米尼表示,在將人工智能融入企業(yè)或工作場所之前,每個(gè)人都應(yīng)該采取一些基本的預(yù)防措施,包括限制向人工智能系統(tǒng)提供的敏感信息(尤其是圖像),限制誰可以訪問這些系統(tǒng),以及在部署之前仔細(xì)評估人工智能工具中內(nèi)置的安全措施。

由于安全至關(guān)重要,阿米尼和他的團(tuán)隊(duì)正努力在人工智能領(lǐng)域領(lǐng)先于潛在的惡意行為者一步。他和他的團(tuán)隊(duì)發(fā)現(xiàn)的漏洞越多,人工智能就能越快地學(xué)會修復(fù)它們。他表示,真正的挑戰(zhàn)在于確保人工智能能夠識別出隱藏在顯而易見之處的威脅——即使人類無法識別。

閱讀最新前沿科技趨勢報(bào)告,請?jiān)L問21世紀(jì)關(guān)鍵技術(shù)研究院的“未來知識庫”


未來知識庫是 “21世紀(jì)關(guān)鍵技術(shù)研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟(jì)、人類風(fēng)險(xiǎn)等等領(lǐng)域的前沿進(jìn)展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進(jìn)入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報(bào)告

(加入未來知識庫,全部資料免費(fèi)閱讀和下載)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中足聯(lián)官宣重磅罰單!52歲于根偉禁賽5場罰5萬 辱罵+率隊(duì)圍堵裁判

中足聯(lián)官宣重磅罰單!52歲于根偉禁賽5場罰5萬 辱罵+率隊(duì)圍堵裁判

我愛英超
2026-07-02 22:05:30
早上7點(diǎn) 世界杯14億大戰(zhàn)!C羅深陷20年魔咒 必有1巨星出局

早上7點(diǎn) 世界杯14億大戰(zhàn)!C羅深陷20年魔咒 必有1巨星出局

葉青足球世界
2026-07-02 17:12:02
一路走好!1天時(shí)間4位名人被曝去世,最大78歲,最小才30歲

一路走好!1天時(shí)間4位名人被曝去世,最大78歲,最小才30歲

借你一生
2026-07-02 10:26:03
成田機(jī)場的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國”

成田機(jī)場的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國”

東京在線
2026-07-02 16:57:07
里子面子都丟了!管不住下半身的任素汐,一場演唱會撕下她的體面

里子面子都丟了!管不住下半身的任素汐,一場演唱會撕下她的體面

往史過眼云煙
2026-07-02 09:55:26
首都保衛(wèi)戰(zhàn)打響后,普京發(fā)表全國講話,俄羅斯對美西方發(fā)出通牒

首都保衛(wèi)戰(zhàn)打響后,普京發(fā)表全國講話,俄羅斯對美西方發(fā)出通牒

策前論
2026-07-02 17:21:49
“一個(gè)月600塊你要餓死他?”大學(xué)男生吃飯被偷拍,看的人心疼!

“一個(gè)月600塊你要餓死他?”大學(xué)男生吃飯被偷拍,看的人心疼!

林林先生
2026-07-01 12:30:03
從699分到愛心接力:少年向上 社會向善丨中聽

從699分到愛心接力:少年向上 社會向善丨中聽

大象新聞
2026-07-01 16:30:12
六代機(jī),就這么明晃晃的官宣了!

六代機(jī),就這么明晃晃的官宣了!

新動察
2026-07-02 08:25:58
韓紅一句“走個(gè)面兒”引全網(wǎng)聲討,這屆觀眾不伺候了

韓紅一句“走個(gè)面兒”引全網(wǎng)聲討,這屆觀眾不伺候了

可達(dá)鴨面面觀
2026-07-02 19:44:03
曝38歲德國主帥下課 足協(xié)開會3小時(shí)要求他辭職 愿付700萬歐補(bǔ)償金

曝38歲德國主帥下課 足協(xié)開會3小時(shí)要求他辭職 愿付700萬歐補(bǔ)償金

我愛英超
2026-07-02 21:40:07
80%變0!里奇·保羅曝光詹姆斯離湖心路

80%變0!里奇·保羅曝光詹姆斯離湖心路

籃壇第一線
2026-07-02 00:47:17
地鐵吐血女孩半月內(nèi)多次收到病危通知單,當(dāng)事人:自己的生命已經(jīng)進(jìn)入倒計(jì)時(shí),但還是希望能夠有人關(guān)注到自己手里仍在運(yùn)行的公益項(xiàng)目

地鐵吐血女孩半月內(nèi)多次收到病危通知單,當(dāng)事人:自己的生命已經(jīng)進(jìn)入倒計(jì)時(shí),但還是希望能夠有人關(guān)注到自己手里仍在運(yùn)行的公益項(xiàng)目

瀟湘晨報(bào)
2026-07-02 16:32:20
賈玲直言自己又活過來了,大方承認(rèn)體重反彈了,坦言不再逼自己極端自律,活得太通透了

賈玲直言自己又活過來了,大方承認(rèn)體重反彈了,坦言不再逼自己極端自律,活得太通透了

背包旅行
2026-07-02 11:45:23
西安賽格墜樓熱搜刷屏:我看到謀生的嚴(yán)總,走上絕路時(shí)的無助

西安賽格墜樓熱搜刷屏:我看到謀生的嚴(yán)總,走上絕路時(shí)的無助

李晚書
2026-07-02 18:44:26
故意剝奪伊朗隊(duì)勝利!伊朗裔美國專家起訴國際足聯(lián),索賠10億美元

故意剝奪伊朗隊(duì)勝利!伊朗裔美國專家起訴國際足聯(lián),索賠10億美元

全景體育V
2026-07-02 21:38:20
成都一女子不洗手抱孫子,兒媳怒斥不衛(wèi)生,兒子一拳打面中,母親揚(yáng)言要兒子坐牢,兒子卻說:她活該!6年后現(xiàn)狀曝光...

成都一女子不洗手抱孫子,兒媳怒斥不衛(wèi)生,兒子一拳打面中,母親揚(yáng)言要兒子坐牢,兒子卻說:她活該!6年后現(xiàn)狀曝光...

背包旅行
2026-07-02 14:33:11
中國臺灣演員陳昊森承認(rèn)與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

中國臺灣演員陳昊森承認(rèn)與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

極目新聞
2026-07-02 22:47:55
加息,突變!美國重磅數(shù)據(jù)出爐!美股、黃金、比特幣全線拉升

加息,突變!美國重磅數(shù)據(jù)出爐!美股、黃金、比特幣全線拉升

證券時(shí)報(bào)
2026-07-02 21:53:03
扎哈羅娃:馮德萊恩是個(gè)“出色的騙子”

扎哈羅娃:馮德萊恩是個(gè)“出色的騙子”

參考消息
2026-07-02 14:14:08
2026-07-03 02:28:49
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4864文章數(shù) 37483關(guān)注度
往期回顧 全部

科技要聞

馬斯克不承認(rèn),但SpaceX就該造AI手機(jī)

頭條要聞

商戶在西安賽格商場墜亡 好友:他曾變賣門店發(fā)工資

頭條要聞

商戶在西安賽格商場墜亡 好友:他曾變賣門店發(fā)工資

體育要聞

韓國人,為什么恨透了洪明甫?

娛樂要聞

眾星祝福祖國,曾沛慈原形畢露?

財(cái)經(jīng)要聞

千億茶市場無贏家:瀾滄巨虧 八馬停"蹄"

汽車要聞

有純電有增程 還有二代VLA支持 小鵬MONA L03預(yù)售價(jià)14.38萬起

態(tài)度原創(chuàng)

數(shù)碼
本地
游戲
親子
公開課

數(shù)碼要聞

卓威同步發(fā)布XQ2766X顯示器:27" QHD 360Hz TN

本地新聞

這場穿越酉陽的光影之旅,張張都是壁紙!

國產(chǎn)外設(shè)廠"宣布"放棄實(shí)體手柄!數(shù)字化徹底解決漂移

親子要聞

從新生兒到學(xué)齡期全覆蓋:兒童被子成長型選型的策略與實(shí)用方法

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版