來源 | 差評X.PIN (ID:chaping123)
搶票的時(shí)候,突然彈出來這么個(gè)玩意兒,你能選對嗎?
換個(gè)拼圖,你每次都能一口氣對準(zhǔn)嗎?
就連有時(shí)候打個(gè)勾,你可能都得多試兩次。
和驗(yàn)證碼斗智斗勇這么多年,說實(shí)話,咱都有點(diǎn)麻了。
但要是我告訴你,現(xiàn)在上面這些驗(yàn)證碼已經(jīng)攔不住 AI 了,卡關(guān)的只有我們這些 100% 純?nèi)祟惸兀?/strong>
就在前不久,江江發(fā)現(xiàn),不管是點(diǎn)擊式,九宮格選圖,甚至隱式驗(yàn)證,AI agent 居然都能過了。。。
點(diǎn)擊式驗(yàn)證碼是最容易破防的。早在 OpenAI 的 Operator 七月剛出世的時(shí)候,就有人把它拉來對著 Cloudflare 測了一波。
讓機(jī)器人自己點(diǎn)擊 “ 我不是機(jī)器人 ”,評論區(qū)不少人都表示這實(shí)在有點(diǎn)幽默了。
還有下面這種九宮格點(diǎn)選,老兄自己手搓 agent,后臺直連 GPT,立刻實(shí)現(xiàn)像素級的識別。
管你是小餅干還是小蛋糕,樓梯還是紅綠燈,它看得比人都清楚。
除了顯式點(diǎn)擊,隱式驗(yàn)證也不在話下。
人只要在命令行輸入 prompt,agent 自己就能點(diǎn)擊每一欄、輸入具體信息、完成表格提交任務(wù)。
甚至 reCAPTCHA 最后還給了它 80% 像人的高分。
我們也親自上手試了試,用不同的 agent,測了點(diǎn)擊式和滑動(dòng)拼圖兩種驗(yàn)證碼。
事先聲明,下面所有操作從打開網(wǎng)頁,到完成驗(yàn)證,全都是 AI 干的,咱可一點(diǎn)沒上手。
結(jié)果你還真別說,點(diǎn)擊式的驗(yàn)證碼根本攔不住它一點(diǎn)。
還有這種滑動(dòng)拼圖,AI 對得比我更快更準(zhǔn),對面完全沒反應(yīng)過來。
好嘛,以前網(wǎng)上總用人機(jī)罵人,現(xiàn)在看來,人機(jī)應(yīng)該是對一個(gè)人類的最高贊賞。
一通操作下來,江江本來覺得這東西都快被 AI 通關(guān)了。連機(jī)都攔不住,它到底還有啥存在價(jià)值?
帶著各種疑問,我們聯(lián)系上了國內(nèi)頭部驗(yàn)證碼企業(yè),極驗(yàn)的 CTO 謝強(qiáng)老師,從驗(yàn)證碼的原理、目的、到未來方向來了一個(gè)全方位答疑解惑,發(fā)現(xiàn)驗(yàn)證碼遠(yuǎn)遠(yuǎn)不是表面看起來一道題這么簡單。
聊完以后我發(fā)現(xiàn),么的,還是人類更壞啊。
首先,這一次能不能答對題,看出來對面是人是鬼,其實(shí)并不是最重要的。長遠(yuǎn)來看,成本,才是一切的核心。
就比如初期 AI 模型還沒出現(xiàn)的時(shí)候,黑客那邊破解驗(yàn)證碼,靠的是窮舉法。黑客會通過特定算法去攻擊網(wǎng)站界面,這個(gè)網(wǎng)站的所有驗(yàn)證碼圖像都弄到手。
在得到這些圖像后,黑客就把這些任務(wù)外包出去,找人識別和標(biāo)注。。就是我們常說的打碼工。
古早打碼工界面
折下來,黑客 10 天就能搞掉一個(gè) 30 萬張的圖庫,一分錢一張,成本能控制在四五百。
當(dāng)然,驗(yàn)證系統(tǒng)的防守也很簡單,那就是用成本壓垮黑客。
目前國內(nèi)的驗(yàn)證系統(tǒng),圖庫基本一周一更新,最快的能到 1 小時(shí)更新一次。這個(gè)更新頻率,換天王老子來也吃不消。
這道理,在 AI 時(shí)代其實(shí)也一個(gè)樣,謝強(qiáng)老師告訴我們,目前生成驗(yàn)證碼的成本,遠(yuǎn)低于識別的成本。
自行車、紅綠燈這些現(xiàn)實(shí)派的圖片驗(yàn)證碼,很多大模型基本都能攻克。
但非現(xiàn)實(shí)的內(nèi)容,大模型基本抓瞎。比如謝強(qiáng)老師向我們展示了他們試驗(yàn)的逆天驗(yàn)證碼:把人類的情緒藏到圖片里,用 AI 隨機(jī)生成,成本 1 毛左右,雇人工識別的話,估計(jì)成本則在每張 3 毛錢左右。
硬要用 AI 識別,成本則可能更高,這樣的圖即使收集 10000 張,新 AI 模型也未必學(xué)得明白。
可能只得從頭開始訓(xùn)練個(gè)大模型,但這金錢和時(shí)間成本,不是一般黑客能負(fù)擔(dān)得起的。
而做題只是第一層,系統(tǒng)的第二層,是在后臺還在長期觀察你的 IP。一旦發(fā)現(xiàn) IP 不干凈,立刻升級驗(yàn)證,讓過關(guān)難度超級加倍。
像是下面這個(gè)例子,如果你想看個(gè)劇,點(diǎn)了 20 遍賽博保安還不放你走,那肯定不是因?yàn)轭}答錯(cuò)了。
來源:小紅書@momo
要么是出了 bug,要么是你被打上了 “ 高風(fēng)險(xiǎn)用戶 ” 的標(biāo)簽。
一旦被盯上,輕則每次訪問先來個(gè) 10 道題,限個(gè)流,重則直接 ban IP。雖然被誤傷的良民很冤枉,但攻擊者更沒得選,要么乖乖做題,要么頻繁換 IP、養(yǎng) IP,這代價(jià)是真高。
至于被系統(tǒng)盯上的原因,也有很多種。
舉個(gè)例子,如果用戶打開驗(yàn)證碼用的是一個(gè)馬甲( 比如 Chrome 瀏覽器 ),解決驗(yàn)證碼用的是另一個(gè)馬甲( 比如AI,小程序,APP 掛 ),系統(tǒng)通過 HTTP 交流記錄一看,這對不上啊,就會觸發(fā)被動(dòng),重拳出擊了。
來源:杜克大學(xué)課程海報(bào)
所以說,就算黑客們把驗(yàn)證碼攻克了一遍又一遍,其實(shí)也沒啥問題,能讓攻擊者覺得這門生意不劃算,成本劃不來,那么驗(yàn)證碼的存在,就是有意義的。
不過,現(xiàn)在這些應(yīng)對手段,有時(shí)候傷敵一千,也會自損八百。
做題方面,像是謝強(qiáng)老師搞的這個(gè)碼,直接硬控了我一分鐘。
點(diǎn)擊和右上角相同圖案的選項(xiàng)
等到了用戶那里,每個(gè)人有沒有時(shí)間和耐心去理解做題?反正是我,我大概率原地退出。
但要是老盯著 IP,普普通通的良民,很容易被誤傷。
比如你用的是公共 WiFi,但大伙兒最近都做了同一家公司提供的驗(yàn)證碼。系統(tǒng)那邊看到的就是,這個(gè) IP 頻繁發(fā)了一堆請求,到處亂逛,有點(diǎn)怪哦。
或者手機(jī)信號不穩(wěn)定,明明是同一個(gè)設(shè)備,IP 卻和你的 3/4/5G 一起反復(fù)橫跳,這種也很危險(xiǎn)。
所以,謝強(qiáng)老師認(rèn)為,未來的驗(yàn)證碼發(fā)展方向和業(yè)務(wù)數(shù)據(jù)是分不開的。
通過數(shù)據(jù),區(qū)分良民和狼人,驗(yàn)證碼就不用折磨每一個(gè)人了。
畢竟,黑客破解驗(yàn)證碼要么是為了惡意爬蟲獲取信息,要么就是搶票、刷票。在這樣的場景下它們都有一些共性,要數(shù)次訪問網(wǎng)站或軟件頁面。
像是逛淘寶,我們自己隨便瞎點(diǎn),和爬蟲應(yīng)爬盡爬,帶給服務(wù)器的壓力肯定是不一樣的。
如果每個(gè)系統(tǒng)可以獨(dú)立通過后臺數(shù)據(jù),觀測,計(jì)算每個(gè)用戶給自己帶來的負(fù)擔(dān),精準(zhǔn)區(qū)分出異常用戶,就可以決定要對哪個(gè)用戶進(jìn)行限制或者收費(fèi)訪問,增加他的成本,從而限制攻擊,又不影響正常用戶。
總的來說,這場人機(jī)攻防戰(zhàn)并沒有因?yàn)?AI 的出現(xiàn)而結(jié)束,只是戰(zhàn)場從我們熟悉的幾種驗(yàn)證碼,慢慢轉(zhuǎn)移到了更復(fù)雜的行為分析和成本博弈上。
驗(yàn)證碼只是一個(gè)工具,這個(gè)起源于 1997 年的老東西,未來隨時(shí)也可能因?yàn)?AI 的沖擊,而被替換成其它更有效,無痛的攔截模式。
但驗(yàn)證碼或許會消失,人與機(jī)器的邊界識別將永遠(yuǎn)存在。希望能早點(diǎn)迎接那個(gè)不用再親手證明,我是人的時(shí)代吧。
撰文:莫莫莫甜甜
編輯:江江 & 面線
美編:萱萱
圖片、資料來源:
感謝極驗(yàn)謝強(qiáng)老師的耐心回答!
Reddit、小紅書
RoundTable
https://users.cs.duke.edu/~zzy/file/captcha_poster_nsdi15.pdf
來源 | 差評X.PIN (ID:chaping123)
未經(jīng)授權(quán),禁止二次轉(zhuǎn)載,如有需要聯(lián)系原公眾號
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.