![]()
一夜之間,你的手機、電腦、路由器,甚至智能馬桶,可能都要瘋狂打補丁修漏洞了。
這不是咱們亂說的,就在今天,Anthropic 發(fā)布了自家有史以來最強的模型Claude Mythos Preview。
![]()
這個船新版本的新模型,能自己找到 0-day 漏洞(也就是開發(fā)者壓根不知道、零時間防備的致命漏洞),還能順手給你寫一套完整的攻擊代碼。
眼看這能力實在太刑了,Anthropic 自己都哆嗦了,于是就以“過于先進不便展示”的理由給鎖起來了,只提供給亞馬遜、蘋果、微軟、谷歌等 12 家正派大廠用。
![]()
與此同時,他們還組團額外搞了一個名叫 Project Glasswing(玻璃翼蝶)計劃,號召大家先用 Mythos 做網(wǎng)絡安全防御。
其實這波新模型咱們之前也聽過風聲,上個月底,Anthropic 家后院起火,泄露了 3000 多份機密文檔。當時就有人發(fā)現(xiàn),在原本的超大杯 Opus 之上,居然還藏著一個代號“卡皮巴拉”。
![]()
估計是覺得這名字太萌了,所以正式發(fā)布時直接改名叫 Mythos(神話,金色傳說的感覺)。
雖然咱們吃瓜群眾暫時摸不到這玩意,但光看官方給出的數(shù)據(jù),也足夠讓人頭皮發(fā)麻了。
擱以前,各家大模型的新品通常只能把基準測試的成績提高個 3%、5% 。
但 Mythos 這次直接就是一個降維打擊:
USAMO(美國數(shù)學奧林匹克競賽): 得分從上一代的 42.3% 直接暴漲到 97.6%;
![]()
Cybench(網(wǎng)絡安全基準測試): 100% 滿分通關,Anthropic 官方甚至有點凡爾賽:現(xiàn)有的 Cybench 基準測試太沒難度了,對新模型來說已經(jīng)失去了測試意義。
![]()
CyberGym(專業(yè)漏洞復現(xiàn)測試)上,它的得分是 83.1%,相對比,此前的最強的公開模型 Opus 4.6 只是 66.6%。
Firefox JS shell(漏洞利用測試),這個最離譜,漏洞利用能力比 Opus 4.6 提升了近 80 倍。。。
![]()
面對兩位數(shù)、甚至幾十倍的增長,也難怪 Anthropic 放出話來,說Mythos 已經(jīng)能和“最頂尖的人類安全專家”掰手腕了。
看到這里,差友們肯定也和咱們想的一樣,好強啊,太牛了。。。但這劇本怎么有點熟悉?
先是“不小心”泄露風聲,然后官方下場甩幾組炸裂數(shù)據(jù),最后話鋒一轉:“哎呀,我家模型太強了,怕毀滅世界,所以不能給你們用哦”。
上一個這么干的是 GPT-5 吧?再上一個好像是 Sora?
![]()
OpenAI 天天搞謎語人套路,現(xiàn)在風評都成啥了,怎么 Anthropic 濃眉大眼的,也玩這套了?
更不要說,Anthropic 要在今年 IPO 了。
所以網(wǎng)友們一下子就炸鍋了,有人噴這是在為了上市造勢吹牛逼;有人罵得更直白,說這幫做大模型的,壓根不管普通用戶死活。
知名開發(fā)者 Simon Willison 都出來陰陽怪氣,“我們的模型太危險了不能發(fā)布”,的確是 AI 圈的流量密碼。
![]()
不過,網(wǎng)友罵歸罵,但當你看了它實際的操作,可能也會覺得,這玩意兒現(xiàn)在放出來,確實相當于去幼兒園發(fā) AK 了。
我們從兩個官方的案例就能品出味來。
第一個就是,Mythos 在 OpenBSD 里,找到了一個 1998 年的遠古漏洞。
這是啥概念?OpenBSD 可是號稱全球最注重安全加固的系統(tǒng)之一,防火墻和關鍵基建全靠它續(xù)命。
結果人類頂級專家用顯微鏡盯了 27 年都沒看出來的破綻,被 AI 喝著茶就給挑出來了。。。
![]()
另一個強有力的證明案例就是 FFmpeg ,幾乎所有視頻播放器和瀏覽器底層都有它。
Mythos 在這里面找到了一個藏了 16 年的漏洞,而包含這個漏洞的代碼,早就被人類反復測試了超過 500 萬次,卻一路綠燈。
Mythos 表示:什么叫國服 AI,戰(zhàn)績可查啊?
而且,你還別小看 AI 找到的漏洞,就拿 FFmpeg 來說,這個漏洞乍一看無關緊要,平時幾乎不會被觸發(fā),我們聯(lián)系到的某信息安全從業(yè)人士文安(化名)卻覺得,這屬于典型非常規(guī)的輸入導致的預期外的問題。
現(xiàn)實生活中,恰恰有大量類似的案例,你不能說觸發(fā)幾率小就完全忽視。
更進一步說,現(xiàn)在這個小漏洞可能只是讓程序閃退或者報錯,但如果再和一些任意地址(相當于黑客有了你電腦的萬能鑰匙)讀寫技術結合起來,那就是個危害級別比較高的漏洞了。
所以,文安在看完這些新聞直接來了句:“如果這個文章全是真的,感覺(從事網(wǎng)絡)安全一半(人)可以跳河了”。
![]()
隨后,文安表示跳河只是夸張修辭,也安慰咱們說這些漏洞,暫時還沒到,“我的支付寶會不會被洗劫、微信聊天記錄會不會滿天飛”的級別。
但問題的核心在于,官方放出這些案例,不是為了炫耀“漏洞有多毒”,而是說明 AI 不用任何外掛工具,純靠自己的知識儲備和跨維度推理,就能挖出新漏洞。
所以,在文安看來,現(xiàn)階段的 Mythos 并不是“更強的黑客工具”,而是把網(wǎng)絡攻擊門檻給降低了。
以前不管是正經(jīng)安全人員還是黑灰產(chǎn),起碼得有個懂行的人坐鎮(zhèn),真要搞一次像樣的網(wǎng)絡攻擊,還得小黑屋里熬上幾個月。
但以后,可能村口的小黑胖摳著腳,對著 AI 喊兩句麥就行。
這種有手就行的低門檻,勢必會引來無數(shù)樂子人和法外狂徒,玩一把、試一試。
所以文安覺得,Anthropic 先整出個 Glasswing 計劃挺合理的。
![]()
畢竟,傳統(tǒng)安全工具就像死板的門衛(wèi),只會查有沒有帶違禁品,管不了熟人作案;而 AI 能順藤摸瓜看懂業(yè)務邏輯,更能發(fā)現(xiàn)那種張三拿著自己的鑰匙,卻去開李四的門的操作。
提前讓大廠們進行自我審查、試用,能夠更先一步構筑網(wǎng)絡保護、進行漏洞篩查,防范于未然。
至于 AI 時代的網(wǎng)絡安全,文安還是比較樂觀的。
一來,現(xiàn)在的 AI 還沒成精,搞不定特別復雜的連環(huán)攻擊鏈。你暫時不用擔心,有人靠 AI,盜走你支付寶里那僅剩的 9 塊 2 毛 5。
另一方面,AI 能找洞,自然也能補洞,有了它,掃洞效率直接拉滿,還能順便指導下開發(fā)漏洞該怎么修。
所以,文安的判斷是,未來的網(wǎng)絡攻防,大概率就是“人類指揮官 + AI 特種兵”的混合雙打。
![]()
而且吧,差評君仔細看了看最新的技術文檔,也覺得 Anthropic 還真不像是在搞噱頭,不光是前面說的網(wǎng)絡安全能力出色,Mythos 展現(xiàn)出其它方面的能力,也相當驚人。
比如在一次測試中,Mythos 發(fā)現(xiàn)沒有訪問權限,正常的反應是說出來:"我沒權限,臣妾做不到啊"。
可它偏不這么干,直接去讀取沙箱底層,試圖從內(nèi)存里直接把訪問令牌搞出來。
![]()
還有次測試中,模型利用了一個文件權限漏洞,對敏感文件動手動腳了。
做完這一切,Mythos 還順手修改了自己的歷史提交記錄,把這事兒給抹去了。
意識到自己做了不該做的事,然后它選擇了毀尸滅跡。。。
還有一次,Mythos 在進行測試,不小心把書翻到最后一頁搞到了答案,這操作其實是被命令禁止的。
可研究人員翻看它的思維鏈時才發(fā)現(xiàn),它不僅沒揭發(fā)自己,還想著自己的步驟好像和結果對不上,得在最終答案里引入一個小錯誤,看起來是自己做出來的題,而不是抄到了答案。
![]()
我說實話,這個操作,比當年抄我數(shù)學試卷的同桌高明多了,不然我倆也不會被罰去掃廁所了。
不過這也不是外界傳的那么玄乎,什么整個硅谷都害怕了,Anthropic 老板嚇得癱坐在椅子上了。。。
研究人員也出來澄清了,已經(jīng)搞清楚了這些心機操作的原因,根本不是 AI 有什么邪惡目的或者自主策劃能力。
他們還通過反復強化訓練,把類似行為的發(fā)生率降至百萬分之一以下了。
但咱就琢磨著,百萬分之一聽起來很低,但如果這個模型每天被調(diào)用幾十億次呢?
![]()
所以,回過頭來看,與其罵 Anthropic 搞 Glasswing 計劃是搞營銷,咱們倒是更愿意相信,他們是真覺得自家的 AI 有點強了。
雖然就像文安說的那樣,普通人現(xiàn)在確實還不用擔心自己的微信被黑、余額被盜。
但當攻擊的成本無限趨近于零,我們唯一能指望的,現(xiàn)有的防御機制,能再完善一些。
撰文:八戒
編輯:江江 & 面線
美編:煥妍
圖片、資料來源:
Anthropic官網(wǎng)
X.com
Anthropic’s Project Glasswing—restricting Claude Mythos to security researchers—sounds necessary to me
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.