網易首頁 > 網易號 > 正文 申請入駐

光速打臉!剛嘲諷完 Anthropic,Sam Altman 連夜祭出自家「AI 黑客」

0
分享至

來源:市場資訊

(來源:AI信息Gap)

Sam Altman 又官宣了。

4 月 30 日,他深夜發文,「一個全新的網絡安全模型 GPT-5.5-Cyber 將會在幾天內推送給關鍵的網絡防御者!


幾乎同一時間,Anthropic 的 Claude Security(一款安全掃描工具)向企業用戶開放公測,之前是內部預覽階段。


兩個 AI 巨頭,把目光同時對準了網絡安全。

英國 AI 安全研究所(AISI)測試了 95 道網安任務,專家級通過率,GPT-5.5 71.4%,Claude Mythos Preview 68.6%。AISI 在博客里寫道,「GPT-5.5 可能是他們測過的最強模型!

其中一個任務,人類專家平均要 12 小時。GPT-5.5 用了 11 分鐘,花費 1.73 美元。

關鍵不是 71.4% 這個數字。關鍵是,這還是第一次有模型追上 Mythos。

Mythos 是 Anthropic 4 月 7 日發布的「AI 核武器」,定位是比 Claude Opus 系列更強一層的模型。

Anthropic 披露過幾組內部數據。Mythos 運行 1000 次,燒了不到 2 萬美元,挖出了 OpenBSD 里 27 年沒人發現的 TCP SACK 零日漏洞。它還自主完成了 FreeBSD 17 年遠程代碼執行漏洞的全套利用流程。

在與 Mozilla 合作的 Firefox 漏洞測試里,Opus 4.6 試了幾百次,僅成功 2 次。Mythos 成功 181 次,并實現 29 次寄存器控制。Mozilla 后來用它修補了 271 個 Firefox 漏洞。


Anthropic 自己給 Mythos 貼的標簽是「太危險,不能公開」。

不到兩個月,OpenAI 就拿出了同等水平的模型。

GPT-5.5-Cyber 不是 OpenAI 的第一個安全模型。

4 月 14 日,他們已經發布過一版 GPT-5.4-Cyber,主打二進制反編譯。不要源代碼就能審計編譯后的軟件,查找漏洞、惡意軟件、依賴污染。GPT-5.5-Cyber 在它之上更進一步。

它屬于 OpenAI 的「信任接入」(Trusted Access for Cyber)計劃。這個計劃 2 月上線,已經簽下來一大批企業客戶,包括貝萊德、花旗、思科、Cloudflare、CrowdStrike、英偉達、Oracle 等。

OpenAI 給 GPT-5.5 做安全評估時,把 GPT-5.5 評成網絡安全「High」級。

也就是,能力很強,但還沒到 Critical 閾值。

同一天,Anthropic 把 Claude Security 轉入了公開測試。

之前叫 Claude Code Security,2 月開啟內部預覽,幾百家公司在用。這次正式改名 Claude Security,面向 Claude 企業客戶開放,Team 和 Max 用戶即將跟進。


Claude Security 沒有繼承 Mythos。底層模型是 Opus 4.7。

它的工作流并不復雜。掃描代碼庫,多階段驗證降低誤報,然后生成一份附帶置信度的修復方案。再加上 Slack/Jira webhook、定時掃描、CSV 導出功能。

Claude Security 的合作名單和上面 OpenAI 那份名單幾乎完全重合。

Anthropic 在產品博客里這樣寫道。

「現在的模型已經能在代碼里找漏洞。下一代會更強,能自己利用漏洞!

這話更像是在打預防針。

回頭看 AISI 那份報告。

95 道 CTF(奪旗賽)任務,覆蓋逆向工程、Web 攻擊、密碼學。

還有一道測試叫「The Last Ones」(TLO)。32 步企業內網攻擊模擬,從一臺沒憑證的攻擊機起步,要打穿四層子網、20 多臺主機,繞過自動化部署、跨網段橫移,最后偷走一個內部數據庫的數據。人類專家平均需要 20 小時。

Mythos 是第一個完整跑完 TLO 的模型,10 次有 3 次成功。

GPT-5.5,10 次有 2 次成功。


AISI 說,專家級任務上 GPT-5.5 可能是他們測過的最強模型,但優勢仍在誤差范圍內。

Mythos 最近還出過一個意外。

4 月 21 日,Bloomberg 報道,在一個私有的 Discord 頻道里,幾個用戶根據 Anthropic 給其他模型用過的 URL 命名習慣,硬生生猜出了 Mythos 的部署位置。然后通過一個第三方承包商的內部門戶,拿到了訪問權。

整件事里,雖然 Anthropic 自家系統沒被攻破,但供應商那邊掉鏈子了。

Mythos 沒有公開開放。

它只通過 Anthropic 4 月 7 日啟動的 Project Glasswing 開放。12 家合作伙伴外加 40 多家關鍵基礎設施組織拿到了訪問權限,包括 AWS、蘋果、谷歌、微軟、思科、英偉達、博通等。Anthropic 準備了 1 億美元的模型調用額度。

搞得這么神秘,最后還是泄露了。

Anthropic 的新模型也已經在路上。

據爆料 Anthropic 已經開始通過紅隊測試一個新模型,代號 claude-jupiter-v1-p。


去年這個時候,他們用過一次行星代號 Neptune,幾周后就發布了 Claude 4 全家桶模型。

Jupiter 大概率就是下一代主力。

順便一提。5 月 6 日,Anthropic 在舊金山舉辦「Code with Claude」開發者大會。

4 月 21 日,Sam Altman 參加 Ashlee Vance 的 Core Memory 播客時,瘋狂嘲諷。

「這套營銷(Mythos)做得很厲害。我們造了顆炸彈,馬上要扔到你頭上。但我們能賣你一個 1 億美元的避難所!

「炸彈」指的是 Mythos 的漏洞挖掘能力,「避難所」指的是 Project Glasswing 的付費合作模式。明顯吐槽 Anthropic 先把你唬住,再把解藥賣給你。

然而 9 天后,他自己也開始把模型只開放給「關鍵的網絡防御者」。

我是木易,Top2 + 美國 Top10 CS 碩,現在是 AI 產品經理。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
底層人遇事靠拳頭,中層人做事看人情世故,上層人只死磕這三件事

底層人遇事靠拳頭,中層人做事看人情世故,上層人只死磕這三件事

卡西莫多的故事
2026-04-15 09:55:30
遼寧丹東8死車禍后續!知情人曝內情,核載6人竟硬生生擠了21人

遼寧丹東8死車禍后續!知情人曝內情,核載6人竟硬生生擠了21人

奇思妙想草葉君
2026-05-04 22:48:40
吃他汀不想肝損傷,記住4個時間、記住5不要,幫你避免肝臟受損

吃他汀不想肝損傷,記住4個時間、記住5不要,幫你避免肝臟受損

健康之光
2026-05-04 15:10:05
新一輪降雨6日再來,連下3輪,雨水或持續12天,雙臺風胚胎生成

新一輪降雨6日再來,連下3輪,雨水或持續12天,雙臺風胚胎生成

風云圈天氣
2026-05-05 00:36:21
炸了!突發利空!全線跳水!

炸了!突發利空!全線跳水!

龍行天下虎
2026-05-04 18:39:10
曼聯達成驚人協議:巴西球星將缺席賽季末比賽

曼聯達成驚人協議:巴西球星將缺席賽季末比賽

綠茵情報局
2026-05-05 03:51:39
沃克和嬌妻近照,離開森林狼一戰成名,6400萬超值,妻子性感美女

沃克和嬌妻近照,離開森林狼一戰成名,6400萬超值,妻子性感美女

大西體育
2026-05-04 23:04:07
高鐵上偶遇奚夢瑤婆婆賭王四太梁安琪本人個子不高黑黑瘦瘦不年輕

高鐵上偶遇奚夢瑤婆婆賭王四太梁安琪本人個子不高黑黑瘦瘦不年輕

TVB的四小花
2026-05-05 00:13:33
熱議李金羽下課:有點突然,鎮不住遼寧這些人;徐正源有鐵血氣質

熱議李金羽下課:有點突然,鎮不住遼寧這些人;徐正源有鐵血氣質

懂球帝
2026-05-04 18:24:14
身體這處毛發變白,暗示活得不長?看看你白了沒有

身體這處毛發變白,暗示活得不長?看看你白了沒有

芹姐說生活
2026-05-03 23:09:24
“窮人炫富,難掩心酸!”男大學生炫耀坐高鐵一等座,因長相被嘲

“窮人炫富,難掩心酸!”男大學生炫耀坐高鐵一等座,因長相被嘲

妍妍教育日記
2026-04-24 09:05:03
堅持下嫁的女生們現在過得怎樣?網友:炸出來一窩千萬富婆

堅持下嫁的女生們現在過得怎樣?網友:炸出來一窩千萬富婆

帶你感受人間冷暖
2026-05-05 02:22:09
賴清德開始返臺?國王專機隱藏信息后起飛,機場方:離開時很低調

賴清德開始返臺?國王專機隱藏信息后起飛,機場方:離開時很低調

奇思妙想生活家
2026-05-05 00:35:07
特朗普氣死了!!下周要訪華,74個美國議員先聯手發難

特朗普氣死了!!下周要訪華,74個美國議員先聯手發難

愛看劇的阿峰
2026-05-04 23:46:38
西紅柿5片葉和6片葉差別這么大!老菜農私藏技巧,再也不買錯

西紅柿5片葉和6片葉差別這么大!老菜農私藏技巧,再也不買錯

開心美食白科
2026-05-02 05:04:18
無人機禁飛之后,大量北京網友低價進行甩賣

無人機禁飛之后,大量北京網友低價進行甩賣

映射生活的身影
2026-05-02 22:42:01
2-0,3-1!西甲悲喜夜!四隊贏球,積分榜更新,皇馬理論仍可奪冠

2-0,3-1!西甲悲喜夜!四隊贏球,積分榜更新,皇馬理論仍可奪冠

阿晞體育
2026-05-04 05:42:09
請大家做好準備:地方因為缺錢,正在發生很明顯的變化

請大家做好準備:地方因為缺錢,正在發生很明顯的變化

財經保探長
2026-05-02 21:23:41
笑不活了!郭晶晶霍啟剛貴州逛吃被拍,全網炸了這才是豪門天花板

笑不活了!郭晶晶霍啟剛貴州逛吃被拍,全網炸了這才是豪門天花板

可樂談情感
2026-05-04 21:57:52
周啟豪太難了!不僅被王楚欽怒斥去找濕巾,還要給林詩棟指導戰術

周啟豪太難了!不僅被王楚欽怒斥去找濕巾,還要給林詩棟指導戰術

鳳幻洋
2026-05-04 17:16:48
2026-05-05 04:51:00
新浪財經 incentive-icons
新浪財經
新浪財經是一家創建于1999年8月的財經平臺
3101289文章數 7138關注度
往期回顧 全部

科技要聞

在中國市場搞「付費訂閱」,豆包咋想的?

頭條要聞

白宮附近傳出槍聲 1人被執法人員開槍擊中

頭條要聞

白宮附近傳出槍聲 1人被執法人員開槍擊中

體育要聞

騎士破猛龍:加雷特·阿倫的活力

娛樂要聞

張敬軒還是站上了英皇25周年舞臺

財經要聞

魔幻的韓國股市,父母給嬰兒開戶買股票

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

家居
數碼
房產
手機
公開課

家居要聞

靈動實用 生活藝術場

數碼要聞

華碩推出ZenScreen OLED MQ16FC便攜顯示器:16英寸,280歐元起

房產要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

手機要聞

小米17 Max本月發布 小米手機史上最大電池

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版