網易首頁 > 網易號 > 正文 申請入駐

最強Claude意外泄露!完勝Opus 4.6,代號「卡皮巴拉」,奧特曼又要睡不著了

0
分享至

就在剛剛,Anthropic 泄露了一個從未公開過的新模型。

沒有小道消息鋪墊,沒有「知情人士透露」的前戲,Anthropic 自己的 CMS 數據庫忘了關權限,近 3000 份內部文件直接躺在公網上,被《Fortune》記者翻了個底朝天。

劍橋大學網絡安全研究員 Alexandre Pauwels 受邀驗證了這批材料的真實性和規模。Anthropic 發言人隨后向《Fortune》確認:模型確實存在。


https://m1astra-mythos.pages.dev/

這個模型叫 Claude Mythos,內部代號 Capybara(卡皮巴拉)。

它跳過了 Opus 升級版的劇本,跳過了 Sonnet 換皮的套路,直接開辟了一個凌駕于 Opus 之上的全新第四層級。Anthropic 自己在草稿里的原話:「Mythos 是一個全新層級模型的名字,比我們的 Opus 模型更大、更智能。在此之前,Opus 一直是我們最強大的模型。」

如果你覺得 Claude Opus 4.6 已經夠猛了,那 Mythos 就是 Anthropic 在說:那只是熱身。

Opus 之上,到底強了多少

Anthropic 現有產品線是三層結構:Haiku 最輕最快,適合輕量任務;Sonnet 居中,性價比之選;Opus 最大最強,重型推理擔當。這個框架從 Claude 3 時代延續至今,行業里幾乎所有人都默認 Opus 就是 Anthropic 的天花板。

Mythos 把這個天花板掀了。

泄露的草稿博文顯示,與當前最強的 Claude Opus 4.6 相比,Mythos 在多個核心領域取得了「顯著更高的分數」。至少覆蓋了三大方向:

軟件編程。 這是當前 AI 模型競爭最白熱化的戰場。Claude Opus 4.6 本身已經是公認的編程最強模型之一,而 Mythos 在編程基準上進一步拉開了差距。對于每天用 Claude 寫代碼的開發者來說,這意味著一個量級的躍升,不是小數點后面的微調。

學術推理。 數學、科學、邏輯推理,這些考驗模型「深度思考」能力的硬骨頭,Mythos 同樣顯著領先。草稿中特意把「學術推理」作為獨立測試維度單獨拎出來講,說明 Anthropic 對這個方向的突破底氣很足。

網絡安全。 這是最炸裂的部分。


草稿博文中有一段話,措辭之重,在 Anthropic 歷來的官方敘事中極為罕見:

盡管 Mythos 目前在網絡安全能力上遠超任何其他 AI 模型,但它預示著即將到來的一波浪潮,屆時模型將能以遠超防御者努力的速度來利用漏洞。

注意用詞:不是「領先」,不是「優于」,是「遠超」。而且這是泄露出來的內部評估,不是市場部寫的宣傳稿,用詞分量完全不同。

Anthropic 發言人在確認 Mythos 存在時,用了兩個定性:「質的飛躍」 和 「迄今為止最強大的模型」。

過去兩年,AI 模型的競爭一直在同一個量級上貼身肉搏。GPT 系列、Gemini、Claude、Llama,各項基準你追我趕,差距用個位數百分比來量。而 Mythos 暗示的已經不是追趕了,是變道超車。

這大概就是為什么,每次 Anthropic 有大動作,社交媒體上總有人第一時間 @Sam Altman:睡了嗎?

太強了怎么辦?Anthropic 的答案是:先把解藥發出去

一家以「安全第一」立身的 AI 公司,在自己內部文檔里承認造出了一個可能讓攻擊者碾壓防御者的東西。這種坦率在行業里幾乎沒有先例。

于是 Anthropic 做了一個罕見的決定:Mythos 的第一批用戶,不是開發者,不是企業客戶,而是網絡安全防御機構。

邏輯很簡單:如果這個模型的攻擊能力確實如內部評估所言,那在放給所有人之前,得先讓守門的人拿到同樣的武器。毒藥還沒散出去,解藥先到位。

這在 AI 行業的發布史上幾乎沒有先例。OpenAI 發 GPT-4 的時候做過紅隊測試,Google 發 Gemini 做過安全審查,但沒有哪家公司把「安全防御者優先使用」寫進正式的發布路線圖里。

Anthropic 這么做,要么是真的被自己造出來的東西嚇到了,要么是在用一種極其高明的方式給 Mythos 的能力背書。又或者兩者兼有。

與此同時,Mythos 的運行成本是另一個現實問題。草稿坦承「服務成本非常昂貴」,需要大幅優化效率才會考慮面向大眾。翻譯一下:這只卡皮巴拉目前是實驗室里的珍稀品種,想讓它走進千家萬戶的聊天窗口,Anthropic 還得先把飼養成本打下來。

但信號已經出去了。當競爭對手還在為 Opus 級別的模型絞盡腦汁時,Anthropic 已經在討論 Opus 之上的東西該怎么安全地放出來了。

兩家公司,撞上同一只卡皮巴拉

每個大模型都有內部代號。GPT-4 叫過 Arrakis,Google 用寶石命名。而 Anthropic 給有史以來最強模型取的代號,是一只卡皮巴拉,就是那個在互聯網上以「呆萌臉 + 跟誰都能和平共處」聞名的 meme 之王。

怎么實錘的?泄露的博客有兩個版本。V1 通篇用「Mythos」,V2 把每一個「Mythos」都替換成了「Capybara」,連文中每處引用都做了對應修改。說明這個模型在 Anthropic 內部相當長時間里就叫「卡皮巴拉」,「Mythos」是后來包裝出來的發布名。


但 AI 圈最知名的卡皮巴拉 IP 早就有主了。阿里通義千問 Qwen 的吉祥物就是卡皮巴拉,社區里到處是卡皮巴拉頭像和周邊,品牌認知度拉滿。

所以當 Mythos 的代號被曝光,社交媒體直接炸了。而全場最佳來自千問前技術負責人林俊旸親自現身評論區,只留了一句:

「capybara? seriously?」

兩家爭奪 AI 王座的公司,不約而同看上了同一只呆頭呆腦的大嚙齒目。2026 年 AI 圈最有喜劇張力的一幕,大概就是這了。


最低級的配置錯誤扒了底褲

最后聊聊這次泄露本身,因為它的荒誕程度值得單獨說。

Anthropic 把原因歸結為「外部 CMS 工具中的人工配置錯誤」,同時特意強調跟 Claude、Cowork 或任何 AI 工具無關。后半句的急切耐人尋味:最近多家科技公司因 AI 生成代碼引發技術事故頻頻上新聞,而 Anthropic 恰恰是那個最高調宣傳用 Claude Code 自動化內部流程的公司。「不是 AI 干的」,他們顯然覺得有必要把這句話說清楚。

技術本質很簡單。劍橋研究員指出,CMS 系統中上傳的所有資產默認公開,除非手動設為私密。Anthropic 忘了點那個開關。和 AWS S3 存儲桶忘關權限一個性質的低級失誤,有充分文檔記錄,完全可以預防。

一家正在造有史以來最強網絡安全 AI 的公司,被最基礎的權限配置疏忽扒了個精光。你很難想出比這更諷刺的劇本。

同一批文件里還藏著一場閉門 CEO 峰會的細節:計劃在英國一處 18 世紀鄉間莊園酒店舉辦,Anthropic CEO Dario Amodei 將出席,對象是歐洲大型企業掌門人。一場精心策劃的高端商務社交,就這樣和產品草稿一起被晾在了陽光下。


Anthropic 發言人的回應是:「這些只是考慮發布的早期草稿,不涉及核心基礎設施、AI 系統、客戶數據或安全架構。」

技術上沒錯。但當你的「早期草稿」里白紙黑字寫著這個模型可能引發「AI 驅動的漏洞利用浪潮」,這就已經不是一次普通的內容泄露了。

泄露本身的戲劇性是其次,關鍵在于它無意間撕開了一個行業一直在回避的問題:當模型強大到連造它的人都需要先給自己買保險,我們到底該興奮還是該緊張?

過去兩年,AI 公司的發布節奏像軍備競賽,每家都在說自己更快更強更安全。但 Mythos 的泄露文檔里,罕見地出現了一種不同的語氣:「我們造出了一個自己都需要小心對待的東西」。

有人會說,這不過是 Anthropic 的另一種營銷,用「太強了所以要謹慎」來制造稀缺感。

也許吧。但如果你讀過那些草稿原文就會發現,那種措辭的分量不像是市場部能寫出來的。當一家公司在內部文檔里承認自己的產品「預示著一波 AI 驅動的漏洞利用浪潮」,這要么是史上最大膽的營銷,要么就是真話。

而這一切,只是因為有人忘了在 CMS 后臺點一個「設為私密」的按鈕。

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
創業板指跌逾2% AI硬件、軟件領跌

創業板指跌逾2% AI硬件、軟件領跌

財聯社
2026-04-24 10:10:06
戈貝爾又封鎖約基奇!森林狼力擒掘金,系列賽2-1

戈貝爾又封鎖約基奇!森林狼力擒掘金,系列賽2-1

體壇周報
2026-04-24 12:28:43
加拉塔薩雷官方:即刻起終止與土耳其足協管理層的一切關系

加拉塔薩雷官方:即刻起終止與土耳其足協管理層的一切關系

懂球帝
2026-04-23 18:35:02
這跟不穿有啥區別?好萊塢女星走紐約紅毯,穿衣個個大膽,太前衛

這跟不穿有啥區別?好萊塢女星走紐約紅毯,穿衣個個大膽,太前衛

法老不說教
2026-04-23 19:09:50
太絕了:亞沙會開幕式被外國評論員狂夸!

太絕了:亞沙會開幕式被外國評論員狂夸!

看看新聞Knews
2026-04-23 17:40:03
盯上紅海航道!伊朗戰火下,美國意圖“拉攏”這一非洲小國

盯上紅海航道!伊朗戰火下,美國意圖“拉攏”這一非洲小國

財聯社
2026-04-24 10:02:45
G3輸猛龍!阿特金森直指核心被限制+不滿末節防守,米切爾談攻守

G3輸猛龍!阿特金森直指核心被限制+不滿末節防守,米切爾談攻守

籃球資訊達人
2026-04-24 12:05:27
消失近70年! 2020年, 賀蘭山意外發現, 專家花5年引進6只放歸山林

消失近70年! 2020年, 賀蘭山意外發現, 專家花5年引進6只放歸山林

萬象硬核本尊
2026-04-23 19:04:22
記者:梅西、內馬爾、姆巴佩在巴黎時,更衣室分裂成了幾個幫派

記者:梅西、內馬爾、姆巴佩在巴黎時,更衣室分裂成了幾個幫派

懂球帝
2026-04-24 09:59:08
73歲老人“試住”老年公寓當天猝死,家屬索賠54萬,法院:未簽訂書面合同,公寓適當賠償4.5萬元

73歲老人“試住”老年公寓當天猝死,家屬索賠54萬,法院:未簽訂書面合同,公寓適當賠償4.5萬元

大風新聞
2026-04-23 12:16:07
外資暴跌96%,最高法連夜改規矩,莫迪狂砍蘋果380億,中企敲警鐘

外資暴跌96%,最高法連夜改規矩,莫迪狂砍蘋果380億,中企敲警鐘

丁丁鯉史紀
2026-04-23 13:56:03
內斗嚴重?現在的伊朗到底誰說了算?

內斗嚴重?現在的伊朗到底誰說了算?

極目新聞
2026-04-24 10:40:55
姆巴佩在社交媒體暗戳支持穆里尼奧回歸皇馬后,現任主帥作出回應

姆巴佩在社交媒體暗戳支持穆里尼奧回歸皇馬后,現任主帥作出回應

夜白侃球
2026-04-24 10:51:37
美國高規格邀請俄羅斯參加G20峰會,這說明什么?

美國高規格邀請俄羅斯參加G20峰會,這說明什么?

山河路口
2026-04-23 21:04:50
一夜3大消息!湖人重大利好,衛冕冠軍遭打擊,杜蘭特又添新傷

一夜3大消息!湖人重大利好,衛冕冠軍遭打擊,杜蘭特又添新傷

體壇小李
2026-04-24 07:27:51
霍汶希力挺張敬軒僅6天后續:英皇全藝人遭集體抵制 態度一邊倒

霍汶希力挺張敬軒僅6天后續:英皇全藝人遭集體抵制 態度一邊倒

觀察鑒娛
2026-04-23 12:01:07
爆大冷!西部豪強轟然倒下:全場狂歡慶祝,戈貝爾鎖死約基奇

爆大冷!西部豪強轟然倒下:全場狂歡慶祝,戈貝爾鎖死約基奇

體壇小李
2026-04-24 12:37:36
伊朗接班人面部嚴重燒傷致發聲困難 公開講話被代讀

伊朗接班人面部嚴重燒傷致發聲困難 公開講話被代讀

桂系007
2026-04-23 23:56:56
太慘!被美歐拋棄,走上絕路,宣布破產!

太慘!被美歐拋棄,走上絕路,宣布破產!

李榮茂
2026-04-23 18:33:54
污染源找到,負責人被處理!但河北地下水變紅的關鍵問題還未解決

污染源找到,負責人被處理!但河北地下水變紅的關鍵問題還未解決

社會日日鮮
2026-04-24 07:10:17
2026-04-24 13:07:00
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
6307文章數 26828關注度
往期回顧 全部

科技要聞

剛剛,DeepSeek-V4 預覽版發布 百萬上下文

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

王思聰被綠!戀愛期間女友被金主包養

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

手機
本地
親子
家居
公開課

手機要聞

國產上一代Ultra銷量比比看,華為還是最強,小米第二

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

親子要聞

春天“長高食譜”大戰:是喂養孩子,還是喂養育兒焦慮?

家居要聞

自然肌理 溫潤美學

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版