網易首頁 > 網易號 > 正文申請入駐

最強Claude意外泄露！完勝Opus 4.6，代號「卡皮巴拉」，奧特曼又要睡不著了

2026-03-28 00:12:21　來源: AppSo

廣東舉報

分享至

就在剛剛，Anthropic 泄露了一個從未公開過的新模型。

沒有小道消息鋪墊，沒有「知情人士透露」的前戲，Anthropic 自己的 CMS 數據庫忘了關權限，近 3000 份內部文件直接躺在公網上，被《Fortune》記者翻了個底朝天。

劍橋大學網絡安全研究員 Alexandre Pauwels 受邀驗證了這批材料的真實性和規模。Anthropic 發言人隨后向《Fortune》確認：模型確實存在。

https://m1astra-mythos.pages.dev/

這個模型叫 Claude Mythos，內部代號 Capybara（卡皮巴拉）。

它跳過了 Opus 升級版的劇本，跳過了 Sonnet 換皮的套路，直接開辟了一個凌駕于 Opus 之上的全新第四層級。Anthropic 自己在草稿里的原話：「Mythos 是一個全新層級模型的名字，比我們的 Opus 模型更大、更智能。在此之前，Opus 一直是我們最強大的模型。」

如果你覺得 Claude Opus 4.6 已經夠猛了，那 Mythos 就是 Anthropic 在說：那只是熱身。

Opus 之上，到底強了多少

Anthropic 現有產品線是三層結構：Haiku 最輕最快，適合輕量任務；Sonnet 居中，性價比之選；Opus 最大最強，重型推理擔當。這個框架從 Claude 3 時代延續至今，行業里幾乎所有人都默認 Opus 就是 Anthropic 的天花板。

Mythos 把這個天花板掀了。

泄露的草稿博文顯示，與當前最強的 Claude Opus 4.6 相比，Mythos 在多個核心領域取得了「顯著更高的分數」。至少覆蓋了三大方向：

軟件編程。這是當前 AI 模型競爭最白熱化的戰場。Claude Opus 4.6 本身已經是公認的編程最強模型之一，而 Mythos 在編程基準上進一步拉開了差距。對于每天用 Claude 寫代碼的開發者來說，這意味著一個量級的躍升，不是小數點后面的微調。

學術推理。數學、科學、邏輯推理，這些考驗模型「深度思考」能力的硬骨頭，Mythos 同樣顯著領先。草稿中特意把「學術推理」作為獨立測試維度單獨拎出來講，說明 Anthropic 對這個方向的突破底氣很足。

網絡安全。這是最炸裂的部分。

草稿博文中有一段話，措辭之重，在 Anthropic 歷來的官方敘事中極為罕見：

盡管 Mythos 目前在網絡安全能力上遠超任何其他 AI 模型，但它預示著即將到來的一波浪潮，屆時模型將能以遠超防御者努力的速度來利用漏洞。

注意用詞：不是「領先」，不是「優于」，是「遠超」。而且這是泄露出來的內部評估，不是市場部寫的宣傳稿，用詞分量完全不同。

Anthropic 發言人在確認 Mythos 存在時，用了兩個定性：「質的飛躍」和「迄今為止最強大的模型」。

過去兩年，AI 模型的競爭一直在同一個量級上貼身肉搏。GPT 系列、Gemini、Claude、Llama，各項基準你追我趕，差距用個位數百分比來量。而 Mythos 暗示的已經不是追趕了，是變道超車。

這大概就是為什么，每次 Anthropic 有大動作，社交媒體上總有人第一時間 @Sam Altman：睡了嗎？

太強了怎么辦？Anthropic 的答案是：先把解藥發出去

一家以「安全第一」立身的 AI 公司，在自己內部文檔里承認造出了一個可能讓攻擊者碾壓防御者的東西。這種坦率在行業里幾乎沒有先例。

于是 Anthropic 做了一個罕見的決定：Mythos 的第一批用戶，不是開發者，不是企業客戶，而是網絡安全防御機構。

邏輯很簡單：如果這個模型的攻擊能力確實如內部評估所言，那在放給所有人之前，得先讓守門的人拿到同樣的武器。毒藥還沒散出去，解藥先到位。

這在 AI 行業的發布史上幾乎沒有先例。OpenAI 發 GPT-4 的時候做過紅隊測試，Google 發 Gemini 做過安全審查，但沒有哪家公司把「安全防御者優先使用」寫進正式的發布路線圖里。

Anthropic 這么做，要么是真的被自己造出來的東西嚇到了，要么是在用一種極其高明的方式給 Mythos 的能力背書。又或者兩者兼有。

與此同時，Mythos 的運行成本是另一個現實問題。草稿坦承「服務成本非常昂貴」，需要大幅優化效率才會考慮面向大眾。翻譯一下：這只卡皮巴拉目前是實驗室里的珍稀品種，想讓它走進千家萬戶的聊天窗口，Anthropic 還得先把飼養成本打下來。

但信號已經出去了。當競爭對手還在為 Opus 級別的模型絞盡腦汁時，Anthropic 已經在討論 Opus 之上的東西該怎么安全地放出來了。

兩家公司，撞上同一只卡皮巴拉

每個大模型都有內部代號。GPT-4 叫過 Arrakis，Google 用寶石命名。而 Anthropic 給有史以來最強模型取的代號，是一只卡皮巴拉，就是那個在互聯網上以「呆萌臉 + 跟誰都能和平共處」聞名的 meme 之王。

怎么實錘的？泄露的博客有兩個版本。V1 通篇用「Mythos」，V2 把每一個「Mythos」都替換成了「Capybara」，連文中每處引用都做了對應修改。說明這個模型在 Anthropic 內部相當長時間里就叫「卡皮巴拉」，「Mythos」是后來包裝出來的發布名。

但 AI 圈最知名的卡皮巴拉 IP 早就有主了。阿里通義千問 Qwen 的吉祥物就是卡皮巴拉，社區里到處是卡皮巴拉頭像和周邊，品牌認知度拉滿。

所以當 Mythos 的代號被曝光，社交媒體直接炸了。而全場最佳來自千問前技術負責人林俊旸親自現身評論區，只留了一句：

「capybara? seriously?」

兩家爭奪 AI 王座的公司，不約而同看上了同一只呆頭呆腦的大嚙齒目。2026 年 AI 圈最有喜劇張力的一幕，大概就是這了。

最低級的配置錯誤扒了底褲

最后聊聊這次泄露本身，因為它的荒誕程度值得單獨說。

Anthropic 把原因歸結為「外部 CMS 工具中的人工配置錯誤」，同時特意強調跟 Claude、Cowork 或任何 AI 工具無關。后半句的急切耐人尋味：最近多家科技公司因 AI 生成代碼引發技術事故頻頻上新聞，而 Anthropic 恰恰是那個最高調宣傳用 Claude Code 自動化內部流程的公司。「不是 AI 干的」，他們顯然覺得有必要把這句話說清楚。

技術本質很簡單。劍橋研究員指出，CMS 系統中上傳的所有資產默認公開，除非手動設為私密。Anthropic 忘了點那個開關。和 AWS S3 存儲桶忘關權限一個性質的低級失誤，有充分文檔記錄，完全可以預防。

一家正在造有史以來最強網絡安全 AI 的公司，被最基礎的權限配置疏忽扒了個精光。你很難想出比這更諷刺的劇本。

同一批文件里還藏著一場閉門 CEO 峰會的細節：計劃在英國一處 18 世紀鄉間莊園酒店舉辦，Anthropic CEO Dario Amodei 將出席，對象是歐洲大型企業掌門人。一場精心策劃的高端商務社交，就這樣和產品草稿一起被晾在了陽光下。

Anthropic 發言人的回應是：「這些只是考慮發布的早期草稿，不涉及核心基礎設施、AI 系統、客戶數據或安全架構。」

技術上沒錯。但當你的「早期草稿」里白紙黑字寫著這個模型可能引發「AI 驅動的漏洞利用浪潮」，這就已經不是一次普通的內容泄露了。

泄露本身的戲劇性是其次，關鍵在于它無意間撕開了一個行業一直在回避的問題：當模型強大到連造它的人都需要先給自己買保險，我們到底該興奮還是該緊張？

過去兩年，AI 公司的發布節奏像軍備競賽，每家都在說自己更快更強更安全。但 Mythos 的泄露文檔里，罕見地出現了一種不同的語氣：「我們造出了一個自己都需要小心對待的東西」。

有人會說，這不過是 Anthropic 的另一種營銷，用「太強了所以要謹慎」來制造稀缺感。

也許吧。但如果你讀過那些草稿原文就會發現，那種措辭的分量不像是市場部能寫出來的。當一家公司在內部文檔里承認自己的產品「預示著一波 AI 驅動的漏洞利用浪潮」，這要么是史上最大膽的營銷，要么就是真話。

而這一切，只是因為有人忘了在 CMS 后臺點一個「設為私密」的按鈕。

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」（請隨簡歷附上項目/作品或相關鏈接）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.