无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

公開版Mythos上線,Claude最強模型開始分層發售

Claude開屏語

0
分享至

Anthropic終于把Mythos推向了公開市場,但分層發售。

凌晨,Anthropic正式發布Claude Fable 5和Claude Mythos 5。前者面向普通用戶開放,后者則繼續限制在“受信任的安全合作伙伴”范圍內。



新模型的命名可以說很符合Claude一貫的風格。

從Haiku(俳句)到Sonnet(十四行詩)再到Opus(藝術巨著),Anthropic一直在用文學和藝術概念給模型分層,到了Mythos,名字已經從文學作品膨脹到“神話”本身。

Fable來自拉丁語fabula,意思是“被講述之物”,和希臘語mythos同源,直譯過來的話一般被稱為“寓言”。這個名字正如新模型的定位,一個“Mythos級”的模型,一個“公開的神話”。

按照Anthropic的描述,Fable 5和Mythos 5共享同一個底層模型,只是被裝進了更適合公開分發的安全殼里。在官方給出的模型能力上,它們兩個被放在同一個位置。



但跑分歸跑分,如果Fable和Mythos的表現完全一樣,我想應該也不用分成兩個名字了。

01

被改寫的“神話”

神話被改寫、被壓縮、被加上訓誡之后,變成了寓言。

按照官方文檔,Fable 5是公開版本。它面向普通用戶和開發者開放,但在網絡安全、生物、化學以及模型蒸餾等高風險領域,會由額外的安全分類器介入。一旦系統判斷請求可能涉及這些敏感方向,回答就不會由Fable 5繼續完成,而是自動回退到Claude Opus 4.8。

Mythos 5基于同樣的底層模型,但在部分領域解除了Fable 5的護欄。Anthropic稱,Project Glasswing里的網絡安全合作伙伴可以使用“滿血版”Mythos 5;未來,部分生命科學研究者也可能通過受信任訪問計劃,使用解除生物和化學限制的版本。

用不到的Mythos我們暫時不提,先看點實在的東西。

首先是定價,一個字,貴。

Fable 5的定價是輸入10美元/百萬token,輸出50美元/百萬token。開發者現在就可以通過Claude API調用claude-fable-5(模型名)。

這個價格剛好是Opus 4.8的兩倍,和Opus 4.8的fast mode相同,Anthropic顯然把它放在了比Opus更高一檔的價格層級里。

不過Anthropic稱,這一價格不到此前Claude Mythos Preview的一半——但由于Mythos Preview并非公開API模型,官方并未給出面向公眾的標準價,這句話也無從驗證。

訂閱用戶也需要注意,Fable 5不一定會長期直接包含在基礎訂閱包里。

Anthropic在官方說明中提到,6月23日以后,即使用戶已經訂閱Claude,Fable 5也可能根據算力情況按量提供,不一定會直接包含在基礎訂閱服務中。

這公司越來越吝嗇了,不過好歹還留了小半個月試用期。官方也留了一點余地:如果6月23日以后算力資源足夠,Anthropic會盡量把Fable 5繼續包含在Pro、Max等訂閱服務里。



定價高本身并非難以理解,但它最好保證它的能力配得上它的價格。

從跑分上看,Fable 5/Mythos 5基本是Anthropic目前公開表里最強的一檔。

不過官方表格有一個說明,Claude Fable 5和Claude Mythos 5的分數一般只差1–3個百分點(除了帶星號的網絡安全、生物相關測試),所以表里顯示的是兩者更高的分數。這一點很難不讓人想要吐槽。



Anthropic把Fable 5的重點放在幾個方向:軟件工程、知識工作、視覺、長上下文記憶和生命科學研究。

軟件工程是最突出的場景之一,根據表格,Fable/Mythos 5在SWE-Bench Pro上達到80.3%,明顯高于Opus 4.8的69.2%;在更難的FrontierCode Diamond上,它拿到29.3%,而Opus 4.8只有13.4%,GPT-5.5只有5.7%。





知識工作和視覺任務上,Anthropic給出了兩類證據。

一類是標準化benchmark。官方表格顯示,Fable/Mythos 5在GDPval-AA上得分1932,高于Opus 4.8、GPT-5.5和Gemini 3.1 Pro;在GDP.pdf這種帶視覺理解的文檔任務上,它達到29.8%,也超過其他主要模型。

另一類是早期客戶測試。Anthropic稱,Fable 5在Hebbia的高級金融推理基準上取得最高分,優勢集中在文檔推理、圖表和表格理解、問題求解;IMC也反饋,它在交易分析評估中幾乎全面通過。

為了展示Fable 5的視覺能力,Anthropic舉的例子是:此前Claude模型需要復雜輔助工具才能玩《寶可夢 火紅》,而Fable 5只靠視覺輸入就可以通關。



長任務和記憶能力上,Anthropic稱,Fable 5可以在數百萬token的長期任務中保持專注,并利用自己的筆記改進輸出。

在《殺戮尖塔》這類需要連續決策和長期策略的游戲里,如果給Fable 5接入持久文件記憶,讓它能記錄前面的選擇和經驗,它的表現會明顯提升。提升幅度是Opus 4.8的三倍,到達最終關卡的次數也提高了三倍。

順便一提,Fable也是一款經典RPG游戲的名字,中文譯作《神鬼寓言》——或許某天我們能看到Fable玩《Fable》。

另外,網絡安全能力方面,Fable/Mythos 5在ExploitBench Cap%上達到78.0%,超過Claude Mythos Preview的69.0%,接近Opus 4.8的兩倍。

這里用的應該是Mythos 5的得分,因為Fable 5在高風險請求上會回退到Opus 4.8。

02

強大的模型必須分層

Anthropic這次把模型能力的直觀展示放到了一個類似”作品集“的滑頁里,并且每個demo只給了一小段注釋。



比如,Fable 5寫了一個太陽系模擬,從物理第一性原理推導行星軌道運動,并用它預測日食。



又比如,它可以自主玩《異星工廠》。這是一款工程師很愛的工廠自動化游戲,玩家要采集資源、規劃生產線、搭建物流和能源系統。

Anthropic用這個例子說明,Fable 5可以在一個開放環境里制定策略,并持續推進一個復雜系統的建設。



在另一個demo里,Fable 5先做了一個基于瀏覽器的CAD編輯器,然后又使用這個由自己開發的CAD工具,設計了一個可以3D打印的完整模型。這個編輯器里還內置了AI copilot,用來輔助建模。

這個demo的重點在于Fable 5完成了一個閉環:先創造工具,再使用工具,最后完成一個實體設計任務。



最后一個demo,Anthropic展示了一個由Fable 5寫出來的流體模擬,運動節奏和一段古典音樂EDM remix同步。官方還特意提到,音樂也是Fable 5用代碼生成的。



這些案例看起來挺花哨,但意思是一樣的:Fable 5很擅長把代碼、視覺、物理、設計和長期規劃混在一起做任務。

如果說這部分展示的還是Fable 5在開發者手里能做到什么程度,后面的部分說的就是Mythos 5在研究者手里能做什么——以及Anthropic為什么要把Fable和Mythos分開。

Anthropic稱,在內部蛋白設計專家的評估中,Mythos 5把藥物設計流程中的部分環節加速了大約10倍。其中一個案例里,Mythos 5接入蛋白設計和生物信息學工具、沒有人類幫助,就可以匹配甚至超過熟練人類操作員。

在該任務中,Mythos 5做的不是簡單問答,而是完成一整套科學工作流:選擇結合位點,選擇并運行蛋白設計工具,在失敗后自己恢復。官方稱,在這項研究的14個蛋白靶點中,有9個產生了強候選分子,目前正在進一步研究。



Anthropic還提到,Mythos 5可以穩定提出新穎、有吸引力的分子生物學假設。在和Opus級模型的盲測對比中,內部科學家大約80%的時候更偏好Mythos提出的假設,其中一些已經進入實驗評估。

與此同時,Mythos 5的一個關于大腸桿菌蛋白的新機制的假設,在另一家獨立研究同一問題的實驗室的研究中得到了證實。

它甚至還做了一項基因組學研究。

Anthropic稱,Mythos 5在一周多的時間里,幾乎自主完成了一項新的基因組學研究。它整理了橫跨138種動物、數百萬個細胞的單細胞數據,并設計、訓練了一個定制機器學習模型,用來識別不同物種中執行相同角色的細胞。

更夸張的是,Anthropic稱,Mythos 5訓練出的模型性能超過了近期發表在《Science》上的一個模型,盡管它的規模只有后者的百分之一。Anthropic表示,計劃在未來幾個月發表這些結果。

當然,這部分還需要等待論文和外部復核。但如果只看Anthropic官方給出的信息,Mythos 5在生命科學里展示的能力已經接近科研Agent:能讀問題、用工具、處理數據、訓練模型、提出假設,并把一項研究推進到可以發表的程度。

而一旦模型可以在藥物設計、病毒載體、蛋白設計、基因組學研究這些方向里真正推進任務,它就天然具備雙重用途。

可以認為,生命科學這部分不是Fable 5的普通功能演示,而是Mythos 5的能力上限展示。

但它被展示出來,是為了說明Anthropic手里的這套底層模型,已經強到了必須通過受信任訪問來分發。

有意思的是,過去的模型發布更像是一件技術產品的事:參數、跑分、價格、上下文長度、API名稱。強就是強,發布就是發布。

但到了Mythos這里,事情開始變得復雜。同一個底層模型被分為兩個版本,普通用戶拿到的是Fable 5,安全研究者和部分生命科學研究者拿到的是Mythos 5;前者被裝進更嚴格的護欄里,后者則需要受信任訪問。

模型能力不再只有高低之分,也開始有權限、場景和責任之分。

某種意義上來講,可以看作前沿模型商業化進入新階段的信號——越強的模型,越不可能直接扔給所有人。它們會被拆成不同版本,放進不同安全邊界,再交給不同類型的用戶。

Anthropic先這么做了,因為它們的模型“強到不能完全公開”。未來其它想要講故事的公司,想要證明自己的模型也很強,或許也會效仿這種方式。(作者/袁心玥)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
10人打9人!世界杯瘋狂一戰:揭幕戰3紅=史無前例 23次犯規太慘烈

10人打9人!世界杯瘋狂一戰:揭幕戰3紅=史無前例 23次犯規太慘烈

侃球熊弟
2026-06-12 03:21:02
戰略金屬,爆出重大利好!

戰略金屬,爆出重大利好!

君臨財富
2026-06-11 16:02:45
市委常委會舉行會議:堅決擁護黨中央決定,堅定不移推動全面從嚴治黨向縱深發展

市委常委會舉行會議:堅決擁護黨中央決定,堅定不移推動全面從嚴治黨向縱深發展

縱相新聞
2026-06-11 17:30:13
“礙于總統身份,我一直在克制,但他們太過分了”

“礙于總統身份,我一直在克制,但他們太過分了”

環球時報國際
2026-06-11 14:32:34
深度? 特朗普“用炸彈談判”,伊朗再“關”霍爾木茲:美伊爭的究竟是什么?

深度? 特朗普“用炸彈談判”,伊朗再“關”霍爾木茲:美伊爭的究竟是什么?

上觀新聞
2026-06-11 21:08:54
四個號,一家親:國際足聯把飯喂到嘴邊,國足用四個“零蛋”證明

四個號,一家親:國際足聯把飯喂到嘴邊,國足用四個“零蛋”證明

民間胡扯老哥
2026-06-11 10:34:23
北京的男男女女為什么一直不結婚?原來有這樣一個完美的閉環

北京的男男女女為什么一直不結婚?原來有這樣一個完美的閉環

回旋鏢
2026-06-11 19:45:32
“好吃到不對勁!”消費者因餅干太好吃而引發懷疑,配料表完全對不上!當地市監局介入

“好吃到不對勁!”消費者因餅干太好吃而引發懷疑,配料表完全對不上!當地市監局介入

新浪財經
2026-06-11 16:07:36
35歲墨西哥中鋒激動落淚 4戰世界杯終獲首球 6年前頭部重傷險喪命

35歲墨西哥中鋒激動落淚 4戰世界杯終獲首球 6年前頭部重傷險喪命

我愛英超
2026-06-12 05:37:01
于東來稱薪資上太溺愛員工,其實不值這么多錢

于東來稱薪資上太溺愛員工,其實不值這么多錢

界面新聞
2026-06-11 17:55:06
紐約球迷朝文班扔雞蛋!G4逆轉后瘋狂鬧事:56人被捕10名警員受傷

紐約球迷朝文班扔雞蛋!G4逆轉后瘋狂鬧事:56人被捕10名警員受傷

羅說NBA
2026-06-12 05:57:40
特朗普稱取消打擊伊朗行動 納指拉升漲超2%、美油跳水跌3.5%

特朗普稱取消打擊伊朗行動 納指拉升漲超2%、美油跳水跌3.5%

財聯社
2026-06-12 01:49:10
世界杯揭幕戰:3張紅牌!墨西哥2-0南非 打破76年魔咒 8萬人嗨翻

世界杯揭幕戰:3張紅牌!墨西哥2-0南非 打破76年魔咒 8萬人嗨翻

侃球熊弟
2026-06-12 03:56:11
兩年前專家都說他會毀掉阿根廷,如今數據打臉

兩年前專家都說他會毀掉阿根廷,如今數據打臉

斌聞天下
2026-06-11 07:00:07
大博阿滕:我曾經與女友每周纏綿至少七八次,上場后雙腿無力

大博阿滕:我曾經與女友每周纏綿至少七八次,上場后雙腿無力

懂球帝
2026-06-11 10:02:52
歷史罕見信號全部重合!這次不是回調,是全球性大危機要來了

歷史罕見信號全部重合!這次不是回調,是全球性大危機要來了

流蘇晚晴
2026-06-11 14:24:06
天津港進口豪華車崩盤,曾有礦老板提著百萬現金買車

天津港進口豪華車崩盤,曾有礦老板提著百萬現金買車

第一財經資訊
2026-06-11 14:21:47
國際足聯主席都看不下去了,美加墨世界杯會成為最糟糕的世界杯嗎

國際足聯主席都看不下去了,美加墨世界杯會成為最糟糕的世界杯嗎

二大爺觀世界
2026-06-11 17:54:34
養路費改革:油價降0.8元/升,新能源車0.12元/公里,誰受益?

養路費改革:油價降0.8元/升,新能源車0.12元/公里,誰受益?

周哥一影視
2026-06-11 14:15:11
私生活混亂,從央視主持到勞改犯,如今靠直播打賞討生活

私生活混亂,從央視主持到勞改犯,如今靠直播打賞討生活

素衣讀史
2026-06-11 21:56:30
2026-06-12 06:47:00
字母榜 incentive-icons
字母榜
讓未來不止于大。
2534文章數 8065關注度
往期回顧 全部

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

頭條要聞

中方對菲國防部長特奧多羅及其親屬實施制裁

頭條要聞

中方對菲國防部長特奧多羅及其親屬實施制裁

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

《花少8》陣容大揭秘!秒殺前一季

財經要聞

干細胞生意:17萬一針的希望

汽車要聞

將搭云輦-M智能磁流變懸架 方程豹方程S系列信息曝光

態度原創

房產
家居
手機
公開課
軍事航空

房產要聞

科城·美林學筑5月領跑崖州灣:成交價、銷售套數、轉化率三項第一

家居要聞

空間微調 移形換境

手機要聞

華為鴻蒙HarmonyOS 6.1.0.125再曝新特性,模式切換應用不關閉

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普召開戰情室會議討論對伊朗軍事行動

無障礙瀏覽 進入關懷版