无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Claude“神話”模型登場!自主科研成果超《科學》論文水平,token在燃燒

0
分享至


智東西
作者 陳駿達
編輯 李水青

Claude的“神話”級模型,終于上線了!

智東西6月10日報道,今天,Claude正式發布新一代旗艦模型Claude Fable(寓言) 5,以及面向特定機構開放的Claude Mythos(神話) 5。這兩款模型同屬Mythos(神話)級,共享同一個底層模型,能力高于Opus級。Mythos級是Anthropic迄今為止能力最強、綜合性能最高的大模型級別。

Anthropic在技術博客中稱,面向公眾開放的Fable 5在幾乎所有AI能力基準測試中處于頂尖水平,能勝任軟件工程、知識工作、視覺理解、科學研究等多個領域的復雜任務。同時,任務越長、越復雜,Fable 5的優勢就越大。與Opus 4.8、GPT 5.5和Gemini 3.1 Pro相比,Fable 5/Mythos 5稱得上是斷層領先。


▲Fable 5/Mythos 5基準測試成績(圖源:Anthropic)

Anthropic的官方案例顯示,“動手”設計3D打印模型、玩復雜的策略游戲,打造太陽系、流體力學模擬,這些任務對于Fable 5/Mythos 5來說都不在話下。


▲Fable 5實測案例(圖源:Anthropic)

Mythos 5與Fable 5的主要差別在于安全措施。Fable 5在處理生物學、網絡安全和前沿科研場景的部分敏感請求時,將自動降級到Opus 4.8響應。

而被定位為“全球最強網絡安全模型”的Mythos 5則在某些領域移除了安全防護措施。這款模型目前率先通過Anthropic與美國政府合作的Project Glasswing項目對外開放,未來打算通過更廣泛的受信任訪問計劃擴展訪問權限。

價格方面,Fable 5和Mythos 5的價格分別為每百萬輸入token 10美元(約合人民幣67.7元)和每百萬輸出token 50美元(約合人民幣338.6元),大概是Mythos Preview的一半。即便如此,這兩款模型燒起token來還是十分驚人的。

有用戶反饋,在200美元/月的Claude Max套餐中,Fable 5僅用1分鐘消耗了約14%的5小時使用配額,并消耗約2%的周配額。換算下來,大概1分鐘1美元。


▲網友吐槽Fable 5使用成本(圖源:X平臺)

Fable 5模型現已全面上線。即日起至6月22日,Pro、Max、Team和按座收費的企業版用戶可免費使用。6月23日起,Fable 5將從這些套餐中移除,之后需消耗積分才能使用。Anthropic官方稱,待容量充足后,他們會盡快將其恢復為訂閱計劃的標配功能,并可能視情況延長免費期。

Anthropic對新模型的命名也值得關注。Fable和Mythos沿用了此前的文學體裁命名方式,相較此前采用的Haiku(俳句)、Sonnet(十四行詩)、Opus(巨著),這些名字的更為宏大。這種變化或許反映出其產品定位的調整,Claude未來承擔所承擔任務的復雜度和規模,或將進一步提升。

一、2個月開發工作幾天干完,還能靠記筆記自我優化

Anthropic在其博客中格外強調了新模型的長期自主工作能力。他們稱:“Fable 5和Mythos 5可以比任何之前的Claude模型更長時間地自主運行。

這種能力讓這代Claude模型可以完成更為復雜的任務。

在軟件工程領域,參與早期測試的金融科技公司Stripe稱,Fable 5將數月的工程工作壓縮到了幾天內。在一個5000萬行的Ruby代碼庫中,該模型在一天內完成了全代碼庫的遷移,而原本這一工作需要整個團隊人工操作2個月才能完成。

與過去的Claude模型相比,Fable 5的token效率也更高:在編程基準測試FrontierCode中,Fable 5僅用中等思考強度,就超過了前沿模型。


▲Fable 5在FrontierCode上的表現(圖源:Anthropic)

有不少網友已經在編程任務中驗證了Fable 5的能力。有位網友曬出了自己用Fable 5打造的《我的世界》,這一游戲的完成度已經很高了,有完整的建造和背包系統,游戲渲染沒有bug,甚至還添加了音效和背景音樂。完成這樣一個任務,Fable 5大概燒掉了30美元。

另一位網友對比了Fable 5和Opus 4.8的能力差異。在所有任務中,都能明顯感覺到Fable 5明顯強于Opus 4.8。比如,在近地物體監控網頁上,Fable 5的設計明顯更具美感,抓取的信息豐富度也更高。


▲Fable 5和Opus 4.8打造的近地物體監測器(圖源:X平臺)

在世界杯球衣銷售監測網頁任務中,Fable 5的結果運行正常,但Opus 4.8打造的網頁出現了明顯的視覺bug。


▲Fable 5和Opus 4.8打造的世界杯球衣銷售監測網頁(圖源:X平臺)

在知識型工作方面,Fable 5在企業級AI知識管理創企Hebbia的金融基準測試中,Fable 5獲得了所有模型中最高的分數,并在基于文檔的推理、圖表和表格解讀以及問題解決方面取得了顯著提升。

全球頭部的自營交易公司和做市商IMC也認為,Fable 5幾乎全面超越了IMC的交易分析評估,包括事實查詢、概念推理、根本原因分析和預期價值分析。

同時,Fable 5也是一款視覺模型。這意味著它可以看懂復雜的科學圖表、僅靠一張截圖復刻應用源代碼。

在執行視覺任務時,Fable 5所需要的輔助工具也變少了。在僅使用最小化、純視覺的Harness時,Fable 5就已經能夠通關《寶可夢 火紅》(Pokémon FireRed),而此前的Claude模型需要更復雜的輔助工具才能玩這一游戲。

Fable 5的記憶和長上下文能力也是一大亮點,它可以在長時間運行的任務中能夠持續保持專注,并利用其自身筆記改進輸出。

二、Mythos 5自主做科研一周,成果超越《科學》期刊論文

如果說Fable 5更適用于通用場景,那么Mythos 5則是Anthropic為前沿研究打造的強力工具。

在藥物設計中,蛋白質設計專家借助Mythos 5將部分環節的效率提升至約10倍。

在一個案例中,僅配備蛋白質設計和生物信息學工具、完全沒有人類協助的Mythos 5,表現達到甚至超過了熟練的人類操作者。Mythos 5自主完成了科學家通常需要親自執行的全部任務:選擇結合位點、選用并運行蛋白質設計工具、在過程中遭遇失敗時自行糾錯和恢復。


▲Mythos 5設計的蛋白質結構(圖源:Anthropic)

研究所涉的14個蛋白質靶點中,有9個產生了強候選分子,目前已進入后續研究階段。這些設計覆蓋免疫檢查點、生長因子與受體信號傳導、神經退行性疾病、肌肉疾病以及結構難度更高的靶點。

在分子生物學領域,Mythos 5是首個能夠持續提出新穎且有說服力的科學假設的模型。在與Opus級模型進行雙盲對比評測時,科學家對Mythos所提假設的偏好率約為80%,已有多項假設進入實驗驗證環節。

其中一項關于大腸桿菌某一蛋白質新機制的假設,得到了一個獨立研究團隊近期發表成果的驗證。

在基因組學方面,Mythos 5自主開展了為期1周多的原創性研究。它匯集了橫跨138個動物物種的數百萬個單細胞數據,自行設計并訓練了一個定制的機器學習模型,用于識別在親緣關系甚遠的物種中執行相同功能的細胞。

在經驗豐富的人類研究者指導下,Mythos 5訓練出的模型超越了近期發表在《科學》期刊上的一個模型,而前者的參數量僅為后者的百分之一。團隊計劃在未來數月內發表這些成果。

三、采用新型安全分類器,網安、生物學和蒸餾任務或被“降智”

模型能力的大幅度提升,讓Anthropic開始重新構建模型的安全體系。在面向公眾開放的Fable 5中,Anthropic打造了安全分類器,三類請求會被路由到Opus 4.8。Anthropic的數據顯示,大約5%的請求會被降級到Opus 4.8進行處理。

在網絡安全類任務中,Mythos級模型擅長發現和利用軟件漏洞。因此,它們可以大大簡化網絡攻擊,降低實施成本。為了防止這些黑客技能被應用于網絡攻擊,Anthropic設計了網絡安全分類器,應用于Fable 5。


Anthropic對這一分類器進行了大量測試,在1000小時的測試中,暫時沒有團隊找到通用的越獄方法。不過,Anthropic也承認,完全防止越獄是基本不可能的,他們的目標是讓越獄足夠緩慢且昂貴,讓Anthropic能在大規模使用前監測到這些行為,并及時阻止。

在生物學和化學任務中,Anthropic此前已經會阻止生化武器相關的任務,但隨著模型能力提升,Anthropic發現一些通用類的生物學和化學研究也有可能被用于危險用途。因此,目前Fable 5在這些領域的大部分請求都會被路由到Opus 4.8上。

Anthropic還對所謂“蒸餾”行為進行了限制,當用戶的請求被標記為蒸餾行為時,也會被路由到Opus 4.8進行處理。

最后,Anthropic還要求企業客戶將Mythos級型號的數據保存30天,這些數據不會被用于訓練模型,但是會被用于防范網絡安全攻擊和減少誤報。

結語:干活的能力上去了,商業模式也在重構

頭部AI企業正把競爭重點,轉向真實任務的閉環交付能力。通讀Anthropic的Fable 5/Mythos 5博客,可以感受到性能指標與榜單成績的占比似乎沒有那么多了,Anthropic更希望強調,這一模型能獨立把活干完、干對的能力。

同時,在這一代Claude模型上,我們也看到了算力成本與訂閱模式之間張力的進一步加劇。頂級模型燒token的速度遠超當前訂閱制的承載能力,按量計費、混合計費模式乃至按結果計費的新模式可能會加速普及。這些新型商業化模式的探索也值得關注。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
廣西河池市金城江區正處級干部韋琪被查

廣西河池市金城江區正處級干部韋琪被查

環球網資訊
2026-06-11 17:48:07
求錘得錘?聽說要被中國制裁,菲防長曾笑著說

求錘得錘?聽說要被中國制裁,菲防長曾笑著說

小馬姨
2026-06-12 08:12:53
爵士交易奇才狀元簽難達成

爵士交易奇才狀元簽難達成

體壇周報
2026-06-12 01:02:14
明年開始,農商行員工要面臨嚴峻問題

明年開始,農商行員工要面臨嚴峻問題

愛看劇的阿峰
2026-06-11 13:38:02
賴斯曬傷照爆紅 調侃自己“紅得像熟蝦”

賴斯曬傷照爆紅 調侃自己“紅得像熟蝦”

體育硬核說
2026-06-12 01:05:54
誰干的?巴基斯坦軍機墜毀,機上全員遇難,無一生還,印度失聲了

誰干的?巴基斯坦軍機墜毀,機上全員遇難,無一生還,印度失聲了

凡知
2026-06-12 11:11:24
難以置信!浙江一保安征婚,每月要女方給10000元,僅限杭州女生

難以置信!浙江一保安征婚,每月要女方給10000元,僅限杭州女生

火山詩話
2026-06-12 10:49:53
A股:股民要系好安全帶,主力已經明牌了,周五將要迎來新的變盤

A股:股民要系好安全帶,主力已經明牌了,周五將要迎來新的變盤

虎哥閑聊
2026-06-12 00:00:06
“你兒子專注力廢了”,小學男生每天聽故事,過來人點出真相

“你兒子專注力廢了”,小學男生每天聽故事,過來人點出真相

澤澤先生
2026-06-06 21:14:40
江蘇一司機夜間避開遠光燈后發現四人在車道擺桌吃飯,當地:已經收到群眾反映,目前正在調查過程中

江蘇一司機夜間避開遠光燈后發現四人在車道擺桌吃飯,當地:已經收到群眾反映,目前正在調查過程中

上海約飯局
2026-06-12 10:29:48
狂人歸來!皇馬官宣:穆里尼奧上任主帥 合同3年7月13日開啟二進宮

狂人歸來!皇馬官宣:穆里尼奧上任主帥 合同3年7月13日開啟二進宮

新英體育
2026-06-12 10:47:29
勸和失敗!蕭華喬丹都搞不定,尼克斯老板多蘭到底和誰結了死仇?

勸和失敗!蕭華喬丹都搞不定,尼克斯老板多蘭到底和誰結了死仇?

劉哥談體育
2026-06-12 01:08:27
首次拿頂薪!CBA這6人等續約,張鎮麟雙豐收,27歲國手輔佐胡金秋

首次拿頂薪!CBA這6人等續約,張鎮麟雙豐收,27歲國手輔佐胡金秋

體壇大事記
2026-06-12 09:12:46
異性對接吻一定要慎重,一旦“接吻”了,關系就會發生重大變化!

異性對接吻一定要慎重,一旦“接吻”了,關系就會發生重大變化!

皓皓情感說
2026-05-15 12:29:38
OG關鍵封蓋沒打手!裁判報告解釋有理有據:多角度證接觸差之毫厘

OG關鍵封蓋沒打手!裁判報告解釋有理有據:多角度證接觸差之毫厘

顏小白的籃球夢
2026-06-12 10:05:51
63歲阿湯哥被曝“越老越瘋”,同行都看不下去了

63歲阿湯哥被曝“越老越瘋”,同行都看不下去了

生活觀察員啊
2026-06-11 01:22:03
身材太性感了!《古墓麗影》新作勞拉獲演員力挺

身材太性感了!《古墓麗影》新作勞拉獲演員力挺

3DM游戲
2026-06-12 09:09:41
啟蒙教練:謝晉百米速度已達到10秒8,未來絕對能去五大聯賽

啟蒙教練:謝晉百米速度已達到10秒8,未來絕對能去五大聯賽

懂球帝
2026-06-11 14:36:08
為什么往死里掃黃?網友分享太真實了,一次說透

為什么往死里掃黃?網友分享太真實了,一次說透

另子維愛讀史
2026-05-27 20:16:03
6戰世界杯!奧喬亞:100%確定世界杯后從國家隊退役 已有財務自由

6戰世界杯!奧喬亞:100%確定世界杯后從國家隊退役 已有財務自由

硯底沉香
2026-06-11 17:09:34
2026-06-12 12:08:49
智東西 incentive-icons
智東西
智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
12025文章數 117101關注度
往期回顧 全部

科技要聞

SpaceX IPO募資750億美元,馬斯克身家萬億

頭條要聞

"墨西哥吳鎮宇"比肩梅西C羅 成世界杯"六朝元老"

頭條要聞

"墨西哥吳鎮宇"比肩梅西C羅 成世界杯"六朝元老"

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

與熱巴戀情曝光1天,陳飛宇現身

財經要聞

萬億美元順差背后,透露這些信號

汽車要聞

佟湘北:全新smart#6 自成一派好看更好開

態度原創

家居
親子
房產
游戲
藝術

家居要聞

空間微調 移形換境

親子要聞

可憐天下父母心,一位母親給三胞胎喂奶,畫面溫馨又讓人心疼

房產要聞

科城·美林學筑5月領跑崖州灣:成交價、銷售套數、轉化率三項第一

《光環》重制新作對比原作!差異顯著 缺乏原版氣質

藝術要聞

盛夏清涼|甘南 · 扎尕那 暑期寫生

無障礙瀏覽 進入關懷版