无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

剛剛,F(xiàn)able 5解禁!Anthropic連夜發(fā)“性?xún)r(jià)比”新模型,網(wǎng)友:感謝中國(guó)開(kāi)源嚴(yán)父

0
分享至


智東西
編譯 李水青
編輯 云鵬

智東西7月1日消息,剛剛,Anthropic宣布Claude Fable 5解禁。就在6小時(shí)前,Anthropic推出一款新模型Claude Sonnet 5,面向所有套餐用戶(hù)開(kāi)放。

Anthropic在推文中稱(chēng):“我們已收到通知,美國(guó)商務(wù)部已解除對(duì)Claude Fable 5和Mythos 5的出口管制。我們將于明日開(kāi)始恢復(fù)訪問(wèn)權(quán)限,并盡快發(fā)布最新消息。感謝用戶(hù)的耐心等待,也感謝所有與我們合作的人員。”


▲Anthropic宣布Fable 5解禁

此前6月13日,Anthropic因美國(guó)政府發(fā)布一項(xiàng)出口管制指令,終止了所有用戶(hù)的Fable 5和Mythos 5訪問(wèn)權(quán)限。而后兩周,Anthropic在全球范圍內(nèi)封禁了一大批賬號(hào),使得大批原Claude用戶(hù)轉(zhuǎn)向?qū)ふ姨娲a(chǎn)品。

Fable 5回歸的關(guān)注度雖高,但Claude最新的Sonnet 5也值得一看。據(jù)悉,其最大進(jìn)步在于能夠自主運(yùn)行長(zhǎng)時(shí)間任務(wù),用戶(hù)可以制定計(jì)劃、使用瀏覽器和終端等工具。幾個(gè)月前要達(dá)到這樣的水平,還需要更昂貴的模型。

從測(cè)評(píng)成績(jī)來(lái)看,Sonnet 5性能接近Opus 4.8,但價(jià)格更低;同時(shí),它比其前代產(chǎn)品Sonnet 4.6有了顯著的改進(jìn),在推理、工具使用、編程和知識(shí)工作等Agent性能方面更強(qiáng)。


▲Sonnet 5與Sonnet 4.6和Opus 4.8測(cè)評(píng)得分對(duì)比

Sonnet 5在Agent環(huán)境中使用更安全,不良行為發(fā)生率總體低于Sonnet 4.6,但高于Opus 4.8和Claude Mythos Preview。但在網(wǎng)絡(luò)安全類(lèi)任務(wù)上,該模型的能力遠(yuǎn)不及現(xiàn)有Opus系列模型。

從今天起,免費(fèi)版和專(zhuān)業(yè)版Claude用戶(hù)默認(rèn)使用Sonnet 5,Max版、團(tuán)隊(duì)版和企業(yè)版用戶(hù)也可使用,該模型還可通過(guò)Claude Code和Claude Platform使用。在Claude Platform上,Sonnet 5的首發(fā)價(jià)格為每百萬(wàn)個(gè)輸入token 2美元(約合人民幣13.6元),每百萬(wàn)個(gè)輸出token 10美元(約合人民幣67.9元),優(yōu)惠期至2026年8月31日。

優(yōu)惠結(jié)束之后,價(jià)格將調(diào)整為每百萬(wàn)個(gè)輸入token 3美元(約合人民幣20.4元),每百萬(wàn)個(gè)輸出token 15美元(約合人民幣101.8元);這一價(jià)格仍低于Opus 4.8的輸入5美元、輸出25美元的定價(jià)。開(kāi)發(fā)者可通過(guò)Claude API使用claude-sonnet-5模型。

模型一經(jīng)發(fā)布,一些網(wǎng)友認(rèn)為這是一次“巨大的更新”。有網(wǎng)友稱(chēng):“有趣的不是它與Opus的算法接近,而是算法接近但token的價(jià)格卻便宜60%。”有網(wǎng)友稱(chēng):“既然它本身就能處理多步驟Agent工作流程,再去構(gòu)建更大的模型就不太劃算了。”也有人稱(chēng):“終于有一個(gè)能自我檢查的模型了,它讓我們免于在長(zhǎng)時(shí)間運(yùn)行的循環(huán)中時(shí)刻關(guān)注每一個(gè)輸出結(jié)果。”



▲網(wǎng)友對(duì)Sonnet 5的評(píng)論(圖源:社交媒體X)

但也有網(wǎng)友認(rèn)為這款模型頗為“雞肋”。一位網(wǎng)友稱(chēng):“你自己也承認(rèn),這比你目前排名第二的型號(hào)要弱。訂閱用戶(hù)想要的是性能更強(qiáng)的模型,而不是價(jià)格便宜幾分錢(qián)卻只會(huì)給出虛假答案的玩具。”也有網(wǎng)友擔(dān)心所謂自主運(yùn)行,反而讓用戶(hù)擔(dān)心模型犯傻、刪錯(cuò)文件。有人吐槽:“促銷(xiāo)價(jià)過(guò)后,它的價(jià)格和Opus差不多。”也有網(wǎng)友認(rèn)為,Sonnet 5就是面向6月17日新開(kāi)源的智譜GLM-5.2展開(kāi)價(jià)格戰(zhàn)

GLM-5.2在OpenRouter等第三方API平臺(tái)定價(jià)為每百萬(wàn)token輸入1.40美元,輸出4.40美元,Sonnet 5依然高出不少。





▲網(wǎng)友對(duì)Sonnet 5的評(píng)論(圖源:社交媒體X)

一、性能對(duì)標(biāo)、價(jià)格骨折,Sonnet 5拳打自家Opus 4.8

下圖比較了Sonnet 5、Sonnet 4.6和Opus 4.8在不同工作量水平下,在BrowseComp智能搜索評(píng)估和OSWorld-Verified計(jì)算機(jī)使用評(píng)估中的性能表現(xiàn)。

Sonnet 5(橙色線)相比Sonnet 4.6(灰色線)有了顯著提升,并且比Opus 4.8(黃色線)涵蓋了更廣泛的性?xún)r(jià)比選擇。它在中等工作量下提供了更高的成本效益;在某些任務(wù)中,其高工作量下的性能可以與Opus 4.8相媲美。用戶(hù)可以在Sonnet 5和Opus 4.8之間調(diào)整工作量水平,以找到成本和性能的最佳平衡點(diǎn)。

下圖顯示了不同投入水平下的性?xún)r(jià)比曲線。前代產(chǎn)品Sonnet 4.6遠(yuǎn)遜于Opus 4.8,但Sonnet 5提供的性?xún)r(jià)比選擇范圍比Sonnet 4.6更廣,在某些情況下甚至可以與Opus 4.8的性能水平相媲美。


▲Agent搜索


▲Agent計(jì)算機(jī)使用

圖表顯示了Sonnet 5的定價(jià),但其實(shí)際成本甚至比圖中所示還要低。Opus 4.8的定價(jià)為每百萬(wàn)輸入token 5美元,每百萬(wàn)輸出token 25美元。xhigh表示,Opus 4.8達(dá)到了超高投入水平。

來(lái)自早期體驗(yàn)合作伙伴的反饋一致,Sonnet 5比其前代產(chǎn)品更具自主性。測(cè)試人員描述了它如何完成以往Sonnet型號(hào)無(wú)法完成的復(fù)雜任務(wù),如何在無(wú)需明確要求的情況下檢查自身輸出,以及它如何以極具吸引力的價(jià)格完成所有這些自主工作。

一位網(wǎng)友對(duì)比了Claude Sonnet 5與Claude Opus 4.8的體驗(yàn)結(jié)果,讓它們分別創(chuàng)建一個(gè)關(guān)于Claude Sonnet 5的HTML落地頁(yè),認(rèn)為就輸出質(zhì)量而言,Opus勝出;就模型速度和成本而言,Sonnet 5勝出。

其中Sonnet 5使用token:輸入20.9k,輸出14.2k,總成本:3.36美元,耗時(shí):2分11秒。Opus 4.8:使用token:輸入96.3k,輸出73.8k,總成本:20.66美元,耗時(shí):20分15秒。


▲左圖為Opus 4.8生成網(wǎng)頁(yè),右圖為Sonnet 5生成網(wǎng)頁(yè)

二、安全防御提升,網(wǎng)絡(luò)安全任務(wù)執(zhí)行遠(yuǎn)遜于Opus與Mythos

Anthropic的部署前安全評(píng)估發(fā)現(xiàn),Sonnet 5總體上比Sonnet 4.6有所改進(jìn)。在Agent安全方面,該模型能夠更好地拒絕惡意請(qǐng)求,并抵御即時(shí)注入攻擊中的劫持嘗試。與Sonnet 4.6相比,該模型表現(xiàn)出更低的幻覺(jué)和奉承行為發(fā)生率。

在Anthropic的自動(dòng)化行為審查中,該審計(jì)測(cè)試各種不協(xié)調(diào)行為,例如濫用和欺騙等,Sonnet 5的總體得分更低(即更安全)。然而,與Opus 4.8和Claude Mythos Preview相比,Sonnet 5在此項(xiàng)評(píng)估中表現(xiàn)出的不協(xié)調(diào)行為發(fā)生率略高。


▲Claude模型中不一致行為的發(fā)生率

Anthropic并未刻意訓(xùn)練Sonnet 5執(zhí)行網(wǎng)絡(luò)安全任務(wù)。它可以執(zhí)行一些常規(guī)的、無(wú)害的網(wǎng)絡(luò)安全任務(wù),但在測(cè)試潛在危險(xiǎn)網(wǎng)絡(luò)安全技能的評(píng)估中,例如開(kāi)發(fā)軟件漏洞利用程序,它的表現(xiàn)遠(yuǎn)遜于Opus 4.8和Mythos 5等模型。

下圖展示了一項(xiàng)評(píng)估的得分,該評(píng)估測(cè)試了模型開(kāi)發(fā)針對(duì)Firefox瀏覽器漏洞的利用程序的能力。Sonnet 5從未成功開(kāi)發(fā)出完整的可用漏洞利用程序,但其部分成功率略高于Sonnet 4.6。后者的變化很可能是由于其通用智能的提升,而非特定訓(xùn)練的結(jié)果。


▲衡量Claude模型在開(kāi)發(fā)針對(duì)Firefox 147軟件漏洞的利用程序方面的成功率

如上圖所示,對(duì)于每個(gè)模型,左側(cè)條形圖顯示模型在無(wú)安全措施的情況下,開(kāi)發(fā)出有效利用程序的頻率;右側(cè)條形圖顯示模型部分成功的頻率。Sonnet的兩個(gè)模型均未能成功開(kāi)發(fā)出有效利用程序,得分均為0.0%;Sonnet 5的部分成功率略高于Sonnet 4.6。Sonnet的兩個(gè)模型的網(wǎng)絡(luò)安全能力均遠(yuǎn)遜于Opus 4.8和Mythos 5。

由于Sonnet 5在這些任務(wù)上比其前代產(chǎn)品功能更強(qiáng)大,Anthropic默認(rèn)啟用了網(wǎng)絡(luò)安全防護(hù)功能。這些防護(hù)功能可以實(shí)時(shí)檢測(cè)并阻止危險(xiǎn)的網(wǎng)絡(luò)攻擊,與Claude Opus 4.7和4.8中的防護(hù)功能相同。因?yàn)锳nthropic評(píng)估Sonnet 5的總體網(wǎng)絡(luò)安全風(fēng)險(xiǎn)較低,所以其防護(hù)措施比Fable 5的防護(hù)措施寬松,F(xiàn)able 5會(huì)阻止更廣泛的網(wǎng)絡(luò)安全攻擊。

結(jié)語(yǔ):Sonnet 5來(lái)了,但全網(wǎng)都在等Fable 5

曾幾何時(shí),Sonnet系列憑借3.5至3.7版本為開(kāi)發(fā)者打開(kāi)了Agent工程的大門(mén),成為編碼與工具調(diào)用的標(biāo)桿。但隨后幾年,Opus系列在復(fù)雜推理和高端任務(wù)上持續(xù)領(lǐng)跑,讓Sonnet逐漸退居“高性?xún)r(jià)比備選”之位。

如今,Sonnet 5試圖宣告回歸:在高投入場(chǎng)景下性能足以比肩Opus 4.8,成本更低。不過(guò),對(duì)于Sonnet 5這種備選方案,很多網(wǎng)友并不買(mǎi)賬,而是催著能力更強(qiáng)的Fable 5解禁。與此同時(shí),Sonnet 5也被認(rèn)為是面向GML-5.2等模型打響價(jià)格戰(zhàn),頭部大模型廠商之間的Agent競(jìng)賽似乎已進(jìn)入肉搏階段。

來(lái)源:Anthropic、X


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
全網(wǎng)群嘲的玫瑰空調(diào)賣(mài)爆了,網(wǎng)友驚呆了!

全網(wǎng)群嘲的玫瑰空調(diào)賣(mài)爆了,網(wǎng)友驚呆了!

廣告案例精選
2026-06-30 08:40:54
麻煩大了!短短24小時(shí)韓紅再遭重挫,驚動(dòng)官方機(jī)構(gòu),被圈內(nèi)人士暗示名譽(yù)難保

麻煩大了!短短24小時(shí)韓紅再遭重挫,驚動(dòng)官方機(jī)構(gòu),被圈內(nèi)人士暗示名譽(yù)難保

老吳教育課堂
2026-07-01 01:00:23
“簽單陪你睡!”女業(yè)務(wù)員獻(xiàn)身客戶(hù),半年后被約,拼命逃出報(bào)警

“簽單陪你睡!”女業(yè)務(wù)員獻(xiàn)身客戶(hù),半年后被約,拼命逃出報(bào)警

一絲不茍的法律人
2026-06-27 14:59:29
小玥兒畢業(yè)只邀小菲奶奶,徐家半小時(shí)車(chē)程落空

小玥兒畢業(yè)只邀小菲奶奶,徐家半小時(shí)車(chē)程落空

音樂(lè)時(shí)光的娛樂(lè)
2026-07-01 08:07:57
含金量滿(mǎn)滿(mǎn)!外資涌入,加倉(cāng)中國(guó)!

含金量滿(mǎn)滿(mǎn)!外資涌入,加倉(cāng)中國(guó)!

環(huán)球網(wǎng)資訊
2026-07-01 09:12:04
入選國(guó)少!前足球小將核心父親示好 董路:永遠(yuǎn)不原諒你 原因曝光

入選國(guó)少!前足球小將核心父親示好 董路:永遠(yuǎn)不原諒你 原因曝光

念洲
2026-06-29 20:03:23
出現(xiàn)1:3局面,中國(guó)臺(tái)東執(zhí)法遭圍攻,英國(guó)帶頭發(fā)難,中方強(qiáng)勢(shì)反擊

出現(xiàn)1:3局面,中國(guó)臺(tái)東執(zhí)法遭圍攻,英國(guó)帶頭發(fā)難,中方強(qiáng)勢(shì)反擊

阿離家居
2026-06-30 18:00:30
泰國(guó)“租妻”生意撕開(kāi)芭提雅夜生活,伊善女兒與外籍男性的交易鏈

泰國(guó)“租妻”生意撕開(kāi)芭提雅夜生活,伊善女兒與外籍男性的交易鏈

陸棄
2026-06-30 10:52:15
美國(guó)大滿(mǎn)貫大冷門(mén)!王曼昱不敵佐藤瞳,三輸日本選手,馬琳引爭(zhēng)議

美國(guó)大滿(mǎn)貫大冷門(mén)!王曼昱不敵佐藤瞳,三輸日本選手,馬琳引爭(zhēng)議

阿衃體育
2026-07-01 09:56:40
今晚開(kāi)播!張嘉益董潔領(lǐng)銜年代大劇,天津衛(wèi)視黃金檔這部劇要火!

今晚開(kāi)播!張嘉益董潔領(lǐng)銜年代大劇,天津衛(wèi)視黃金檔這部劇要火!

喜歡歷史的阿繁
2026-07-01 10:11:45
統(tǒng)治級(jí)完勝!姆巴佩雙響封神,滿(mǎn)格冠軍相的法國(guó)無(wú)人可擋

統(tǒng)治級(jí)完勝!姆巴佩雙響封神,滿(mǎn)格冠軍相的法國(guó)無(wú)人可擋

獅王亂彈
2026-07-01 11:41:46
學(xué)醫(yī)后才知道,骨質(zhì)疏松最危險(xiǎn)的信號(hào),不是腰疼,而是這5種癥狀

學(xué)醫(yī)后才知道,骨質(zhì)疏松最危險(xiǎn)的信號(hào),不是腰疼,而是這5種癥狀

岐黃傳人孫大夫
2026-06-19 21:20:03
歐洲人熱得開(kāi)始罵體制了

歐洲人熱得開(kāi)始罵體制了

雷斯林
2026-06-30 15:41:22
韓紅基金會(huì)回應(yīng)“韓紅宣布退出公益行業(yè)”:網(wǎng)傳的朋友圈截圖是不實(shí)信息,目前韓紅正在參與百人援蒙的義診活動(dòng)

韓紅基金會(huì)回應(yīng)“韓紅宣布退出公益行業(yè)”:網(wǎng)傳的朋友圈截圖是不實(shí)信息,目前韓紅正在參與百人援蒙的義診活動(dòng)

魯中晨報(bào)
2026-06-30 15:38:37
1988年師長(zhǎng)李德金開(kāi)會(huì)路上被當(dāng)場(chǎng)控制,全方位搜身后找到一串鑰匙

1988年師長(zhǎng)李德金開(kāi)會(huì)路上被當(dāng)場(chǎng)控制,全方位搜身后找到一串鑰匙

磊子講史
2026-06-23 14:10:47
印度塔塔泄密丑聞:iPhone18 Pro供應(yīng)商清單、照片遭偷跑

印度塔塔泄密丑聞:iPhone18 Pro供應(yīng)商清單、照片遭偷跑

菁菁子衿
2026-06-30 19:54:28
《塞爾達(dá)傳說(shuō):黃昏公主》或以“增強(qiáng)版”形式登陸Switch2

《塞爾達(dá)傳說(shuō):黃昏公主》或以“增強(qiáng)版”形式登陸Switch2

電玩迷
2026-06-30 19:30:49
范霍伊東克:罰點(diǎn)球的花招令我作嘔,摩洛哥比荷蘭高兩個(gè)檔次

范霍伊東克:罰點(diǎn)球的花招令我作嘔,摩洛哥比荷蘭高兩個(gè)檔次

懂球帝
2026-06-30 13:08:10
哈蘭德實(shí)話說(shuō):我真踢不動(dòng)加時(shí)賽了;挪威對(duì)陣巴西勝算極其渺茫!

哈蘭德實(shí)話說(shuō):我真踢不動(dòng)加時(shí)賽了;挪威對(duì)陣巴西勝算極其渺茫!

凡知
2026-07-01 11:11:04
為什么往死里掃黃?網(wǎng)友分享太真實(shí)了,一次說(shuō)透

為什么往死里掃黃?網(wǎng)友分享太真實(shí)了,一次說(shuō)透

另子維愛(ài)讀史
2026-05-27 20:16:03
2026-07-01 12:31:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專(zhuān)注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)變革。
12157文章數(shù) 117113關(guān)注度
往期回顧 全部

科技要聞

美國(guó)放行,Anthropic兩款頂級(jí)模型將恢復(fù)

頭條要聞

老人獲幫助后車(chē)禍去世 孫子:視頻里他笑得合不攏嘴

頭條要聞

老人獲幫助后車(chē)禍去世 孫子:視頻里他笑得合不攏嘴

體育要聞

德國(guó)足球,臉都不要了

娛樂(lè)要聞

羅晉大孤山素顏照,禿頂白發(fā)引熱議

財(cái)經(jīng)要聞

新氧貸款:宣傳年化15%,實(shí)際頂格24%

汽車(chē)要聞

奇瑞風(fēng)云A9探店 五個(gè)理由一定來(lái)看看

態(tài)度原創(chuàng)

藝術(shù)
教育
數(shù)碼
房產(chǎn)
公開(kāi)課

藝術(shù)要聞

這5件2026屆畢業(yè)油畫(huà)作品,被中國(guó)美術(shù)學(xué)院美術(shù)館收藏

教育要聞

高中英語(yǔ)平時(shí)120左右,遇到瓶頸上不去,如何穩(wěn)定在一百三四十?

數(shù)碼要聞

三星首款A(yù)I眼鏡Galaxy Glasses曝光:支持Ring戒指手勢(shì)控制

房產(chǎn)要聞

突發(fā)!萬(wàn)億資本巨頭,悄悄殺入海棠灣!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版