无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

比劇透提前!Anthropic發布Claude Opus 4.8:更“誠實”、可調思考強度、新功能協調數百智能體

0
分享至

繼4月推出Claude Opus 4.7后,僅一個多月時間,Anthropic便火速更新旗艦模型序列。

當地時間周四,Anthropic正式發布Claude Opus 4.8,不僅較前代版本進一步強化編程、智能體(Agent)和復雜任務處理能力,還新增用戶可控“思考投入”機制,以及面向大型任務的新功能“動態工作流”(Dynamic Workflows),使模型能著手解決超大規模的復雜問題。

相比前代Claude Opus 4.7,Opus 4.8新增了“快速模式”(Fast Mode),在該模式下,模型的運行速度可提升至常規的2.5倍,現在的成本僅為此前模型的三分之一。

值得注意的是,此次新一代Claude Opus模型的上線時間甚至早于此前代碼泄露與業內爆料所暗示的“6月中旬左右”發布時間。在當前AI大模型競爭持續升溫之際,Anthropic顯然正在加快旗艦模型的迭代節奏。

Claude Opus 4.8有哪些新變化?核心賣點:更強智能體、更高“誠實度”、思考投入可調

Anthropic將Claude Opus 4.8定義為Opus系列最新升級版本,重點提升方向包括編碼、智能體的能力、企業工作流與復雜知識任務。

與傳統模型固定推理模式不同,Anthropic此次引入了“投入控制”(effort control)機制,允許用戶直接控制Claude為任務投入多少“思考資源”。

簡單而言,用戶可以在速度、成本和推理深度之間自行權衡:簡單任務可減少計算投入以降低token消耗,復雜任務則可提高推理強度,換取更高質量輸出。

與此同時,Anthropic特別強調了Opus 4.8的一項關鍵改進——“誠實度”(honesty)。

Anthropic稱,大模型長期存在一個典型問題:在證據不足時容易倉促下結論,甚至高置信度輸出未經驗證內容。

據Anthropic介紹,Opus 4.8在面對不確定信息時,更傾向主動標記疑點、表達不確定性,而不是“強行給出答案”;模型產生無依據結論的傾向也明顯下降。

Anthropic稱,內部評估結果也印證了這一點:數據顯示,Opus 4.8允許其編寫代碼中存在缺陷卻未加提示的概率,僅為其前代模型的四分之一左右。

Anthropic還提到,發布前對Opus 4.8進行了詳盡的“對齊性”(Alignment)評估,結果顯示,新模型“在支持用戶自主權、始終維護用戶最佳利益等‘親社會特質’的各項衡量指標上,均達到了新的高度?!?/p>

評估結果還顯示,Opus 4.8 出現“未對齊行為”(即偏離預期行為,例如進行欺騙或協助濫用)的概率顯著低于 Opus 4.7,且已達到與Anthropic目前對齊性最佳的模型——Claude Mythos預覽版——相媲美的水平。


在智能體方面,Anthropic同步推出研究預覽版“動態工作流”。

這一新功能被整合進Claude Code,可讓模型在單個任務中協調數百個并行子智能體,自動規劃、拆解、執行并驗證復雜流程。

Anthropic舉例稱,新系統能夠完成覆蓋數十萬行代碼的大規模代碼庫遷移任務,從任務啟動、執行到合并提交實現端到端處理。

測評成績:智能體與瀏覽器操作能力繼續拉升

Anthropic公布的評測數據顯示,Claude Opus 4.8繼續強化其在智能體和“計算機使用”場景中的優勢。

其中,在衡量瀏覽器智能體和在線操作能力的Online-Mind2Web基準測試中,Opus 4.8獲得84%的成績,Anthropic稱其表現優于Opus 4.7,也勝過GPT-5.5。


Anthropic表示,該模型在長流程任務中保持了更穩定的目標一致性和工具調用能力,更適合自主工程Agent、法律分析、金融研究以及企業復雜流程場景。

多家合作伙伴也在官方材料中給出背書。

例如,AI編程產品Devin開發商指出,Opus 4.8改善了此前版本存在的注釋冗長、工具調用問題;法律與稅務工作流平臺CoCounsel則稱,新模型在一致性和推理質量方面有明顯提升。

常規定價不變 新增“快速模式”選項

價格方面,Anthropic并未提高標準使用成本。

Claude Opus 4.8維持與Opus 4.7一致的常規定價:每百萬輸入token收費5美元,每百萬輸出token收費25美元。

同時,Anthropic新增“快速模式”(Fast Mode)方案,定價為每百萬輸入token收費10美元,主打更快響應體驗。

Anthropic同時繼續保留Prompt Caching、批處理折扣等企業級成本優化機制。

已在哪些平臺上線?云廠商同步接入

Anthropic表示,Claude Opus 4.8已正式上線Claude生態。

消費端與企業端方面,Pro、Max、Team、Enterprise用戶均可直接使用。

開發者則可通過Claude API調用claude-opus-4-8模型。

此外,Anthropic同步在主要云平臺開放部署,包括亞馬遜的AWS、谷歌云以及微軟的Foundry。

不止模型更新,Anthropic下一步想做什么?

除發布新模型外,Anthropic此次更新釋放出的更重要信號,或許是其正在從“模型能力競爭”進一步邁向“智能體系統競爭”。

Dynamic Workflows、多Agent協作、長流程自動執行、用戶可調思考強度等新功能,都顯示出Anthropic希望推動Claude從聊天模型向“長期自主執行系統”演進。

公司在公告中也反復強調,未來重點方向將繼續圍繞Agent能力、企業復雜工作流、工具調用、跨會話記憶與長期任務執行展開。

Anthropic表示,作為Glasswing項目的一部分,目前已有少數機構開始試用Claude Mythos預覽版,并將其應用于網絡安全相關工作中。鑒于此類模型具備極高的能力水平,在正式面向大眾發布之前,必須先行建立更為強健的網絡安全防護體系。

目前,Anthropic在構建這些安全防護措施方面正取得迅速進展,并預計,在未來數周內,即可將Mythos級別的模型正式向所有客戶開放。

從時間線上看,Anthropic顯然正在加速新品節奏:4月中旬才推出Opus 4.7,一個多月后便發布4.8,而且較此前外界根據泄露代碼推測的發布時間進一步提前。

在OpenAI、谷歌等廠商持續推進Agent和推理模型競爭的背景下,Anthropic選擇用更快的迭代速度、更多系統級功能升級,繼續押注高端企業AI市場。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美貿易代表談中美經貿合作,釋放重要信號:接受無法改變中方事實

美貿易代表談中美經貿合作,釋放重要信號:接受無法改變中方事實

菁菁子衿
2026-05-28 21:30:22
逼供的專案組長落馬,被他炮制的“倒貼式貪污案”要裝睡到幾時?

逼供的專案組長落馬,被他炮制的“倒貼式貪污案”要裝睡到幾時?

有戲
2026-05-27 10:17:34
2950枚導彈無一命中,霹靂-2的慘痛代價誰人知

2950枚導彈無一命中,霹靂-2的慘痛代價誰人知

起喜電影
2026-05-23 11:24:35
臉都打腫了!曼城 8000 萬目標直接拒絕!親口表態首選曼聯

臉都打腫了!曼城 8000 萬目標直接拒絕!親口表態首選曼聯

奶蓋熊本熊
2026-05-28 05:24:01
別擼鐵了,擼前額葉吧!9件小事幫你瘋狂長腦子,13歲以上通用

別擼鐵了,擼前額葉吧!9件小事幫你瘋狂長腦子,13歲以上通用

蓁蓁心理撫養
2026-05-22 07:20:03
住建部正式通知:6月1日起強制執業!這本證書迎來重大利好

住建部正式通知:6月1日起強制執業!這本證書迎來重大利好

新浪財經
2026-05-25 03:43:00
三國人馬竄臺,名單都不是善茬,解放軍艦機密集出動,俄已選邊站

三國人馬竄臺,名單都不是善茬,解放軍艦機密集出動,俄已選邊站

聞識
2026-05-28 13:45:16
英超財力讓你無法想象?狼隊降級賺的錢,竟是國米奪冠獎金的5倍

英超財力讓你無法想象?狼隊降級賺的錢,竟是國米奪冠獎金的5倍

體育閑話說
2026-05-28 08:52:39
日本經濟部長離開中國后,火速派人飛往俄羅斯,有件事東京很擔心

日本經濟部長離開中國后,火速派人飛往俄羅斯,有件事東京很擔心

全球風情大揭秘
2026-05-29 02:09:39
徐帆回應離婚9個月后,馮小剛再陷爭議,養女徐朵成導火索

徐帆回應離婚9個月后,馮小剛再陷爭議,養女徐朵成導火索

枯蝶
2026-05-21 22:22:13
四院院士領銜!導熱,最新Nature

四院院士領銜!導熱,最新Nature

高分子科學前沿
2026-05-28 07:59:50
鄭欽文輸球僅1天,讓人憤怒的一幕出現,現在的她印證了李娜的話

鄭欽文輸球僅1天,讓人憤怒的一幕出現,現在的她印證了李娜的話

青橘罐頭
2026-05-28 09:51:56
一人毀掉整部???央視劇《主角》唯一敗筆,觀眾:看他演戲真別扭

一人毀掉整部?。垦胍晞 吨鹘恰肺ㄒ粩」P,觀眾:看他演戲真別扭

素衣讀史
2026-05-28 21:46:52
我有罪,大導演昆汀花1萬美金,在包房舔腳半小時,直到皮膚起皺

我有罪,大導演昆汀花1萬美金,在包房舔腳半小時,直到皮膚起皺

西樓知趣雜談
2026-04-20 08:40:47
網紅雞煲店主靠流量還清欠債,生意太火反遭鄰居投訴

網紅雞煲店主靠流量還清欠債,生意太火反遭鄰居投訴

吃貨的分享
2026-05-28 20:53:26
農民養老歷史性突破!劉世錦建議落地:60歲以上每月多領1筆錢

農民養老歷史性突破!劉世錦建議落地:60歲以上每月多領1筆錢

三農雷哥
2026-05-19 17:38:13
豐田這6款車,省油保值,開50萬公里無壓力,打死都要買

豐田這6款車,省油保值,開50萬公里無壓力,打死都要買

生活魔術專家
2026-05-27 12:14:09
沒談成中蒙俄管道的普京并不灰心,他馬上找到了新的突破口

沒談成中蒙俄管道的普京并不灰心,他馬上找到了新的突破口

補懂事的孩紙
2026-05-28 17:07:34
顧客吃面猛加6勺辣椒醬,店主氣憤曝光監控,網友卻一片叫好

顧客吃面猛加6勺辣椒醬,店主氣憤曝光監控,網友卻一片叫好

米果說識
2026-05-28 12:05:00
心理學上有個詞叫:逆火效應(永遠不要指出你身邊人的任何問題,包括你的親戚朋友。成年人的最大清醒就是不介入他人的生活)

心理學上有個詞叫:逆火效應(永遠不要指出你身邊人的任何問題,包括你的親戚朋友。成年人的最大清醒就是不介入他人的生活)

德魯克博雅管理
2026-05-18 17:11:20
2026-05-29 03:27:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領先的金融商業信息提供商
146802文章數 2653725關注度
往期回顧 全部

科技要聞

利潤跌27%:快手只?!翱伸`”這張牌?

頭條要聞

男子疑遭家暴跳樓身亡 母親:兒媳說"你不配活在世上"

頭條要聞

男子疑遭家暴跳樓身亡 母親:兒媳說"你不配活在世上"

體育要聞

唐斯經歷的一切,此刻的他與尼克斯

娛樂要聞

林俊杰七七與大哥嫂子的瓜剪不斷理還亂

財經要聞

小米仍需一次創業

汽車要聞

宋Ultra DM-i售12.99萬起 選裝天神之眼B承諾一年城市領航兜底

態度原創

健康
家居
親子
公開課
軍事航空

專家教你辨認“正規外泌體”!

家居要聞

蜂鳥餐椅 線面交錯

親子要聞

“家長聽豆包給嬰兒每頓只喂60ml奶”體重未增? 豆包回應

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美鎖定伊朗打擊新目標 考慮重啟軍事行動

無障礙瀏覽 進入關懷版