網易首頁 > 網易號 > 正文申請入駐

Claude Opus 4.8正式發布：支持算力調節、動態工作流與更強誠實性

2026-06-08 22:02:03　來源: 至頂科技

北京舉報

分享至

周四，Anthropic發布了其旗艦模型的最新版本Claude Opus 4.8。新版本允許用戶控制Claude的努力程度，支持處理更大規模的編程任務，并以更低的價格使用快速模式。Anthropic同時表示，該模型在誠實性方面有所提升，欺騙行為減少，對用戶自主性和利益的支持也得到了改善。

基準測試結果顯示，Opus 4.8的表現超越了前代模型，以及GPT-5.5和Gemini 3.1 Pro，但在智能體終端編程領域，OpenAI的模型仍占據優勢。新模型于周四正式上線，定價與Opus 4.7保持一致。

可調節的努力程度控制

Opus 4.8新增了一項努力程度控制功能，允許用戶根據需求調整Claude的計算投入。在高努力模式下，Claude會"更頻繁、更深入地思考，以給出更好的回答"；而在低努力模式下，模型響應更快，消耗用戶的速率限制也更慢。這對于擔心速率限制消耗過快的用戶來說，或許是個好消息。

動態工作流支持大規模編程任務

目前處于研究預覽階段的"動態工作流"功能，將使用戶能夠借助Claude Code處理更大規模的問題。Anthropic表示，用戶現在可以要求Claude"規劃任務，并在單個會話中并行運行數百個子智能體"，完成后再將經過驗證的輸出結果返回給用戶。以大型代碼庫遷移為例，搭載Opus 4.8的Claude Code可以"從啟動到合并，跨越數十萬行代碼"完成整個遷移過程。

快速模式價格大幅下降

Anthropic宣布，Opus 4.8快速模式（即模型以2.5倍正常速度運行時）的價格"比前代模型便宜了三倍"。這對注重成本控制的Claude用戶來說無疑是一大利好。

更誠實、更少欺騙

Anthropic對齊團隊表示，Opus 4.8"在親社會特征測量方面達到了新高"。具體而言，該模型在支持用戶自主性和維護用戶最佳利益方面均有所提升。欺騙行為和配合濫用的比例也"大幅低于"前代模型，性能水平已與Claude Mythos Preview相當——后者曾被Anthropic稱為"我們訓練過的對齊最佳模型"。

在誠實性方面，Anthropic表示Opus 4.8"對自身代碼缺陷保持沉默的可能性比前代低約四倍"。早期測試者也證實了這一點，稱Opus 4.8"在執行智能體任務時更加可靠、判斷更為敏銳"。

基準測試表現亮眼

Anthropic表示，Opus 4.8在所有基準測試中均優于前代。盡管發布日的基準成績不一定能完全反映真實使用體驗，但這些數據仍展現出相當的潛力。

最值得關注的是：在智能體編程方面，Opus 4.8得分69.2%，顯著高于Opus 4.7（64.3%）、GPT-5.5（58.65%）和Gemini 3.1 Pro（54.2%）；在智能體算力使用得分方面，Opus 4.8達到83.4%，同樣領先于GPT-5.5（78.7%）和Gemini 3.1 Pro（76.2%）。不過，在智能體終端編程方面，Opus 4.8的得分比GPT-5.5低3.6%，暫居下風。

Opus系列發展歷程回顧

2025年5月，Anthropic在首屆開發者大會"Code with Claude"上發布了Opus 4，并將其定位為"全球最佳編程模型"。該模型在編程能力和長上下文推理方面實現了重大突破，尤其擅長處理長時間運行的任務，能在"數千步"操作中保持上下文連貫。

2025年8月，Opus 4.1發布，在智能體任務、編程和推理方面帶來了一定程度的改進，但整體屬于小幅更新。

2025年11月，Opus 4.5正式亮相，Anthropic再度將其譽為"全球最佳編程、智能體與計算機使用模型"。該版本提升了模型處理歧義和多系統漏洞問題的能力，幫助Anthropic在OpenAI的GPT-5.1-Codex-Max和谷歌的Gemini 3模型受到廣泛關注后重奪編程領域的領先地位。

三個月后，Anthropic推出了Opus 4.6，這被認為是大語言模型在企業工作流應用方面的一次重要跨越。Opus 4.6引入了100萬Token的上下文窗口，成為Anthropic首個采用自適應思維的模型，并獲得了出色的基準測試成績。然而，該版本發布后，Anthropic因調整長上下文定價策略而遭到用戶批評——超過約20萬Token的請求將按更高的"長上下文"價格檔位收費。

Opus 4.7于2026年4月發布，帶來了更好的視覺、記憶與指令跟隨能力，但隨后被曝出存在自相矛盾的回復和性能下滑問題。Anthropic甚至將Opus 4.7定性為在某些方面"能力不如"當時備受關注的Claude Mythos Preview，外界認為Opus 4.7在一定程度上是為Mythos測試新安全機制的過渡版本。

后續計劃與市場展望

Opus 4.8于5月28日發布的傳言最終得到證實，因此網絡上流傳的其他消息也值得關注：相關泄露信息還顯示，Anthropic即將宣布推出Sonnet 4.8和Mythos 1。

對于這家近期頻頻令用戶失望的AI公司而言，這將是重大消息。本月早些時候，Anthropic在Claude Code智能體視圖方面令開發者頗為失望。Neurometric AI的聯合創始人兼CEO Rob May向媒體表示："它減少了一些阻力，但并沒有解決根本問題。"同周，Anthropic還宣布將從6月15日起對智能體SDK的使用拆分計費，這對習慣將程序化使用和交互式使用合并計入同一訂閱額度的用戶來說，并非好消息。

或許，Mythos 1和Sonnet 4.8的到來將帶來更多驚喜。

Q&A

Q1：Claude Opus 4.8的努力程度控制功能有什么用？

A：努力程度控制功能允許用戶調整Claude在任務中的計算投入。設置為高努力模式時，Claude會更頻繁、更深入地思考，給出更優質的回答；設置為低努力模式時，響應速度更快，消耗速率限制也更慢。這一功能對擔心觸碰速率上限的用戶尤為實用，可根據任務復雜程度靈活分配算力資源。

Q2：Opus 4.8的動態工作流功能具體能做什么？

A：動態工作流功能目前處于研究預覽階段，允許用戶通過Claude Code處理大規模編程項目。用戶可以要求Claude規劃整體任務，并在單個會話中并行運行數百個子智能體，系統會在返回結果前自動驗證輸出內容。典型應用場景包括大型代碼庫遷移，Claude Code可從項目啟動到最終合并，跨越數十萬行代碼完成全流程工作。

Q3：Opus 4.8和GPT-5.5在基準測試上有什么差距？

A：整體來看，Opus 4.8在多項基準測試中領先于GPT-5.5。在智能體編程方面，Opus 4.8得分69.2%，遠高于GPT-5.5的58.65%；在智能體算力使用得分方面，Opus 4.8以83.4%對78.7%占優。但在智能體終端編程這一細分領域，GPT-5.5仍以高出3.6個百分點的成績保持領先，是Opus 4.8目前尚未超越的方向。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.