Anthropic 5 月 29 日宣布推出旗艦新模型 Claude Opus 4.8,主打更強的智能體編程、多領域推理和知識工作能力。
官方表示,相比較 Opus 4.7 模型,本次 Opus 4.8 更新幅度較小,在保持價格不變的情況下,主要提升編程、智能體、推理和知識工作等用戶能感知的方面。
能力層面,官方援引多家早期測試方反饋稱,表示 Opus 4.8 “更可靠,判斷也更敏銳”,在復雜多步驟任務中判斷更穩,能主動提問、識別自身錯誤,并在計劃不合理時提出異議。
官方評估顯示,和前代相比,Opus 4.8 放任自己所寫代碼缺陷、卻不加說明的概率降低至四分之一,更愿意主動標出不確定性,減少缺乏依據的結論。
對齊表現方面,Opus 4.8 在支持用戶自主性、按用戶最佳利益行動等親社會指標上創下新高。與此同時,欺騙等失配行為的出現率低于 Opus 4.7,并與 Claude Mythos Preview 接近。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.