網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

說實話，我覺得 Claude 4.8 有點拉。

2026-05-30 00:10:15　來源: 差評XPIN

浙江舉報

分享至

就在今天凌晨，Anthropic 掏出來了他們最新的 Claude Opus 4.8。

距離 Opus 4.7 才過去一個多月，不得不說，Claude 上新的速度是越來越快了。

本來吧，4.8 注定只是大伙兒眼里的小版本更新。但世超發(fā)現(xiàn)，這次事情并沒有那么簡單。

因為不少人懷疑，Opus 4.8 似乎蒸了，蒸的還是 DeepSeek 和千問。。。

很多人通過 API 詢問 Opus 4.8，你是什么模型，你背后的公司是什么，結(jié)果他一會兒說自己是通義千問，一會兒來自深度求索。

之前無證據(jù)亂錘中國模型蒸餾 Claude，現(xiàn)在反而被揪住小辮子，Anthropic，你小子怎么回事嗯？

當(dāng)然，蒸沒蒸是一回事，好不好用是另一回事。只不過在大伙兒試用之前，Opus 4.8 已經(jīng)先上了一層懷疑的濾鏡。

根據(jù)官方的博客，這回 Opus 4.8 改動并不大。最顯著的改進之一，就是更誠實了。

換句話講，那種莫名自信，嘴硬之后 “ 對不起，我之前說錯了 ” 的情況，Opus 4.8 身上發(fā)生的概率會大大減小。

另外，據(jù)說它在做 Agent 任務(wù)時會更可靠，判斷力更強，能自己發(fā)現(xiàn)問題，提出異議，用最終最好的答案穩(wěn)穩(wěn)接住你。

而從性能表上來看，Opus 4.8 只能說各方面小有提升，但沒啥特別出彩的，其中一個 coding 指標(biāo)還打不過兩個月前的 GPT-5.5。

從用戶實際反饋來看，Opus 4.8 褒貶不一。有人表示它確實變誠實了，不會輕易不查資料亂講，經(jīng)常自我反思，干活主動穩(wěn)定，安全性也有了明顯的提升。

來源：小紅書 @on99

但也有人說它依然不如白月光 Opus 4.6，語言表達的人味兒還沒回來，token 消耗還飛快，甚至還有不少人發(fā)現(xiàn)它依然在 coding 的時候亂講，比起 Opus 4.7 沒啥變化。

世超親自上手試了試以后，感覺倒也不是 Opus 4.8 不好，但代價是什么呢？

就說它的 “ 誠實 ” 特性，Opus 4.8 在一些比較危險的問題上，確實考慮周到不亂講，但也變得極其保守。

面對一些風(fēng)險較高的決策，比如世超給它一張毒蘑菇照片，問它能不能吃，它的思考過程相當(dāng)客觀冷靜。

不過，在一些安全項里，Opus 4.8 表現(xiàn)得過度謹(jǐn)慎。即使它覺得大概率沒毛病，也只會說 “ 我的顧慮小了很多，這也可能是劇毒菌撞臉 ”。

這當(dāng)然是負(fù)責(zé)任的。畢竟真有人照著 AI 的話去吃蘑菇，那可不是鬧著玩的。

但從用戶體驗上來說，這可能會導(dǎo)致很多問題得不到確定的答復(fù)，句句都是 AI 給自己疊的甲，相當(dāng)難受。

另外，如果想要 Opus 4.8 保持水準(zhǔn)，最好不要嘗試 High 以下的性能（effort)。高消耗，才有好表現(xiàn)。

比如下面這種新聞總結(jié)的活兒，很基礎(chǔ)吧。但 Opus 4.8 Low 給出的第一條新聞就是錯的，Sholto Douglas 發(fā)那條動態(tài)已經(jīng)是三天前的事兒了，怎么能連自家的新聞都搞錯。。。

想讓它做事實核查，還得再追問一遍，說好的主動檢查發(fā)現(xiàn)問題提出異議，用最準(zhǔn)確的答案穩(wěn)穩(wěn)接住我呢？

接下來世超又試了試它的代碼能力，這回它的能力強，還是用時間和 token 換的。

常規(guī)的 leetcode 困難算法題，對 Opus 4.8 來說已經(jīng)不成問題了。而當(dāng)我找了一個超難題 LCP 82 丟給 Opus 4.8，即使開 Extra 模式，123 行代碼，它也足足思考了二十多分鐘。

結(jié)果的確是相當(dāng)不錯，Opus 4.8 一遍就過，思考出了第一版代碼還復(fù)查優(yōu)化了一遍，現(xiàn)在能做到這種程度的模型并不多。

但作為對比，GPT-5.5 思考了兩分鐘，就給出了一個測試案例通過 99% 的答案。唯一一個案例失敗的原因，是時間超限，其實也不算答錯。這明顯比 Opus 4.8 要省得多。

世超又嘗試讓 Opus 4.8 獨立制作一個日式校園 galgame，不得不說現(xiàn)在 AI 寫的項目代碼層次分明，框架清楚。

這意味著，在它的基礎(chǔ)上，如果你想改立繪，加劇情，把游戲做大做強是很容易的。

世超淺玩了一下，所有功能包括存檔，自動播放，CG 畫廊等等，沒有任何 bug。

但是 Claude 斷斷續(xù)續(xù)，做了足足一個多小時。下面 GPT-5.5 這個雖然簡陋很多，該有的功能一樣不差，只用了五分鐘。

所以，花更多的錢和時間換來的答案值不值得？可能也只有大伙兒自己心里清楚了。

總的來說，Opus 4.8 繼承了 Claude 過往的強項，沒有特別出色的表現(xiàn)，平平常常普普通通。

而在測試之后，世超最想說的卻不是這個模型本身到底咋樣，而是現(xiàn)在用個 Claude，也太小心翼翼了。

作為業(yè)界價格的巔峰，用 Claude 最好的模型，不舍得開最好的性能；開最高的性能，不舍得用最好的模型。處處是陷阱，在你不注意的時候，無關(guān)緊要的小問題已經(jīng)把 token 燒光了。

而且讓用戶自己選性能，只有 low 和 high 也就算了，這次，Opus 4.8 一口氣推出了 5 種檔位，Low、Medium、High、Extra 和 Max，普通人真搞不明白什么時候用哪個，很容易造成浪費。

現(xiàn)在，Opus 4.8 相關(guān)的評論區(qū)里，世超看到不少人陷入了 Opus 4.6 下架的恐慌。

大伙兒別擔(dān)心，在更多模型里，老模型還在，想用還能用到。

但坦白講，這種負(fù)優(yōu)化不僅僅是 Anthropic 一家的困境，不少廠商都透著一股新不如舊的無奈。

雖然交出的參數(shù)答卷越來越漂亮，可那些曾經(jīng)讓用戶感到驚艷的極致體驗，又要什么時候才能回來呢？

撰文：莫莫莫甜甜

編輯：江江 & 面線

美編：煥妍

圖片、資料來源：

X、小紅書、領(lǐng)英、Anthropic 官網(wǎng)

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

國內(nèi)首次！面壁開源千萬級SFT與最大中文數(shù)據(jù)，MiniCPM5-1B底座公開

新智元 2026-05-29 18:44:58
0 跟貼 0
DiffusionOPD：復(fù)旦聯(lián)合通義萬相提出擴散模型在線策略蒸餾新范式

機器之心Pro 2026-05-29 16:23:04
1 跟貼 1

消耗1830億token，Meta用AI把數(shù)學(xué)教材翻譯成了一個超大Lean庫

機器之心Pro 2026-05-29 13:43:30
3 跟貼 3

Anthropic發(fā)布Claude Opus 4.8，重點是：“我不會騙你”

鈦媒體APP 2026-05-29 18:20:15
2 跟貼 2
倒反天罡，AI開始給人類打分！Claude評分標(biāo)準(zhǔn)曝光: 優(yōu)秀人類得7.5分

新智元 2026-05-30 15:07:01
0 跟貼 0

狗子：不好觸發(fā)底層代碼了

娛圈小宇宙 2026-05-29 20:29:47
5 跟貼 5

孩子去“光頭強家”，對著床上被子一頭栽下去，沒想到是模型！

笑出豬叫的趣聞閣 2026-05-26 17:08:43
1 跟貼 1
卡帕西都整破防了：AI Coding沒門檻，可部署環(huán)節(jié)真嗯啊的難

量子位 2026-03-27 12:12:46
0 跟貼 0

Opus 4.8來了，Anthropic估值即將突破萬億美元

鈦媒體APP 2026-05-29 11:14:33
0 跟貼 0
AI 編程終于有全局視野了！3 萬 Star 項目補齊最大短板

鈦媒體APP 2026-05-30 10:22:27
1 跟貼 1
煙臺一企業(yè)所售雞蛋獸藥超標(biāo)69倍

現(xiàn)代快報 2026-05-29 17:09:28
10010 跟貼 10010
小伙網(wǎng)購智能鎖，在家測試安全性時，竟然可以徒手撕開！

三事堂觀察 2026-05-29 15:51:51
6 跟貼 6
比劇透提前！Anthropic發(fā)布Claude Opus 4.8：更“誠實”、可調(diào)思考強度、新功能協(xié)調(diào)數(shù)百智能體

華爾街見聞官方 2026-05-29 01:51:07
21 跟貼 21
AI自己寫代碼，訓(xùn)出1B端側(cè)「小鋼炮」-1

機器之心Pro 2026-05-26 14:32:09
0 跟貼 0
AReaL v1.0開源，智能體強化學(xué)習(xí)「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
沈乾若：分?jǐn)?shù)及其運算如何難倒了美國學(xué)生？

學(xué)人Scholar 2026-05-30 16:48:31
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
「老閆說車」蔚來全新ES8首批用戶，行駛1萬公里后的真實看法

閆闖說車 2026-05-28 21:31:41
0 跟貼 0
5億Tokens白送！全球首個商用AI主機發(fā)布，終于能放開燒Token了

量子位 2026-05-29 17:04:03
3 跟貼 3
集采百元一盒藥，藥店竟賣3960元，為何賣出如此高價？記者調(diào)查

新京報 2026-05-30 11:58:09
2729 跟貼 2729
扎哈羅娃：俄將對羅馬尼亞迅速采取報復(fù)措施

參考消息 2026-05-30 11:58:56
4408 跟貼 4408
來中國網(wǎng)購久了，忠實用戶的心聲，感動分享過程！

搞笑面包狗 2026-05-26 16:23:15
1 跟貼 1
“張雪機車”位列超級桿位賽第二名

央視新聞客戶端 2026-05-29 21:06:29
4253 跟貼 4253
清華系團隊給大模型織了一張“智能算力電網(wǎng)”

量子位 2026-05-29 10:44:47
1 跟貼 1
烏軍指揮樓被90枚導(dǎo)彈炸平！俄軍攤牌：決策中心照打不誤

戀與深空 2026-05-28 00:27:03
0 跟貼 0
鮮奶雪糕包裝印“不加一滴水”配料表首位竟是水廠家：系舊包裝，已改名“一滴水”

上游新聞 2026-05-29 18:03:05
1865 跟貼 1865
再被曝光“圈路收費”的瀘沽湖景區(qū)：已開通過境車輛專用通道

南方都市報 2026-05-29 17:10:06
1594 跟貼 1594
浙江兩級文物部門回應(yīng)：文物戰(zhàn)國青銅劍疑有拼接痕調(diào)查結(jié)束近期通報

新京報 2026-05-29 17:23:45
2551 跟貼 2551
Token經(jīng)濟邁入新階段超智融合大算力成重要“入場券”

每日經(jīng)濟新聞 2026-05-29 18:05:03
0 跟貼 0
地毯拖拽行李費力？廣州白云機場回應(yīng)T3三大熱點

南方都市報 2026-05-30 00:19:26
718 跟貼 718
世界上最快的模型車超過300公里的時速

淺夢看世界 2026-05-30 00:16:47
3 跟貼 3
稻城亞丁景區(qū)問題，最新通報

云南網(wǎng)絡(luò)廣播電視臺 2026-05-29 09:45:59
1383 跟貼 1383
美聯(lián)儲最關(guān)注的通脹指標(biāo)今晚公布，或點燃加息恐慌，美聯(lián)儲官員發(fā)出警告！

每日經(jīng)濟新聞 2026-05-28 23:20:07
0 跟貼 0
SpaceX星艦?zāi)Ｐ驼娴拇林形伊耍?斤重的304不銹鋼材質(zhì)，全鏡面工藝摸起來超有質(zhì)感，擺在那兒就顯得

制造科技 2026-05-28 18:27:19
17 跟貼 17
幫Gemini拿下IMO金牌的關(guān)鍵先生，差點成了職業(yè)鋼琴家

量子位 2026-05-30 14:39:54
0 跟貼 0
Opus 4.8連夜算盡1170億人命運，一句話敲出人類投胎模擬器！

新智元 2026-05-30 15:11:01
0 跟貼 0
為什么說比亞迪這次的兜底，要比堆參數(shù)更狠？

愛活網(wǎng)Evolife 2026-05-29 16:45:05
11 跟貼 11
開會，是最大的腐敗

黑噪音 2026-05-30 10:55:51
0 跟貼 0
C-130引擎模型！可變槳！可調(diào)速！收藏級還原太酷了#航模

制造科技 2026-05-29 08:05:14
0 跟貼 0
廣州洛溪大橋被指熱得像烤爐，時隔近一年仍未解決

新快報新聞 2026-05-30 13:35:57
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

說實話，我覺得 Claude 4.8 有點拉。

車圈大佬發(fā)聲：價格戰(zhàn)遠去，但競爭仍殘酷

普京稱俄烏沖突臨近收尾同日空襲基輔 媒體：并行不悖

普京稱俄烏沖突臨近收尾同日空襲基輔 媒體：并行不悖

歲月不饒人！39歲德約鏖戰(zhàn)近5小時拼到嘔吐

向太曝黃曉明曾當(dāng)眾給她下跪

雙匯管不住一頭豬

900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

態(tài)度原創(chuàng)

大語文時代，語文考試知識面非常靈活，一定要幫孩子多積累這..

《地平線6》神秘玩家被全網(wǎng)追殺！殺手47都出動了

2026夏天最新5款發(fā)型合集，每一款都超心動！

王文生 2026風(fēng)景寫生新作

REDMI K90賣爆，中屏機逆襲了？

普京稱俄烏沖突臨近收尾同日空襲基輔媒體：并行不悖

普京稱俄烏沖突臨近收尾同日空襲基輔媒體：并行不悖

900V+3.2秒破百領(lǐng)克10+&領(lǐng)克10上市16.99萬元起