无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

今天凌晨，Claude Opus 4.8 上線，融資 650 億美金，但更強的還在后面

2026-05-29 13:10:01　來源: 唐韌

北京舉報

0

分享至

昨晚，Anthropic 發布了最新一代模型 Claude Opus 4.8。

圈子里照例又是一波跑分截圖刷屏，Opus 4.8 各種領先，編碼能力全面霸榜。

但說實話，我現在對跑分已經無感了，幾乎每家模型發布時都會拿跑分說事。

我覺得真正值得關注的，是兩個 0%。

一個是「謊報率」，就是模型處理數據出了問題，但它裝作沒事跟你說搞定了。

Opus 4.5 這個數字是 0.40，Opus 4.7 降到 0.25，到了 4.8 直接歸零。

另一個是「偷懶調查率」，就是遇到需要深挖的問題，模型敷衍了事給你一個似是而非的答案。

在這個指標上，Opus 4.7 還有 25% 的概率偷懶，而 Opus 4.8 同樣是 0%。

兩個 0%，兩個歷史首次。

如果你用 AI 寫過代碼、做過數據分析、搞過一些研究，就知道最怕的不是它能力不夠，而是它能力不夠還裝出一副自己很厲害的樣子。

Opus 4.8 解決的就是這個問題，它不再假裝什么都會，遇到不確定的東西時，也會主動告訴你「這里我沒把握」。

在我看來，這個迭代比跑分高 10 個百分點重要得多。

那么，Opus 4.8 和前代的 4.6、4.7 到底有什么本質區別？

經過大概體驗后，我把幾個核心差異捋一下。

第一，誠實度和可靠性。

我自己目前用的是 Opus 4.6，也是我認為在內容創作上表現最好的模型，沒有之一。

在 4.6 版本里，Claude 在誠實性上雖然已經比同行好，但仍然有不少「過度自信」的問題。

后來的 4.7 做了改善，到了 4.8 則徹底解決了。

說白了，4.6 像一個能力不錯但愛面子的員工，4.7 像一個嚴謹且能力很強的員工，4.8 像一個真正靠譜的高級工程師。

第二，效率。

同樣的任務，4.8 比 4.7 少用 15% 的步驟，少輸出 35% 的 token。

對開發者來說，token 就是成本。做得更好還更省，這才是真正的代際進步。

第三，編碼能力的躍升幅度。

這么說吧，4.6 到 4.7 的編碼提升是漸進式的，4.7 到 4.8 的提升是跨越式的。

在一些極端測試里，比如給你一個編譯好的二進制文件，不準反編譯，讓模型從零重建源代碼。4.8 在 1M token 預算下的表現，4.7 要 5M 才能追上。

第四，Agent 能力本質上的不同。

4.6 的 Agent 能力還處于「能跑但不夠穩」的階段。4.7 穩定性提升了，但遇到復雜情況還是容易走偏。

4.8 有一個明顯的變化，它開始有了真正的判斷力。

官方放了一個案例，開發者在用 Claude Code 遷移代碼，然后中途出去了，Claude 在后臺自己跑。

跑到一半代碼提交被拒絕了，因為同事在這期間也提交了一個緊急修復。Claude 通知開發者，開發者隨口說「直接強制覆蓋就行」。

但是，Claude 拒絕了。

它判斷出強制覆蓋會丟掉同事剛提交的緊急修復，于是自己把兩邊的改動合并好，保證代碼一致、提交歷史干凈，然后推送。

這不是簡單的「執行指令」，這是在該拒絕的時候拒絕。這是 Agent 從工具進化到協作者的關鍵一步。

這次發布的新能力里還有一個我覺得很強的功能，名字叫「Dynamic Workflows」。

簡單說，就是 Claude 接到一個大任務后自己寫腳本并分配給很多并行的子 Agent 去做。

做完之后，再互相檢查、互相挑刺，最后匯總結果交給你。

這個功能目前還是預覽狀態，而且 token 消耗遠高于普通對話，不適合隨便拿來用。

不過我覺得，這個能力會成為 Claude Code 未來的殺手锏。

我再說個有意思的事。

4.8 上線后不久，有人通過 API 調用問它「你是誰」，它有時候會說自己是 Qwen，有時候說自己是 DeepSeek。

技術社區對此的猜測是，蒸餾。

也就是說，Opus 4.8 的訓練過程中可能用了其他模型的輸出數據做知識蒸餾。

這個事本身不影響能力，但挺值得玩味。

AI 模型之間的知識流動比我們想象的復雜，你用的可能不是一個純血模型，而是一個融合了多家智慧的混合體。

最后，總結一下。

首先，Opus 4.8 第一次讓 AI 模型做到了誠實。

在所有前沿模型里，它是第一個在可靠性指標上做到零缺陷的。這對企業用戶來說，比性能高 5% 重要十倍。

二是效率。

更強的同時更省 token，這直接影響成本結構。雖然依舊不便宜，但是相較于前代能力提升的同時價格維持一致。

三是 Agent 形態的進化。

從單次回答到長任務執行，再到多 Agent 并行協作，Claude 的產品形態已經不再是一個聊天窗口，而是在變成一個工作系統。

此外，Anthropic 同一天還宣布了 650 億美元融資，估值 9650 億，逼近萬億美金。

接下來幾周，Anthropic 還會放出 Claude Mythos，這頭猛獸出來時不知道又會引發什么超級進化。

按照目前的信息，Mythos 是比 Opus 更高一級的模型。有人猜測，Opus 4.8 本身就是 Mythos 的蒸餾版。

如果真是這樣，那 Mythos 正式上線的那天，才是真正的分水嶺的開始。

對此，我十分期待。

················· 唐韌出品 ·················

安可時刻

我已經到上海了，明后兩天舉辦最新一期 AI 個體戶訓練營。

下午先去見昨天文章里說的那個人，很多人說他現在已經不是普通人了。但我覺得，他依舊是普通人的代表。

沒背景、靠自己、出人頭地，算是完成了階級跨越。

就想我昨天說的，做資源、信息、能力的整合者，這就是他成功的秘訣。

不止是他，我從很多和他類似的人身上都看到了一個共性，快速擁抱變化。

無一例外，這些人基本都在共同擁抱 AI。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Sonnet 5終于來了，然而Opus 4.8現在有點尷尬

鈦媒體APP 2026-07-01 12:18:12
0 跟貼 0
退錢！Claude 4.8連夜大降智，GPT-5.6算力遭「腰斬」

新智元 2026-06-30 19:19:27
9 跟貼 9

AI當老板，快給10家公司干破產了

量子位 2026-06-29 16:27:33
8 跟貼 8

Transformer的八個爹媽，如今都在哪？

機器之心Pro 2026-06-29 10:27:31
19 跟貼 19
Claude Fable 5省錢秘訣來了：調成Low檔比Opus更便宜

量子位 2026-06-11 16:23:55
3 跟貼 3

Anthropic發布Claude Science，AI開始像研二學生一樣做科研

DeepTech深科技 2026-07-01 13:28:06
3 跟貼 3

實錘了：Claude Code偷查用戶，時區、中國AI實驗室全是關鍵詞

機器之心Pro 2026-07-01 10:43:13
3 跟貼 3
具身智能Skill時刻！英偉達開源機器人技能庫，Jim Fan：范式變了

量子位 2026-07-01 17:32:08
0 跟貼 0

從瘋狂翻表到群里直接@AI：飛書來了個新同事，把臟活累活全包了

愛范兒 2026-07-01 15:39:25
0 跟貼 0
Karpathy又封神！掀翻RAG，把你的筆記變成第二大腦

新智元 2026-07-01 09:19:18
0 跟貼 0
黃仁勛的物理AI ChatGPT時刻，正被這家中國公司的“流式多模態”接棒

智東西 2026-07-01 18:22:19
0 跟貼 0
99萬的陪伴機器人，優必選不只是想單純賣硬件

鈦媒體APP 2026-07-01 18:16:21
0 跟貼 0
周鴻祎：中國必須擁有自己的Mythos

看看新聞Knews 2026-07-01 10:48:03
257 跟貼 257
開源鴻蒙入局機器人，M-Robots不想再各自為戰

鈦媒體APP 2026-07-01 18:16:12
0 跟貼 0
CRISPR之母杜德納給硅谷潑冷水：AI還治不了病，創新仍然屬于人類

DeepTech深科技 2026-07-01 18:32:17
0 跟貼 0
核彈發射需要多少段代碼？有多“復雜”？ # 軍事科普

裝備解析室 2026-06-29 10:43:49
0 跟貼 0
女人為了攀上高枝，竟把目標瞄準了男友的富豪父親

七仔剪輯 2026-06-30 15:47:43
1 跟貼 1
竇文濤：不是所有的富豪都想出名，有的富豪生活糜爛到不可想象

皓籃球 2026-06-27 02:50:07
16 跟貼 16
坎貝爾承認：中國是最成功渡過難關的國家

澎湃新聞 2026-06-30 20:22:33
11192 跟貼 11192
印度裔抱團、代碼被鎖死、公司停擺，張江事件的致命教訓！

A活著 2026-07-01 17:03:00
11 跟貼 11
突發，打工版Claude 5來了！人人都能用

新智元 2026-07-01 07:10:27
3 跟貼 3
哈蘭德奉獻絕殺創紀錄主帥稱其"當今足壇最偉大射手"

紅星新聞 2026-07-01 07:48:30
1602 跟貼 1602
慢牛需要基本面支持許多投資人沒有享受到結構性牛市的快樂

究竟視頻 2026-06-28 09:33:23
0 跟貼 0
足球小將慶功宴場面火爆，到場人數太多主辦方女兒沒座位

小椰子專欄呀 2026-06-28 04:18:34
10 跟貼 10
開了一次就“頭暈”？看到機器上的英文單詞，他覺得自己被罵了

北青網-北京青年報 2026-06-28 14:48:24
1826 跟貼 1826
A社你解釋下，啥叫Sonnet 5比Fable 5還貴？

量子位 2026-07-01 09:15:11
3 跟貼 3
富豪律師和落魄灰姑娘，男友小心翼翼的維護著女孩的自尊

影中見影 2026-06-28 10:25:08
17 跟貼 17
2026年職場警報：你的老板可能在用AI Agent碾壓你

醫路防老 2026-07-01 03:10:30
0 跟貼 0
漁民把“報紙”賣給臺灣特工，7個月換回美金1200元，麻將36副

史論人生 2026-06-30 06:45:09
0 跟貼 0
Anthropic被爆藏隱秘代碼，中國用戶會被特殊標記？

機器之心Pro 2026-07-01 18:29:07
0 跟貼 0
來看看億萬富豪的平凡生活，張雪是我見過最接地氣的男人！

胡又扯 2026-07-01 02:41:55
0 跟貼 0
當你撐不下去的時候，看看馬斯克的來時路

華商韜略 2026-06-16 11:47:01
855 跟貼 855
當地華人講述法國高溫：中國空調一機難求，有人為搶購空調打起來，安裝已排到9月

瀟湘晨報 2026-06-29 21:36:19
7457 跟貼 7457
一句話生圖要過時了？開源圖像生成Agent進化出「工具編排」

機器之心Pro 2026-07-01 14:04:29
0 跟貼 0
中國用戶被針對！Anthropic承認私藏“木馬”Claude信任崩塌，網友直呼太可怕

智東西 2026-07-01 17:30:56
0 跟貼 0
如期跳水！多只科技股出現“對子頂”，什么信號？——道達投資手記

每日經濟新聞 2026-07-01 18:33:49
0 跟貼 0
國際私募巨頭持續加碼創新藥賽道 KKR等向BridgeBio注資10億美元

財聯社 2026-07-01 18:09:31
0 跟貼 0
重慶：推動“久供未建”項目實質性開工、“久建未完”項目恢復正常建設

財聯社 2026-07-01 18:09:03
0 跟貼 0
馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
34 跟貼 34
海爾、美的、格力回應歐洲空調需求激增

中國能源網 2026-06-30 09:44:04
188 跟貼 188

烏克蘭邁出危險一步，拿中國核心利益去換援助，中方是時候反擊了

烏克蘭邁出危險一步，拿中國核心利益去換援助，中方是時候反擊了

古史青云啊

2026-07-01 17:08:28

固態電池神話徹底破滅，中科院曾連發＂王炸＂，電池行業迎來變局

固態電池神話徹底破滅，中科院曾連發＂王炸＂，電池行業迎來變局

黑翼天使

2026-06-24 13:56:28

全網喊話“韋神” 做高考數學卷，沒想到他的一句話，就讓千萬網友瞬間服氣

全網喊話“韋神” 做高考數學卷，沒想到他的一句話，就讓千萬網友瞬間服氣

不二大叔

2026-06-29 14:33:45

日本出錢出技術，印度高鐵終于要建成了，何時能追上中國高鐵？

日本出錢出技術，印度高鐵終于要建成了，何時能追上中國高鐵？

荷蘭豆愛健康

2026-07-01 10:39:09

人活多久，睡覺就知道？醫生：壽命短的人，睡覺一般有這4個特征

人活多久，睡覺就知道？醫生：壽命短的人，睡覺一般有這4個特征

白宸侃片

2026-07-01 16:17:27

會場爆發激烈交鋒，巴拿馬對中方窮追不舍，中國大使火力全開怒懟

會場爆發激烈交鋒，巴拿馬對中方窮追不舍，中國大使火力全開怒懟

史料布籍

2026-07-01 11:54:25

溫柔如你：那不是天賦，是穿過風雨后的選擇

溫柔如你：那不是天賦，是穿過風雨后的選擇

疾跑的小蝸牛

2026-07-01 18:32:49

他是上海社保局原局長，被富豪用美色拉下馬，獲刑18年后怎樣了

他是上海社保局原局長，被富豪用美色拉下馬，獲刑18年后怎樣了

名人家事情事

2026-07-01 07:10:34

45歲李小璐終于認錯了，自曝無戲可拍，后悔自己太“戀愛腦”

45歲李小璐終于認錯了，自曝無戲可拍，后悔自己太“戀愛腦”

南萬說娛26

2026-06-30 08:45:41

首輪淘汰賽才戰罷7場，已有2個小組全軍覆沒，含德國所在死亡E組

首輪淘汰賽才戰罷7場，已有2個小組全軍覆沒，含德國所在死亡E組

智道足球

2026-07-01 17:24:21

3場5球追平挪威隊史紀錄！哈蘭德絕殺后坦言：戰勝巴西隊機會非常小

3場5球追平挪威隊史紀錄！哈蘭德絕殺后坦言：戰勝巴西隊機會非常小

紅星新聞

2026-07-01 08:20:15

女特種兵休假被人販子拐賣,當人販子美美數錢時,竟不知她已在身后

女特種兵休假被人販子拐賣,當人販子美美數錢時,竟不知她已在身后

紅豆講堂

2025-03-24 10:44:33

央視罕見公開西太對峙細節！日艦模擬攻擊遼寧艦，結果沉默？

央視罕見公開西太對峙細節！日艦模擬攻擊遼寧艦，結果沉默？

青青衫書生

2026-06-30 13:24:21

養路費迎來歷史性大調整：脫離油價捆綁，改用按實際里程計費

養路費迎來歷史性大調整：脫離油價捆綁，改用按實際里程計費

生活魔術專家

2026-07-01 10:29:08

科技龍頭扎堆“對子頂”？下半年第一天，A股畫風突變

科技龍頭扎堆“對子頂”？下半年第一天，A股畫風突變

21世紀經濟報道

2026-07-01 18:46:06

中國國際金融股份有限公司黨委書記、董事長陳亮：金融報國踐行初心使命

中國國際金融股份有限公司黨委書記、董事長陳亮：金融報國踐行初心使命

經濟日報

2026-07-01 07:31:15

原來有錢人也會抑郁啊！網友扎心道出：財務是自由了人心也看透了

原來有錢人也會抑郁啊！網友扎心道出：財務是自由了人心也看透了

墜入二次元的海洋

2026-07-01 08:54:54

我國首位香港航天員黎家盈在空間站展示香港特別行政區區旗，感謝祖國、祝福香港

我國首位香港航天員黎家盈在空間站展示香港特別行政區區旗，感謝祖國、祝福香港

政知新媒體

2026-07-01 16:00:35

＂三哥，你尾款我不要了！＂中國外貿人反殺印度老賴，招招絕了！

＂三哥，你尾款我不要了！＂中國外貿人反殺印度老賴，招招絕了！

明天后天大后天

2026-06-04 00:22:08

馬克龍沒想到，歐洲迎超40度高溫后，中國竟成法國的“救命稻草”

馬克龍沒想到，歐洲迎超40度高溫后，中國竟成法國的“救命稻草”

瀲滟晴方DAY

2026-06-30 13:53:37

用產品思維解決難題

1499文章數 2043關注度

往期回顧全部

科技要聞

Claude Code被曝“植入木馬”識別中國用戶

頭條要聞

副行長借朋友名義貸款470萬 400萬自用70萬給朋友用

頭條要聞

副行長借朋友名義貸款470萬 400萬自用70萬給朋友用

體育要聞

賣球衣救子的門將，把德國撲出了世界杯

娛樂要聞

張凌赫：我連心疼你都隔著時差

財經要聞

新氧貸款：宣傳年化15%，實際頂格24%

汽車要聞

半程收官上汽集團銷量突破200萬輛

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

家居

房產

健康

藝術

數碼要聞

零刻ME Pro四盤位H255新品NAS迷你主機發布，2739元起

家居要聞

傳奇筑日常詩

綠意盎然自然之境
空間微調移形換境
自由流光回溯生活真意

房產要聞

洋房盛大交付，中海丨南海·叁號院獻映世界海岸的人居答案

年糕湯圓別油炸，水煮清蒸更健康

藝術要聞

這5件2026屆畢業油畫作品，被中國美術學院美術館收藏

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版