網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

我翻了6000多條日志，發現Claude推理深度暴跌67%

2026-04-17 09:09:17　來源: AI效率筆記

河南舉報

0

分享至

我翻了6000多條日志，發現Claude推理深度暴跌67%這不是感覺，是數據官方怎么說？一個新詞火了："AI縮水式通脹"一天中最差的時段：下午5點用戶情緒崩潰：數據不會說謊那我們該怎么辦？寫在最后

昨天我在Reddit上刷到一個帖子，標題很簡單："Claude變蠢了？"

底下幾百條回復，幾乎都在說同一件事：最近用Claude，感覺它沒以前聰明了。

有人說它回答更快了，但經常漏掉關鍵步驟。有人說它不再仔細讀代碼了。還有人說，它在長任務里更容易"提前結束"，像是默認事情已經完成了。

我一開始覺得這可能只是個例。畢竟和AI協作這事兒，有時候確實挺玄學的——prompt寫得不好，或者任務本身就不適合，都可能出問題。

但當我看到一個GitHub Issue的時候，我意識到這事兒沒那么簡單。

有人挖了6000多條會話日志，發現了一個讓人震驚的數字：Claude的推理深度，下降了67%。

這個分析來自GitHub上的一個Issue（#42796）。

作者分析了6,852個Claude Code會話文件，包括17,871個thinking blocks和234,760次工具調用。

數據不會說謊。

推理深度的變化：
- 1月底：平均約2,200字符
- 2月底：下降到約720字符
- 3月后：穩定在約600字符

下降幅度：67%。

更關鍵的是，這個變化不是突然發生的，而是從2月中旬開始逐步下降。

Read:Edit比例的變化：
- 1月底：6.6（每編輯一次，平均讀取6.6次）
- 3月后：2.0（每編輯一次，只讀取2次）

這意味著什么？

以前Claude在改代碼之前，會先讀目標文件、讀相關文件、grep搜索用法、讀頭文件和測試，然后才動手。現在呢？讀一下當前文件，直接改。

結果就是：改錯的地方、破壞周圍代碼、違反項目規范。

Anthropic沒有直接承認"模型變弱了"。

Claude Code的開發負責人Boris給出的解釋是：這些變化來自系統層的調整，包括工具調用方式、推理策略和資源分配機制。

他們引入了一個叫"自適應推理"（adaptive thinking）的機制。模型會根據任務復雜度，動態決定要用多少推理資源。

聽起來挺合理的：簡單任務少思考，復雜任務多思考，提升整體效率。

但問題在于：效率優化和能力削弱，在用戶體驗上沒有區別。

當一個模型開始更少閱讀上下文、更快給出答案、更頻繁地提前結束任務，用戶感受到的不是優化，是敷衍。

社區里開始流行一個詞："AI shrinkflation"（AI縮水式通脹）。

這個詞來自經濟學術語，指商品的大小或數量減少，而價格不變。

放在AI語境下，意思很直接：模型實際給用戶的能力變少了，但模型名稱和價格沒變。

更讓人不舒服的是時間點。

4月7日，Anthropic發布了Claude Mythos Preview，被稱為"能力躍遷的一代"。但這個模型不開放給公眾，只授權給亞馬遜、蘋果、谷歌、微軟等12家巨頭用于網絡安全。

一邊是"更強的新模型"只給少數人用，一邊是"體感變差的舊模型"讓大眾用。

于是，一個猜測開始在社區流傳：把舊模型削了再抬新模型，一捧一踩，新模型的升級幅度就顯得更大了。

這個邏輯沒有直接證據，但它正在被越來越多用戶相信。

數據分析還發現了一個有意思的現象：Claude的性能波動和時間段有關。

時段(PST): 下午5點 | 估算思考深度: 423字符 | 說明: 最差

時段(PST): 晚上7點 | 估算思考深度: 373字符 | 說明: 第二差

時段(PST): 晚上10-11點 | 估算思考深度: 759-988字符 | 說明: 恢復

下午5點PST是什么概念？是美國西海岸下班時間，東海岸晚上8點。

這個時候，平臺負載最高，思考深度最低。

這說明了什么？

思考深度不再是固定的"預算"，而是和平臺負載掛鉤。負載高的時候，模型"想得少"；負載低的時候，模型"想得多"。

用戶在為同樣的訂閱費買單，但得到的服務質量卻在波動。

分析還對比了用戶在變化前后的詞匯使用：

詞匯: "great" | 變化前: 3.00/千詞 | 變化后: 1.57/千詞 | 變化: -47%

詞匯: "stop" | 變化前: 0.32/千詞 | 變化后: 0.60/千詞 | 變化: +87%

詞匯: "simplest" | 變化前: 0.01/千詞 | 變化后: 0.09/千詞 | 變化: +642%

"simplest"這個詞的使用增加了642%。這是用戶在觀察和命名模型的新行為：選擇最簡單的路徑，而不是正確的路徑。

正負情緒比從4.4:1下降到3.0:1，情緒崩潰了32%。

說實話，作為用戶，我們能做的有限。但至少有幾點可以參考：

1. 避開高峰時段

如果你發現Claude變笨了，看看時間。下午5點到晚上8點（美西時間）可能是最差的時段。深夜或清晨使用，體驗可能會好一些。

2. 更明確的指令

當模型"想得少"的時候，你需要替它想得更多。把任務拆得更細，把要求說得更明確，減少它"偷懶"的空間。

3. 驗證輸出

不要完全信任模型的輸出。尤其是復雜任務，多檢查幾遍。以前可能一次就對的，現在可能需要兩三次迭代。

4. 考慮替代方案

如果你對Claude的表現不滿意，可以試試其他模型。GPT-6剛發布，Gemini也在持續更新。不同的模型有不同的特點，找到適合你工作流的那一個。

這篇文章不是要"黑"Claude。作為一個長期使用Claude的用戶，我對這個產品有感情。

但感情歸感情，數據歸數據。

當模型的推理深度下降67%，當Read:Edit比例從6.6降到2.0，當用戶情緒崩潰32%——這不是"優化"，這是退化。

更讓人擔心的是，這種變化是"靜悄悄"的。沒有版本說明，沒有提前通知，用戶只能在一次次失敗的協作中自己發現問題。

AI行業的"縮水式通脹"可能才剛剛開始。今天Claude削了，明天會不會輪到GPT？

我們需要的不是更快的回答，而是更可靠的回答。

如果這篇文章對你有幫助，點個贊、轉發給需要的朋友。有問題評論區聊，我看到都會回。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

字節養的“蝦”與1500億賬本背后

鈦媒體APP 2026-04-25 16:44:18
0 跟貼 0
Agent中的“愛馬仕”來啦：100k+ Star 的開源AI Agent ，正在偷偷給自己升級

鈦媒體APP 2026-04-23 09:27:15
0 跟貼 0

DeepSeek-V4報告亮了！V4發布延遲的秘密，終于曝光了

新智元 2026-04-25 13:42:06
33 跟貼 33

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
Token消耗砍半！神州數碼端出“養蝦”三件套，專治AI打工人

雷科技 2026-04-25 22:18:36
0 跟貼 0

這屆流量的情緒密碼是什么？

虎嗅APP 2026-04-26 03:46:12
0 跟貼 0

像梁文峰一樣誠實

象先志 2026-04-24 16:47:37
2 跟貼 2
美國一實驗室高管遺物中發現文件，曝光美長期在研究不明飛行物

主持人鈺峰 2026-04-25 09:04:26
0 跟貼 0

DeepSeek過于樸素了

虎嗅APP 2026-04-25 17:32:05
105 跟貼 105
朱祁鈺破局奪門之變的最佳策略

朝話熹史 2026-04-22 17:05:19
0 跟貼 0
烏克蘭前線士兵骨瘦如柴照片披露被指最長斷糧17天

澎湃新聞 2026-04-25 14:48:31
26620 跟貼 26620
貴得有理還是功能過剩？SAP這款HR軟件的定價悖論

報錯免疫體 2026-04-21 15:01:03
0 跟貼 0
和朋友挖山藥來擺攤，越干越有經驗，山藥太搶手忙得不亦樂乎！

搞笑桔子 2026-04-25 03:53:16
0 跟貼 0
一道叫"愛"的題目，怎么突然難住了所有人？

晚風也遺憾 2026-04-23 10:17:52
0 跟貼 0
日本現在通貨膨脹嚴重，快到了不行的狀態了。聽聽這位大哥咋說？

櫻庭芥子 2026-04-25 08:14:27
0 跟貼 0
在意大利擺攤是種什么樣的體驗？老外客人超愛鐵板炒粉炒面！

看你像個寶 2026-04-24 15:04:02
2 跟貼 2
破案！有趣的推理：本該由A調查B確定C再移送給D的時候，偏要屬于C的由D牽頭調查B同時要求A參與，結果會是什么樣子？

火事雜談 2026-04-25 08:50:22
0 跟貼 0
不會寫代碼的文科生耗時一月，用AI靈光做應用軟件賺了三萬元

星視頻 2026-04-22 15:21:34
0 跟貼 0
誰說工科生只會寫代碼？

中國網資訊 2026-04-22 10:15:39
0 跟貼 0
5部后勁超大的懸疑神劇！越看越上頭，建議收藏！

秋別離 2026-04-24 16:50:50
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
賴清德竄訪斯威士蘭失敗背后的三重邏輯

井芹仁小菜 2026-04-26 02:57:51
0 跟貼 0
67萬億砸下來，遠比08年兇猛！房價會不會炸？

財經保探長 2026-04-25 17:34:12
71 跟貼 71
蘇超最新積分榜出爐！

無錫博報 2026-04-25 21:51:59
87 跟貼 87
特工男攜帶重要文件被跟蹤，裝扮成盲人成功脫險

飛鳥潛影 2026-04-24 00:00:00
0 跟貼 0
看到中國排第30名城市，印網友服了：難怪老美稱他們是發達國家！

肆無忌憚的哭 2026-04-23 01:47:00
0 跟貼 0
美能源出口創新高二戰以來首次接近成為原油凈出口國

紅星新聞 2026-04-25 12:32:20
8722 跟貼 8722
商務部：取消對歐盟兩家金融機構相關反制措施

界面新聞 2026-04-24 22:08:41
568 跟貼 568
制作直升機遙控模型，阿帕奇AH-64

制造科技 2026-04-22 16:29:03
0 跟貼 0
中央發布重磅文件，2026房價現2個信號，大家做好準備！

阿虹在農村 2026-04-23 17:14:23
1 跟貼 1
美國富豪非洲打獵被5頭大象踩死

看看新聞Knews 2026-04-25 19:38:18
3599 跟貼 3599
一季度GDP增長6%，廣州經濟增速領跑一線城市依靠什么？

郭施亮 2026-04-24 13:00:40
0 跟貼 0
農村大哥擺攤賣菜煎餅，元一份太實惠，這畫面也是不多見了

干飯人小張呀 2026-04-24 10:50:54
0 跟貼 0
半掛模型玩具車買菜，要是超重了怎么辦，雷軍都不敢這么設計！

宇宙搞笑生活 2026-04-23 14:10:00
4 跟貼 4
蘋果不講武德！iPhone18 屏幕偷偷縮水，強逼用戶買Pro版？

極果酷玩 2026-04-23 12:53:41
12 跟貼 12
女攤販擺一排西瓜坐馬路中間攔路騎車男見狀掉頭離開

火煉樹 2026-04-25 18:40:55
97 跟貼 97
國際大都市，印度首都新德里！

小明不講理 2026-04-24 10:12:14
1 跟貼 1
救人的哥走了50余輛出租車自發送行

極目新聞 2026-04-25 15:18:34
2476 跟貼 2476
內地旅客買6000港元蟲草磨粉后結賬竟變成7.1萬

看看新聞Knews 2026-04-25 19:24:12
2957 跟貼 2957

“真大方，還拍給外人看”，女兒蹭枕頭，家長放網上，網友卻毛了

“真大方，還拍給外人看”，女兒蹭枕頭，家長放網上，網友卻毛了

蝴蝶花雨話教育

2026-04-21 00:05:03

私人賬戶收款要小心，2026監管新規，普通人必看

私人賬戶收款要小心，2026監管新規，普通人必看

芳姐侃社會

2026-04-24 22:40:35

上海原市委書記徐匡迪，書法飛白夾絲神似張裕釗，網友：南宮碑體

上海原市委書記徐匡迪，書法飛白夾絲神似張裕釗，網友：南宮碑體

石辰搞笑日常

2026-04-26 02:37:39

央視首次曝光：全球最強光刻機亮相，中國再次打破西方技術封鎖

央視首次曝光：全球最強光刻機亮相，中國再次打破西方技術封鎖

小叨娛樂

2026-04-24 20:01:42

”經濟學家吳曉求教授說：“老百姓都沒收入了，還在刺激消費！這種做法是錯誤的！

”經濟學家吳曉求教授說：“老百姓都沒收入了，還在刺激消費！這種做法是錯誤的！

張曉磊

2025-11-07 11:34:05

再見，曼聯！9000萬“大核”決定離隊！斥資2.4億簽下“新中軸”

再見，曼聯！9000萬“大核”決定離隊！斥資2.4億簽下“新中軸”

頭狼追球

2026-04-25 13:27:55

英超34輪戰罷爭5再無懸念熱刺絕殺保留保級希望阿森納重返榜首

英超34輪戰罷爭5再無懸念熱刺絕殺保留保級希望阿森納重返榜首

智道足球

2026-04-26 07:29:37

馬刺新妖刀一戰創8紀錄！末節10分還隔扣羅威米奇：天賦肉眼可見

馬刺新妖刀一戰創8紀錄！末節10分還隔扣羅威米奇：天賦肉眼可見

顏小白的籃球夢

2026-04-26 07:16:39

伊朗：處決伊爾凡·基亞尼

南方都市報

2026-04-25 18:07:27

廣東東莞一校花太漂亮身高169CM 體重51公斤五官精致到無懈可擊

廣東東莞一校花太漂亮身高169CM 體重51公斤五官精致到無懈可擊

王二哥老搞笑

2026-04-19 22:13:34

中央5臺直播乒乓球時間表：4月25日CCTV5轉播國乒！附乒壇動態

中央5臺直播乒乓球時間表：4月25日CCTV5轉播國乒！附乒壇動態

林子說事

2026-04-25 17:48:24

角色扮演界的“泥石流”回歸：低成本cos，讓人一看一個不吱聲

角色扮演界的“泥石流”回歸：低成本cos，讓人一看一個不吱聲

絳紫藝術

2026-04-20 19:16:21

芯片觀察者：美國先將中國芯片鎖死在28nm，然后打擊成熟芯片擴產

芯片觀察者：美國先將中國芯片鎖死在28nm，然后打擊成熟芯片擴產

蜉蝣說

2026-04-24 11:38:51

終于知道采購吃回扣是怎么被發現的了，網友分享真實，太開眼了

終于知道采購吃回扣是怎么被發現的了，網友分享真實，太開眼了

夜深愛雜談

2026-03-13 22:02:43

小玥兒 12 歲生日，沒了馬筱梅精心策劃，連一句公開祝福都沒有

小玥兒 12 歲生日，沒了馬筱梅精心策劃，連一句公開祝福都沒有

萌姐

2026-04-24 22:15:51

河南一男子因病偏癱，覺得虧欠妻子主動離婚，女兒擺酒席慶祝：他們開心就好，離婚不離家，母親繼續照顧父親，房車等全部財產都在母親名下

河南一男子因病偏癱，覺得虧欠妻子主動離婚，女兒擺酒席慶祝：他們開心就好，離婚不離家，母親繼續照顧父親，房車等全部財產都在母親名下

洪觀新聞

2026-04-20 16:20:08

上港隊長王燊超：娶了申花球迷，37歲仍征戰中超，恩師盼他回崇明

上港隊長王燊超：娶了申花球迷，37歲仍征戰中超，恩師盼他回崇明

妙知

2026-04-26 08:23:39

1979年越南女兵炸毀我軍坦克，羅興元端起高壓噴火槍，將千度烈焰灌進了十米外的地道

1979年越南女兵炸毀我軍坦克，羅興元端起高壓噴火槍，將千度烈焰灌進了十米外的地道

寄史言志

2026-04-24 22:21:06

郭冬臨現狀：住北京老房子，身形消瘦、臉頰凹陷，59歲無兒無女

郭冬臨現狀：住北京老房子，身形消瘦、臉頰凹陷，59歲無兒無女

娛說瑜悅

2026-04-23 16:04:39

邁阿密國際vs新英格蘭革命：梅西、蘇亞雷斯、德保羅首發出戰

邁阿密國際vs新英格蘭革命：梅西、蘇亞雷斯、德保羅首發出戰

懂球帝

2026-04-26 07:15:36

專注AI工具測評與效率提升。

397文章數 10關注度

往期回顧全部

科技要聞

DeepSeek V4發布！黃仁勛預言的"災難"降臨

頭條要聞

2萬海員在霍爾木茲海峽成"活靶子":或隨時被炸成灰燼

頭條要聞

2萬海員在霍爾木茲海峽成"活靶子":或隨時被炸成灰燼

體育要聞

那一刻開始，兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失，中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展樂道L80正式官宣

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

本地

手機

教育

軍事航空

藝術要聞

毛澤東寫小字，太瀟灑了

本地新聞

云游中國｜逛世界風箏都留學生探秘中國傳統文化

手機要聞

停更一年憋大招！小米大折疊攜玄戒O3回歸，系統也是新的

教育要聞

學校管理：“管”出規范，“理”出活力

軍事要聞

伊朗總統：不會在壓力、威脅下進行談判

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版