Claude"降智門":6852次日志背后的真相,讓我把核心工作流切回了古法編程
昨晚凌晨2點,我又一次把項目回滾到了三天前的版本。
原因很簡單:Claude Code把我在過去72小時里寫的代碼改得面目全非,而且越改越離譜。最諷刺的是,當我告訴它"這個設計方向有問題"的時候,它居然開始重寫整個架構——然后把我原本能跑通的模塊也寫壞了。
我盯著屏幕看了十分鐘,最后打開了VS Code的手動編輯模式。
這是我本月第四次切回"古法編程"。
更諷刺的是,我想起了DBinary在知乎上寫的那個回答:"我突然想問一下有多少人和我一樣開始把核心工作流切回了'古法編程',并且'古法'的比例開始越來越高。"
當時看到這句話,我還心想:不至于吧,肯定是你們沒用對方法。
現在我只想說:打臉來得真快。
說實話,兩個月前我還是Claude的死忠粉。
那時候我幾乎逢人就安利:Claude Opus 4.6就是目前最強的編程模型,沒有之一。寫代碼快、理解能力強、架構設計有深度,一個月200刀的訂閱費我都覺得值。
但從今年2月開始,事情變得不對勁了。
我注意到它的輸出變得越來越"急"。以前它會花好幾秒研究代碼結構,然后再給出修改建議。現在呢?幾乎是秒回,而且經常改了一半就停手,仿佛急著去趕下一個任務。
我開始記錄它的響應時間。以前平均8-12秒,現在平均2-3秒。快了,但質量肉眼可見地下滑。
有個細節特別讓我惱火。以前Claude遇到不確定的地方會問,會說"我不太確定這個函數的作用,你能解釋一下嗎"。現在?它直接瞎猜,猜對了算你運氣好,猜錯了你還得花時間debug。
我一開始以為是我的問題。是不是我的提示詞寫得不夠好?是不是我描述需求不夠清晰?我甚至去報了一個Prompt Engineering的課程,學習怎么讓AI更好地理解我。
直到我看到了AMD AI總監Stella Laurenzo在GitHub上發布的那份報告。
6852次真實會話的監測日志,將近三個月的數據。結論是:Claude的思考深度下降了67%。
不是17%,不是27%,是67%。
我愣在那,然后突然有種被當猴耍的感覺。
原來不是我變笨了,是AI在偷懶。
數據說得很清楚:代碼閱讀次數從6.6次/編輯驟降到了2.0次。這意味著什么?意味著Claude在看你的代碼之前就已經決定要怎么改了。它根本不愿意花時間真正理解你的項目結構,就開始輸出那些看似專業但實際上漏洞百出的建議。
我還注意到一個細節:3月8日后"懶惰鉤子"觸發了173次,而此前從未觸發過。
什么是"懶惰鉤子"?就是當AI不想深入思考時,它會找各種借口搪塞你。"這個任務太復雜了"、"我需要你提供更多上下文"、"我建議你換一種實現方式"——翻譯過來就是:我不想動腦子了。
更離譜的是API成本。因為淺層思考導致持續輸出錯誤,用戶不得不反復重試,最后成本暴增了80倍。
我算了一下自己的賬單,上個月確實比往常多花了將近500刀。而我當時還以為是我用得更頻繁了。
后來我才反應過來,不是我用得更多,而是我在反復交學費。AI給出一個錯誤的方案,我發現有問題,讓它改,它又給出另一個錯誤的方案,我再讓它改——一來二去,token就這么燒沒了。
Anthropic官方的回應很有意思。他們確認了兩次改動:2月9號引入了"自適應思考",3月3號把默認思考等級調到了"中級"。
他們的說法是:在智能、延遲、成本之間,找到一個"甜蜜點"。
聽到這個解釋,我笑了。
這不就是委婉地說"我們在偷偷降智"嗎?
我專門去看了知乎上DBinary的回答。
他說得特別到位:"對于一些關鍵的架構設計,Claude Opus 4.6在項目迭代設計中能力退化的極其嚴重。特別是當我們對一個框架設計到一半時,發現之前的架構設計不合理——這種推翻性的變革性的設計,只要一兩次就可以把現在最牛逼的Code Agent從天才打成傻福。"
他還提到了codex的問題:"codex找bug挺厲害,寫代碼和opus能力差了一個次元"。
這讓我想起我上周的經歷。我讓Claude重構一個模塊,結果它把原本能跑通的代碼也寫壞了。我讓它改回去,它又改出新的bug。折騰了三個小時,最后我干脆把代碼回滾到最初的版本,自己動手半小時搞定。
這完全就是我的經歷。
復雜項目最怕的不是AI寫得慢,而是它半懂不懂地亂改。你讓它改A,它把B和C也動了。你讓它重構,它把能跑通的代碼也寫壞了。然后你發現,與其花半小時跟它扯清楚,還不如自己花十分鐘手動改完。
最可怕的是那種"模式匹配失效"的情況。當項目的復雜度超過AI的理解范圍時,它會開始胡編亂造。不是"我不知道",而是"我瞎猜一個"。猜對了是它厲害,猜錯了是你背鍋。
DBinary管這叫"古法編程"。我管這叫"返璞歸真"。
但這件事真正嚇人的,不是Claude一個模型的問題。
是新智元那篇文章里說的:整個AI行業可能都在玩同一套把戲。
你想想,所有大模型公司現在都在算三筆賬:
用戶嫌慢,這是延遲問題。推理太貴,這是成本問題。要服務更多人,這是吞吐問題。
這三筆賬同時壓過來,平臺就一定會產生一種沖動:在用戶不敏感的地方,偷偷收一點"腦力稅"。
把默認思考調淺一點。把深入閱讀壓縮一點。把多輪推理收窄一點。
平均看,也許更劃算。報表上,也許更漂亮。用戶滿意度調查?短期可能還看不出來。
可對那些把AI當生產工具的人來說,天塌了。
因為復雜工作最值錢的,從來不是"輸出速度",是質量,是"先理解,再動手"的那段沉默。
我現在明白為什么那篇文章里說"你買下的從來不是智能,而是一種隨時可能被回收的體驗"。
太準確了。
這就像你買了一輛豪車,開了一個月后,車廠遠程OTA升級,把你的V8發動機換成了V6,然后跟你說"這樣更省油"。問題是,你買車的時候看中的是那個V8的推背感,不是省不省油。
AI模型的訂閱服務也是一樣。你訂閱的時候,是基于當時的性能做決定的。但后來性能下降了,價格沒變,你甚至連個通知都沒收到。
你以為你在購買一張通往未來AGI的船票,實際上,船長為了省油,偷偷關掉了雷達。而你還在船艙里,對著越來越慢的網速發呆,以為是自己手機的問題。
那個"賽博油條"的比喻也很絕。它不再是那個"謀定而后動"的智者,而淪為了一個急于打卡下班的打工人。它還能說話,還能寫代碼,甚至還更流暢。但你已經不敢把關鍵任務交給它了。
這就像一輛車,發動機還在響,方向盤也能轉,油門踩下去也還能沖。只是剎車,悄悄薄了一層。
你平時感覺不到,直到你需要急剎車的時候,才發現不對勁。等你發現的時候,可能已經晚了。
這就是Claude"降智門"最可怕的地方:不是它完全不能用了,而是它在你毫無察覺的情況下,變得不再可靠。
所以我現在的工作流是這樣的:
簡單任務,讓AI干。復雜架構,自己來。遇到需要推翻重來的設計,直接切回古法編程,摸透每一個接口,理解每一行代碼。
效率?確實比純用AI的時候低了一點。
但代碼質量?穩多了。
而且我發現,當我自己動手寫代碼的時候,我對項目的理解更深了。以前我依賴AI來"理解"代碼,現在我必須自己理解。這種"摩擦感"雖然痛苦,但讓我成為了一個更好的工程師。
DBinary說得對:"古法編程的摩擦感強制要求開發人員摸透整個項目框架的每一個細節,當發生設計變更時,開發人員可以很快的定位到哪些代碼需要變動,哪些接口需要重新適配。"
這就是代價,也是收獲。
DBinary在回答最后說:"以前我以為AI不行的,他行,今天我以為他行的,結果又不行了,我到底在期待什么。"
我想我的期待很簡單:要么你告訴我真實的性能參數,讓我自己決定要不要用;要么你就別偷偷改默認值,把我當傻子一樣蒙在鼓里。
畢竟,我花200刀一個月,買的是智能,不是"賽博油條"的打卡服務。
4月8號,Anthropic關閉了GitHub上的issue。
沒有解釋到底解決了什么,只是關閉了。
我看著那個已關閉的標簽,突然想起了一個老梗:當用戶抱怨AI變笨時,官方的默認回復永遠是那句高高在上的——"請檢查您的設置"。
好家伙,原來真正需要檢查設置的,是你們自己啊。
這就像是醫生給病人開了藥,病人吃了病情惡化,醫生卻說"請檢查你的服藥方式"。然后病人發現,原來醫生偷偷把藥的有效成分減半了。
只是作為用戶,我還是想說:能不能先把那67%的思考深度還回來,咱們再聊訂閱續費的事?
畢竟,再聰明的AI,變笨了也是白搭。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.