網易首頁 > 網易號 > 正文 申請入駐

Claude Code 桌面版爛爆了,Anthropic 終于把 “100% AI 編碼”演砸了

0
分享至


整理| Tina

Anthropic 推出了最新的 Claude Code 桌面應用。

這本來應該是一件很順理成章的事。CLI 當然有它的價值,但如果真要把 agentic coding 推向更大規模、更高頻、更接近日常開發的使用場景,圖形界面幾乎是繞不過去的。尤其是在你同時處理多個任務、多個線程、多個上下文的時候,一個慢、卡、狀態又不透明的命令行界面,確實很難說是“最終形態”。從這個意義上說,Claude Code 桌面版的發布,本來是一個值得期待的節點。

Anthropic 顯然也對它寄予厚望,官方賬號親自下場發推,外界預熱已經持續了幾個月,整個發布姿態都在傳遞一個信號:他們終于要把 Claude Code 從一個“能用的 CLI 工具”,推進成一個更完整的正式產品了。


但真正的問題在于,這個桌面版一旦開始上手,給人的感受并不是“終于成熟了”,而是“怎么會爛成這樣”。

新桌面版爛到根本沒法用

這個版本上線才兩天,就在社區里迅速積累起一波密集吐槽。

用戶提到,iOS 下,鍵盤會突然卡住。有時連最核心的輸入框都會頻繁消失,而且幾乎每次會話都會遇到,必須退出再重新進入聊天才能恢復。



Windows 版本也一樣會經??D和崩潰。


界面層面的問題也很明顯:按鈕位置不符合預期,聊天框還頻繁閃爍,整體交互體驗不穩定。



另一個明顯問題是,一些原本最該體現效率價值的自動化功能,本身就不太穩定。比如用戶想用 Routines 跑一個簡單的數據庫內容處理流程,結果不管怎么折騰,始終連不上數據庫。


不少人吐槽 bug 多到實際上沒法用。




上手一小時,直接撞出 40 多個 bug

網上很快就有人曬出了一份 bug 清單,里面列了 40 多個問題。更夸張的是,這 40 多個問題,都是 Theo 在一個小時的試用過程中集中撞出來的。


這 40 多個 bug,大致可以分為三類。一類是快捷鍵和標簽頁邏輯混亂,很多快捷鍵只在主標簽頁生效,切換標簽時操作對象還會亂跳;一類是側邊欄和項目管理彼此割裂,項目列表、recent projects、線程拖拽、菜單展開方式彼此對不上,用戶很難搞清楚當前到底在操作什么;還有一類更直接,屬于一些基礎功能本身就不成立,比如“打開文件”并不會真正打開文件,創建 fork 會連帶生成 worktree 卻沒有任何提示...

這些問題寫在列表里還只是觀感不佳,放進真實任務里,很快就會變成一連串的實打實的使用障礙。

比如在一個再普通不過的場景里,讓它去分析一個應用可能存在的性能問題,本來只是一個起手測試,還沒涉及真正改代碼,系統就已經開始不穩定。任務一啟動,就先卡住了將近一分鐘,隨后 agent run 隨機停住,線程直接凍結,界面上的圖標卻還掛在那里,像是在告訴你它仍然在運行。


但實際上,它已經不動了。UI 沒有任何提示,也沒有報錯,沒有結束,也沒有失敗。你眼前看到的是一個仿佛還活著的線程,實際面對的卻是一個已經死掉的流程。

這個問題,本質上可以說是它出錯的門檻太低了。不是在長鏈路任務里失手,也不是在高復雜度項目里崩掉,而是在一個本該最容易跑通的基礎場景里,把任務執行、線程狀態和界面反饋三件事一起做亂了。這種狀態錯亂,放在聊天產品里都不算小問題,放在開發工具里就更致命,因為開發者最依賴的,恰恰是系統狀態的清晰、反饋的準確,以及操作結果的可預期。


接著往下操作,在界面這一層,又會遇到更多問題。比如分屏時,你明明在右側窗口里操作,打開 terminal 后,它卻出現在左側分屏上;而且 terminal 一旦開出來,Tab 鍵會被當作輸入鍵使用,也就沒法再順手切回其他窗口。

與此同時,terminal 右上角的關閉按鈕旁邊又貼著 拖拽區域,結果那個 X 很難點中。也就是說,terminal 一旦開出來,輸入會受影響,想關又不那么容易關掉。

還有些極其荒謬、莫名其妙的 bug:

  • 比如語音模式下,所有輸入框都會自動輸入文字,而不是只輸入你當前選中的那個。

  • “v more”下拉菜單根本不是下拉,而是往側邊展開的(但箭頭是向下的)。

  • “打開文件”會執行大約 15 種不同的操作,但沒有一種操作是真正打開文件。

  • 可以拖拽線程,但實際上永遠不能改變它們的順序,任何情況下都不行。

  • 可以在 diff 視圖里套娃式地嵌套可折疊側邊欄。

  • diff 視圖里的“x”按鈕會關閉整個標簽頁,而不是只關閉 diff 視圖。

他吐槽說,“我不太相信那些說自己已經用這個應用用了好幾周的人,真的認真用過它。我甚至還沒開始用它干活、改代碼,就已經連續撞上了五六個這樣的 bug,感覺自己都快瘋了?!?/p>

“現在的問題是,很多人只是接受了這種質量?!奔幢愦嬖诖罅扛€定、功能更完整、甚至開源的替代方案,用戶仍然在使用 Claude Code,僅僅因為它綁定了模型入口?!八麄儾皇窃跒檫@個界面付費,他們是為模型付費,但結果卻要忍受這個界面?!?/p>

100%AI 編寫,落地質量堪憂

對此,還有其他網友吐槽:“一個整天說‘軟件開發已經被解決了’的公司,現在做成這樣,確實挺好笑的?!辈贿^,也因此至少說明開發者的飯碗還沒丟。

畢竟 Anthropic 過去這一年的對外敘事一直很激進,核心就一句話:代碼越來越多是 AI 寫的,而且比例還在一路往上抬。從“80% 到 90%”,到“90%”,再到“100%”,數字一次比一次高。到了 2026 年初,“內部大多數產品基本已經是 100% AI 編碼”的說法,也已經被他們反復講了很多次。

  • 2025 年 3 月,CEO Dario Amodei 在美國外交關系委員會上說:“再過 3 到 6 個月,AI 就會寫出 90% 的代碼?!?/p>

  • 2025 年 5 月,Boris Cherny 在播客《Latent Space》中表示:“整體來看,大概 80% 到 90% 的代碼是 Claude 寫的?!?/p>

  • 2025 年 9 月,Amodei 再次發聲,但開始收口:“在 Anthropic,70%、80%、90% 的代碼是 Claude 寫的?!弊⒁膺@個區間——70% 和 90% 是兩回事,但媒體只抓了 90%。

  • 2025 年 10 月,Amodei 在 Dreamforce 與 Marc Benioff 同臺時說:“我之前預測過,六個月內 90% 的代碼會由 AI 完成,現在已經實現了?!钡蛔穯柡?,他又補了一句:“也不是所有情況都這樣?!?/p>

  • 2025 年 12 月,Boris Cherny 發推:100%。

  • 2026 年 2 月,CPO Mike Krieger 在 Cisco AI Summit 上表示:“目前在 Anthropic,大多數產品基本可以說是 100%?!?/p>

  • 2026 年 3 月 7 日,Boris Cherny 再次確認:“Claude Code 是 100% 由 Claude Code 寫的?!?/p>


問題在于,這個“100%”一旦真正落到產品上,情況就開始變得不太對勁。Claude Code 桌面版給人的感覺,不像一個打磨完成的正式產品,更像一個邊寫邊補、一路 vibe 出來的半成品。問題不在于它偶爾出錯,而在于它在最基礎的使用路徑上就已經不穩,這才是最讓人擔心的地方。

有人算了筆賬:這些工程師一天能拿到一千萬到一千五百萬 token,最后做出來的就是這個效果。更讓人困惑的是,從什么時候開始,行業默認“能大規模生成高質量 token”就等于可以為了速度把編程質量一起扔掉?

這種不滿,其實不只是針對桌面版這一次翻車?;仡^看,之前的代碼泄露,已經提前把問題暴露得很徹底了。

其中一個反復被提到的文件:print.ts。里面只有一個函數,但這個函數足足寫了 3167 行代碼,包含 486 個分支判斷,嵌套深度達到 12 層。有人專門把這個函數里塞的東西列了一遍:agent 的運行循環、SIGINT 中斷處理、限流邏輯、AWS 認證、MCP 生命周期管理、插件加載、通過 while(true) 輪詢“team lead”、模型切換、以及對中斷的恢復機制……幾乎所有核心邏輯,都被硬塞進了這一個函數里。而實際上,這至少應該拆成 8 到 10 個獨立模塊。

類似的情況,不止這一處。QueryEngine.ts 寫到了 4.6 萬行,Tool.ts 接近 3 萬行,commands.ts 也有 2.5 萬行,入口文件 main.tsx 單文件體積達到 785KB。不是某一段代碼出了問題,而是整個結構本身,就已經開始失控。

在 userPromptKeywords.ts 里,這家公司用來判斷用戶是否“情緒崩潰”的方式,是這樣一段正則:/\b(wtf|shit|fuck|horrible|awful|terrible)\b/i,也就是說,這家號稱擁有最先進大語言模型的公司,在做情緒識別時,用的還是最原始的關鍵詞匹配。這就像一家卡車公司,結果還在用馬來拉零件。也有人解釋,說正則更快、更便宜,不需要額外的推理調用,這在工程上是合理的。這話當然沒錯。但這恰恰說明這是一個“能跑就行”的工程選擇。便宜優先,速度優先,先上線再說。

工程文化是沒有開關的。一個能寫出 12 層嵌套、把所有邏輯塞進一個函數里的團隊,不會在寫模型訓練代碼、寫桌面應用的時候突然變得嚴謹起來。

這家公司一邊賣 AI 編程工具,一邊卻沒法用自己的 AI 編程工具做出一個質量過關的產品。那些百分比,從一開始就是用來講故事的,而不是用來交付產品的。80、90、95、100——在源碼被看見之前,沒有人真正問過,“100%”到底產出了什么。

AI 只是把原本的東西放大。原本有工程紀律,就會被放大成更好的產出;原本沒有紀律,就會以機器的速度放大成技術債。Anthropic 選了一條路:更快一點,讓 Claude 去檢查 Claude。出了問題,就再快一點。

如果在一家“構建未來”的公司里,“100% AI 編寫”意味著一個包含 486 個分支、3167 行代碼的函數,一個桌面應用包含無數 bug 就能上線,那這個未來需要的不是更快的工程,而是更好的工程。

如果這就是一家正在把行業往前帶的公司所代表的質量標準,那這個方向本身是有問題的。

https://x.com/theo/status/2044680030706663726

聲明:本文為 InfoQ 原創,不代表平臺觀點,未經許可禁止轉載。

會議推薦

世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?

AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。

誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。

今日薦文

你也「在看」嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
兩任書記皆落馬!“最牛風投之城”合肥急需從“大樹至上”走向“草本主義”

兩任書記皆落馬!“最牛風投之城”合肥急需從“大樹至上”走向“草本主義”

吾球商業地理
2026-05-07 12:09:56
素人時期的Angelababy,我是星探我也第一個發現她

素人時期的Angelababy,我是星探我也第一個發現她

可樂談情感
2026-05-07 00:31:49
一塊H200芯片都沒賣出去!黃仁勛不裝了:中國不應獲得最先進芯片

一塊H200芯片都沒賣出去!黃仁勛不裝了:中國不應獲得最先進芯片

混沌錄
2026-05-06 16:51:09
新物種廣西兩頭蛇被發現

新物種廣西兩頭蛇被發現

大象新聞
2026-05-07 10:14:04
有沒有哪個國家從低生育率回升到更替水平?

有沒有哪個國家從低生育率回升到更替水平?

何亞福
2026-05-06 11:58:20
9位導演親口承認選錯演員

9位導演親口承認選錯演員

膠片猴
2026-05-06 13:09:47
游戲中的中國背景永遠都是臟亂差,“不隨地吐痰”顯得格外刺眼

游戲中的中國背景永遠都是臟亂差,“不隨地吐痰”顯得格外刺眼

街機時代
2026-05-06 15:00:03
打什么電話比12345更管用?這些電話比它管用100倍,建議收藏好

打什么電話比12345更管用?這些電話比它管用100倍,建議收藏好

細說職場
2026-04-28 10:39:02
立夏后,多吃這菜,一養肝、二降心火、三祛濕、四強筋骨,正當季

立夏后,多吃這菜,一養肝、二降心火、三祛濕、四強筋骨,正當季

阿龍美食記
2026-05-05 08:26:47
阿sa老公“雙插頭”,借子上位!?

八卦瘋叔
2026-05-07 10:44:43

就在剛剛!中國男籃官宣名單調整!2米26高塔入選,近期賽程公布

就在剛剛!中國男籃官宣名單調整!2米26高塔入選,近期賽程公布

老吳說體育
2026-05-07 14:46:09
“銀行員工轉走儲戶1800萬元炒股”,最新進展:銀行全額支付儲戶1000萬元存款本金和利息,另一儲戶800萬元仍無明確進展

“銀行員工轉走儲戶1800萬元炒股”,最新進展:銀行全額支付儲戶1000萬元存款本金和利息,另一儲戶800萬元仍無明確進展

大風新聞
2026-05-07 15:17:13
交通銀行:堅決擁護黨中央決定

交通銀行:堅決擁護黨中央決定

新京報政事兒
2026-05-07 12:32:06
女子舉報列車合規吸煙區抽煙!強硬要求全列無煙,網友評論一邊倒

女子舉報列車合規吸煙區抽煙!強硬要求全列無煙,網友評論一邊倒

行者聊官
2026-05-06 12:26:28
5月7日,人社部2026年養老金調整通知公布了嗎?調整比例會是多少

5月7日,人社部2026年養老金調整通知公布了嗎?調整比例會是多少

社保小達人
2026-05-07 11:20:31
張雪太大方!奪冠后就發全年獎金 德比斯:不用擔心銀行催款電話

張雪太大方!奪冠后就發全年獎金 德比斯:不用擔心銀行催款電話

念洲
2026-05-07 11:05:25
英媒:吳宜澤吞云吐霧照片讓老球迷更喜歡,他風格很像颶風希金斯

英媒:吳宜澤吞云吐霧照片讓老球迷更喜歡,他風格很像颶風希金斯

楊華評論
2026-05-06 15:14:00
55比0全票通過無一人反對,菲律賓副總統遭彈劾,被拿下已成定局

55比0全票通過無一人反對,菲律賓副總統遭彈劾,被拿下已成定局

鐵錘簡科
2026-05-06 14:31:13
美日菲“肩并肩2026”聯合演習中,一張熟悉的面孔再次出現

美日菲“肩并肩2026”聯合演習中,一張熟悉的面孔再次出現

三叔的裝備空間
2026-05-06 23:40:02
最新:莫斯科遭受大規模空襲!紅場閱兵首次拉起防護網

最新:莫斯科遭受大規??找u!紅場閱兵首次拉起防護網

項鵬飛
2026-05-04 17:29:10
2026-05-07 16:03:00
AI前線 incentive-icons
AI前線
面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
1476文章數 149關注度
往期回顧 全部

科技要聞

月之暗面完成20億美元融資,估值突破200億

頭條要聞

記者詢問"是否敦促美方從霍爾木茲撤出軍艦" 中方回應

頭條要聞

記者詢問"是否敦促美方從霍爾木茲撤出軍艦" 中方回應

體育要聞

巴黎再進歐冠決賽,最尷尬的情況還是發生了

娛樂要聞

小S阿雅重返大S母校,翻看大S畢業照

財經要聞

特朗普:美伊“很有可能”達成協議

汽車要聞

理想為什么不做轎車,有了解釋……

態度原創

本地
時尚
藝術
親子
公開課

本地新聞

用青花瓷的方式,打開西溪濕地

“白色闊腿褲”今年夏天又火了!這樣穿時髦又高級

藝術要聞

這位老教授筆下的青年,活力滿滿

親子要聞

2026年上海幼兒入園報名驗證、小學報名今起開始

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版