![]()
作者 | Andrew Hoblitzell
譯者 | 張衛(wèi)濱
Anthropic 于 5 月 6 日在舊金山舉辦了 Code with Claude 2026 會(huì)議,并將直播內(nèi)容發(fā)布到了 YouTube。相關(guān)分享覆蓋了 Claude Code、Claude Developer Platform,以及在 GitHub、Vercel、Datadog、Bun 和多家 AI 原生創(chuàng)業(yè)公司中的合作部署案例。貫穿全天的主線話題是:模型能力的階段性躍遷,會(huì)如何影響產(chǎn)品架構(gòu)、組織設(shè)計(jì)與基礎(chǔ)設(shè)施經(jīng)濟(jì)性。
Anthropic Claude Code 團(tuán)隊(duì)的 Dickson Tsai 展示了 Claude Code 的最新更新。在開發(fā)者體驗(yàn)方面,遠(yuǎn)程控制功能允許會(huì)話在一臺(tái)機(jī)器上開始、隨后在手機(jī)上繼續(xù);重新設(shè)計(jì)的桌面 GUI 則加入了分欄視圖、將助手消息固定為章節(jié)并自動(dòng)生成目錄的能力,以及內(nèi)聯(lián) diff 評(píng)論。在自主能力方面,Auto 模式把權(quán)限決策交給分類器,由其篩查破壞性操作和提示詞注入;worktrees 則為 Claude 提供進(jìn)入與退出工具,使其能夠自行創(chuàng)建和銷毀隔離分支。Tsai 還演示了 routines,這一能力可基于 cron 計(jì)劃、GitHub webhook 或 API 端點(diǎn)觸發(fā)提示詞的執(zhí)行。
![]()
隨后,GitHub 首席產(chǎn)品官 Mario Rodriguez 與 Anthropic 的 Brad Abrams 共同進(jìn)行了分享。Rodriguez 將緩存命中率視為任何向平臺(tái)發(fā)送數(shù)十億條消息的團(tuán)隊(duì)都必須關(guān)注的基礎(chǔ)指標(biāo)。他表示:“這有點(diǎn)像高頻交易,哪怕只提升 1% 的效率,整體上都意味著數(shù)百萬的價(jià)值。”GitHub 的目標(biāo)是將緩存命中率維持在 94% 以上,而一旦跌到 70% 左右,通常就意味著提示詞組裝環(huán)節(jié)出現(xiàn)了缺陷。Rodriguez 還列舉了 GitHub 在工程實(shí)踐中必須應(yīng)對(duì)的 3 類緩存失效的原因。
![]()
Abrams 借此介紹了一種 advisor 策略,也就是,由較小的執(zhí)行模型(比如,Haiku)僅在遇到困難場景時(shí)才調(diào)用更大的 advisor 模型(比如,Opus)。Abrams 表示:“我們能以遠(yuǎn)低于 Opus 級(jí)別的全面調(diào)用成本,獲得接近 Opus 級(jí)別的智能,因?yàn)槲覀儗?duì) advisor 實(shí)際發(fā)送的 token 非常克制。”Rodriguez 還提到,GitHub 內(nèi)部配合使用了一個(gè) critic 模塊,內(nèi)部昵稱為 Rubber Duck,它會(huì)在規(guī)劃之后、復(fù)雜實(shí)現(xiàn)完成之后,以及測(cè)試編寫完成但尚未運(yùn)行之前進(jìn)行檢查。
Anthropic Managed Agents 的產(chǎn)品經(jīng)理 Jess Yan 和 Anthropic 的技術(shù)團(tuán)隊(duì)成員 Lance Martin 在午間時(shí)段演示了 Claude Managed Agents,并認(rèn)為當(dāng)前生產(chǎn)級(jí)智能體的瓶頸已經(jīng)不再是智能本身,而是基礎(chǔ)設(shè)施。他們重點(diǎn)介紹了沙箱代碼執(zhí)行、檢查點(diǎn)和憑據(jù)作用域控制等底層原語。
下午 1 點(diǎn),Anthropic 聯(lián)合創(chuàng)始人兼 CEO Dario Amodei 以及聯(lián)合創(chuàng)始人兼總裁 Daniela Amodei 登上主舞臺(tái)。Daniela Amodei 表示,開發(fā)者“是 Claude 最重要的用戶”,并介紹了 Anthropic 內(nèi)部的一項(xiàng)文化價(jià)值觀:同時(shí)掌控光明與陰暗面(hold light and shade),用以指導(dǎo)公司如何在交付強(qiáng)大模型的同時(shí)配套安全護(hù)欄。Dario Amodei 則透露,以年化口徑計(jì)算,Anthropic 在 2026 年第一季度的收入和使用量增長達(dá)到了 80 倍,而不是原計(jì)劃的 10 倍;他認(rèn)為,這正是近期算力壓力的根本原因,而公司當(dāng)天早些時(shí)候宣布的 與 SpaceX 的合作 則在一定程度上緩解了這一問題。
他再次重申了此前的預(yù)測(cè):2026 年將出現(xiàn)一家“一個(gè)人就能創(chuàng)造十億美元價(jià)值”的公司,并指出,借助 AI 構(gòu)建的兩人公司實(shí)際上已經(jīng)突破了十億美元估值。他認(rèn)為,下一個(gè)拐點(diǎn)將是智能體團(tuán)隊(duì)以組織而非個(gè)人的層級(jí)開展工作。當(dāng)前真正拖慢進(jìn)展的,是軟件工程中那些不可驗(yàn)證的部分,例如設(shè)計(jì)質(zhì)量與安全審查,而 Anthropic 如今正專注于訓(xùn)練模型來處理這些環(huán)節(jié)。
Anthropic Claude Code 負(fù)責(zé)人 Boris Cherny 與 Bun 創(chuàng)建者 Jarred Sumner 通過一場現(xiàn)場編程展示了 Bun 如何借助 Robobun 機(jī)器人實(shí)現(xiàn)自維護(hù):它會(huì)復(fù)現(xiàn)每一個(gè) issue,只有當(dāng)自動(dòng)生成的回歸測(cè)試在舊版 Bun 上失敗、而在修復(fù)分支上通過時(shí),才會(huì)創(chuàng)建 pull request。Datadog 工程副總裁 Sesh Nalla 則介紹了一種叫做機(jī)器工具的概念,即讓智能體輸出“對(duì)意圖和問題域的精確規(guī)格說明”,而不是為每個(gè)局部需求臨時(shí)創(chuàng)造出彼此割裂的工具。
![]()
隨后,Vercel CEO Guillermo Rauch 與 Anthropic 平臺(tái)產(chǎn)品負(fù)責(zé)人 Angela Jiang 進(jìn)行了對(duì)談。Rauch 表示,Opus token 大約占 Vercel AI Gateway 使用量的百分之二十幾,但卻占到了超過 70% 的支出;此外,自 Anthropic 最近一次升級(jí)以來,V0 上的信用花費(fèi)已經(jīng)翻倍。他表示,更聰明的模型讓 Vercel 得以簡化 harness;模型“品味”的提升,也讓 V0 能夠吸收 Vercel 十年來積累的設(shè)計(jì)判斷,而不是與之對(duì)抗。與此同時(shí),由于模型能夠在沙箱中編寫中間代碼,而不再依賴預(yù)定義的子智能體,工具的范圍也在收縮。Rauch 表示:“我們現(xiàn)在更多是在圍繞工具批準(zhǔn)(tool approval)做工程設(shè)計(jì),本質(zhì)上是在構(gòu)建正確的安全護(hù)欄。”
在由 Anthropic 創(chuàng)業(yè)合作負(fù)責(zé)人 Beth Robertson 主持的一場圓桌中,Cognition 聯(lián)合創(chuàng)始人 Walden Yan、Gamma AI 產(chǎn)品負(fù)責(zé)人 Deeni Fatiha 以及 Harvey 應(yīng)用研究負(fù)責(zé)人 Niko Grupen 共同探討了在模型指數(shù)級(jí)進(jìn)步下的產(chǎn)品架構(gòu)。Cognition 開發(fā)的是可自主編程、能夠操作自己計(jì)算機(jī)的 Devin;Gamma 是一款擁有超過 7000 萬用戶的 AI 原生演示文檔工具;Harvey 則面向法律和專業(yè)服務(wù)領(lǐng)域提供生成式 AI 平臺(tái)。每位嘉賓都提到,自己都曾因?yàn)槟P湍芰拯c(diǎn)而不得不重寫產(chǎn)品架構(gòu)。
Brad Abrams 在當(dāng)天稍晚時(shí)候再次登臺(tái),單獨(dú)介紹了 Claude Platform,重點(diǎn)討論了提示詞緩存、結(jié)構(gòu)化輸出以及在大規(guī)模工作負(fù)載客戶中觀察到的工具設(shè)計(jì)模式。Anthropic 開發(fā)者關(guān)系負(fù)責(zé)人 Alex Albert 則在收官環(huán)節(jié)提到,一年前 Claude 配合 Sonnet 3.7 在 SWE-bench Verified 上的成績是 62%,而如今使用 Opus 4.7 已達(dá)到 87%;他還借助能力曲線,對(duì)未來的一年給出了預(yù)期。
Anthropic 的營收增速也在迅猛攀升。截至 4 月初,在公司 調(diào)整了定價(jià)模式,改為按照企業(yè)客戶實(shí)際使用的 AI 量收費(fèi),而非僅收取固定費(fèi)用之后,其年化銷售額已達(dá)到 300 億美元。與此同時(shí),ServiceNow、Uber 等公司也報(bào)告稱,它們?cè)谀瓿鯉讉€(gè)月內(nèi)就已用滿全年的 token 預(yù)算。
有興趣進(jìn)一步了解的開發(fā)者,可以前往 Anthropic 的 YouTube 頻道觀看完整會(huì)議錄像,瀏覽 claude.com 上的 Code with Claude 專題頁面,或報(bào)名參加 5 月 19 日的倫敦場 和 6 月 10 日的東京場 活動(dòng)。
查看英文原文:
Anthropic's Code With Claude Announces Managed Agents, Proactive Workflows, Capability Curve(https://www.infoq.com/news/2026/05/code-with-claude/)
聲明:本文由 InfoQ 翻譯,未經(jīng)許可禁止轉(zhuǎn)載。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.