網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Anthropic 在 Code With Claude 上發(fā)布托管式智能體、主動(dòng)式工作流與能力曲線

2026-06-02 13:48:26　來源: InfoQ

北京舉報(bào)

分享至

作者 | Andrew Hoblitzell

譯者 | 張衛(wèi)濱

Anthropic 于 5 月 6 日在舊金山舉辦了 Code with Claude 2026 會(huì)議，并將直播內(nèi)容發(fā)布到了 YouTube。相關(guān)分享覆蓋了 Claude Code、Claude Developer Platform，以及在 GitHub、Vercel、Datadog、Bun 和多家 AI 原生創(chuàng)業(yè)公司中的合作部署案例。貫穿全天的主線話題是：模型能力的階段性躍遷，會(huì)如何影響產(chǎn)品架構(gòu)、組織設(shè)計(jì)與基礎(chǔ)設(shè)施經(jīng)濟(jì)性。

Anthropic Claude Code 團(tuán)隊(duì)的 Dickson Tsai 展示了 Claude Code 的最新更新。在開發(fā)者體驗(yàn)方面，遠(yuǎn)程控制功能允許會(huì)話在一臺(tái)機(jī)器上開始、隨后在手機(jī)上繼續(xù)；重新設(shè)計(jì)的桌面 GUI 則加入了分欄視圖、將助手消息固定為章節(jié)并自動(dòng)生成目錄的能力，以及內(nèi)聯(lián) diff 評(píng)論。在自主能力方面，Auto 模式把權(quán)限決策交給分類器，由其篩查破壞性操作和提示詞注入；worktrees 則為 Claude 提供進(jìn)入與退出工具，使其能夠自行創(chuàng)建和銷毀隔離分支。Tsai 還演示了 routines，這一能力可基于 cron 計(jì)劃、GitHub webhook 或 API 端點(diǎn)觸發(fā)提示詞的執(zhí)行。

隨后，GitHub 首席產(chǎn)品官 Mario Rodriguez 與 Anthropic 的 Brad Abrams 共同進(jìn)行了分享。Rodriguez 將緩存命中率視為任何向平臺(tái)發(fā)送數(shù)十億條消息的團(tuán)隊(duì)都必須關(guān)注的基礎(chǔ)指標(biāo)。他表示：“這有點(diǎn)像高頻交易，哪怕只提升 1% 的效率，整體上都意味著數(shù)百萬的價(jià)值。”GitHub 的目標(biāo)是將緩存命中率維持在 94% 以上，而一旦跌到 70% 左右，通常就意味著提示詞組裝環(huán)節(jié)出現(xiàn)了缺陷。Rodriguez 還列舉了 GitHub 在工程實(shí)踐中必須應(yīng)對(duì)的 3 類緩存失效的原因。

Abrams 借此介紹了一種 advisor 策略，也就是，由較小的執(zhí)行模型（比如，Haiku）僅在遇到困難場景時(shí)才調(diào)用更大的 advisor 模型（比如，Opus）。Abrams 表示：“我們能以遠(yuǎn)低于 Opus 級(jí)別的全面調(diào)用成本，獲得接近 Opus 級(jí)別的智能，因?yàn)槲覀儗?duì) advisor 實(shí)際發(fā)送的 token 非常克制。”Rodriguez 還提到，GitHub 內(nèi)部配合使用了一個(gè) critic 模塊，內(nèi)部昵稱為 Rubber Duck，它會(huì)在規(guī)劃之后、復(fù)雜實(shí)現(xiàn)完成之后，以及測(cè)試編寫完成但尚未運(yùn)行之前進(jìn)行檢查。

Anthropic Managed Agents 的產(chǎn)品經(jīng)理 Jess Yan 和 Anthropic 的技術(shù)團(tuán)隊(duì)成員 Lance Martin 在午間時(shí)段演示了 Claude Managed Agents，并認(rèn)為當(dāng)前生產(chǎn)級(jí)智能體的瓶頸已經(jīng)不再是智能本身，而是基礎(chǔ)設(shè)施。他們重點(diǎn)介紹了沙箱代碼執(zhí)行、檢查點(diǎn)和憑據(jù)作用域控制等底層原語。

下午 1 點(diǎn)，Anthropic 聯(lián)合創(chuàng)始人兼 CEO Dario Amodei 以及聯(lián)合創(chuàng)始人兼總裁 Daniela Amodei 登上主舞臺(tái)。Daniela Amodei 表示，開發(fā)者“是 Claude 最重要的用戶”，并介紹了 Anthropic 內(nèi)部的一項(xiàng)文化價(jià)值觀：同時(shí)掌控光明與陰暗面（hold light and shade），用以指導(dǎo)公司如何在交付強(qiáng)大模型的同時(shí)配套安全護(hù)欄。Dario Amodei 則透露，以年化口徑計(jì)算，Anthropic 在 2026 年第一季度的收入和使用量增長達(dá)到了 80 倍，而不是原計(jì)劃的 10 倍；他認(rèn)為，這正是近期算力壓力的根本原因，而公司當(dāng)天早些時(shí)候宣布的與 SpaceX 的合作則在一定程度上緩解了這一問題。

他再次重申了此前的預(yù)測(cè)：2026 年將出現(xiàn)一家“一個(gè)人就能創(chuàng)造十億美元價(jià)值”的公司，并指出，借助 AI 構(gòu)建的兩人公司實(shí)際上已經(jīng)突破了十億美元估值。他認(rèn)為，下一個(gè)拐點(diǎn)將是智能體團(tuán)隊(duì)以組織而非個(gè)人的層級(jí)開展工作。當(dāng)前真正拖慢進(jìn)展的，是軟件工程中那些不可驗(yàn)證的部分，例如設(shè)計(jì)質(zhì)量與安全審查，而 Anthropic 如今正專注于訓(xùn)練模型來處理這些環(huán)節(jié)。

Anthropic Claude Code 負(fù)責(zé)人 Boris Cherny 與 Bun 創(chuàng)建者 Jarred Sumner 通過一場現(xiàn)場編程展示了 Bun 如何借助 Robobun 機(jī)器人實(shí)現(xiàn)自維護(hù)：它會(huì)復(fù)現(xiàn)每一個(gè) issue，只有當(dāng)自動(dòng)生成的回歸測(cè)試在舊版 Bun 上失敗、而在修復(fù)分支上通過時(shí)，才會(huì)創(chuàng)建 pull request。Datadog 工程副總裁 Sesh Nalla 則介紹了一種叫做機(jī)器工具的概念，即讓智能體輸出“對(duì)意圖和問題域的精確規(guī)格說明”，而不是為每個(gè)局部需求臨時(shí)創(chuàng)造出彼此割裂的工具。

隨后，Vercel CEO Guillermo Rauch 與 Anthropic 平臺(tái)產(chǎn)品負(fù)責(zé)人 Angela Jiang 進(jìn)行了對(duì)談。Rauch 表示，Opus token 大約占 Vercel AI Gateway 使用量的百分之二十幾，但卻占到了超過 70% 的支出；此外，自 Anthropic 最近一次升級(jí)以來，V0 上的信用花費(fèi)已經(jīng)翻倍。他表示，更聰明的模型讓 Vercel 得以簡化 harness；模型“品味”的提升，也讓 V0 能夠吸收 Vercel 十年來積累的設(shè)計(jì)判斷，而不是與之對(duì)抗。與此同時(shí)，由于模型能夠在沙箱中編寫中間代碼，而不再依賴預(yù)定義的子智能體，工具的范圍也在收縮。Rauch 表示：“我們現(xiàn)在更多是在圍繞工具批準(zhǔn)（tool approval）做工程設(shè)計(jì)，本質(zhì)上是在構(gòu)建正確的安全護(hù)欄。”

在由 Anthropic 創(chuàng)業(yè)合作負(fù)責(zé)人 Beth Robertson 主持的一場圓桌中，Cognition 聯(lián)合創(chuàng)始人 Walden Yan、Gamma AI 產(chǎn)品負(fù)責(zé)人 Deeni Fatiha 以及 Harvey 應(yīng)用研究負(fù)責(zé)人 Niko Grupen 共同探討了在模型指數(shù)級(jí)進(jìn)步下的產(chǎn)品架構(gòu)。Cognition 開發(fā)的是可自主編程、能夠操作自己計(jì)算機(jī)的 Devin；Gamma 是一款擁有超過 7000 萬用戶的 AI 原生演示文檔工具；Harvey 則面向法律和專業(yè)服務(wù)領(lǐng)域提供生成式 AI 平臺(tái)。每位嘉賓都提到，自己都曾因?yàn)槟Ｐ湍芰拯c(diǎn)而不得不重寫產(chǎn)品架構(gòu)。

Brad Abrams 在當(dāng)天稍晚時(shí)候再次登臺(tái)，單獨(dú)介紹了 Claude Platform，重點(diǎn)討論了提示詞緩存、結(jié)構(gòu)化輸出以及在大規(guī)模工作負(fù)載客戶中觀察到的工具設(shè)計(jì)模式。Anthropic 開發(fā)者關(guān)系負(fù)責(zé)人 Alex Albert 則在收官環(huán)節(jié)提到，一年前 Claude 配合 Sonnet 3.7 在 SWE-bench Verified 上的成績是 62%，而如今使用 Opus 4.7 已達(dá)到 87%；他還借助能力曲線，對(duì)未來的一年給出了預(yù)期。

Anthropic 的營收增速也在迅猛攀升。截至 4 月初，在公司調(diào)整了定價(jià)模式，改為按照企業(yè)客戶實(shí)際使用的 AI 量收費(fèi)，而非僅收取固定費(fèi)用之后，其年化銷售額已達(dá)到 300 億美元。與此同時(shí)，ServiceNow、Uber 等公司也報(bào)告稱，它們?cè)谀瓿鯉讉€(gè)月內(nèi)就已用滿全年的 token 預(yù)算。

有興趣進(jìn)一步了解的開發(fā)者，可以前往 Anthropic 的 YouTube 頻道觀看完整會(huì)議錄像，瀏覽 claude.com 上的 Code with Claude 專題頁面，或報(bào)名參加 5 月 19 日的倫敦場和 6 月 10 日的東京場活動(dòng)。

查看英文原文：

Anthropic's Code With Claude Announces Managed Agents, Proactive Workflows, Capability Curve(https://www.infoq.com/news/2026/05/code-with-claude/)

聲明：本文由 InfoQ 翻譯，未經(jīng)許可禁止轉(zhuǎn)載。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.