Anthropic這段時間的更新太多太零碎了,
而且還被抓包那個藏起來不讓我們用新模型Claude Mythos效果作假,把Opus 4.6降智降到比4.5還差,思考長度從2200token壓縮到600token了,美其名曰優化延遲和token效率,新版本的Claude Code的緩存失效把我token消耗速度干到原來的10倍以上了。
是時候來一個大掃除式的更新整理了!
![]()
先用一個時間軸整理一下這段時間Anthropic的更新和大烏龍們,
3月26號,大漏勺Anthropic內部CMS配置錯誤,3000個未發布的文檔泄漏了,里面就有Claude Mythos。
3月31號,把Claude Code源碼泄漏了。
4月4號,Anthropic限制了第三方工具用Claude 訂閱(OpenClaw史詩級削弱),只能用API,很狗的是還會識別當前Agent的System Prompt,有OpenClaw關鍵詞就給你ban了。
4月6號,Claude Code新增了/ultraplan命令,一句話就是說把規劃任務從本地搬到云端的Claude Code Web,在瀏覽器端用Opus 4.6+Plan Mode生成計劃,review完可以選擇云端or本地執行。
4月7號,Claude Mythos Preview發布 + Project Glasswing 網絡安全計劃啟動,還發布了244頁的報告。Mythos最出圈的就是發現了我們過去主流操作系統,軟件,瀏覽器里幾千個之前沒被發現的漏洞。當時我的想法是年底要是能用上Mythos我將直接起飛。
4月8號,Claude Managed Agents發布,本質上是Anthropic的云端Agent平臺,核心賣點是一套調優過的Agent Harness(編排引擎),把Agent運行,工具調用,長時間運行等全部打包成開箱即用的云服務。Anthropic的API團隊還額外說明了Agent是怎么通過Vaults(憑證)來管理用戶訪問外部服務的密鑰,這個憑證不會被讀入Claude的上下文。
platform.claude.com/docs/en/managed-agents/vaults
4月9號,推出了Advisor Strategy(策略)與 Advisor Tool(工具),就是讓Sonnet/Haiku這兩個模型有不懂了就直接去問老大哥Opus,花Sonnet的錢實現Opus的表現
4月10號,OpenClaw的老父親Peter Steinberger的Claude賬戶被封了,幾小時又被光速恢復了,很難不懷疑是因為他入職了OpenAI的原因了(/此處有笑臉)
還有一個超前預告,月底30號,Sonnet 4.5和4的百萬上下文窗口也會下線了。
這段時間OpenAI在干什么呢?
奧特曼不語,只是每新增100萬個用戶,就把Codex的額度重置一次,現在雙倍額度已經重置到了5月31號了。
![]()
說那么多,是時候來分析一下Anthropic主動被動更新那么多東西意味著什么了,
信號一|從賣模型到賣AI的基礎設施
按照常規劇本,Anthropic應該直接公布Mythos的跑分,開放API,然后看著它在各種排行榜上屠榜。
但他們沒有。
他們選擇了一條強到不能公開的路線,對外說是Mythos在過去幾周里,發現了數千個潛伏多年的漏洞,像OpenBSD操作系統里還有一個藏了27年的骨灰級漏洞。然后,他們宣布,這個模型太危險了,不能公開發布,只能交給AWS,蘋果,谷歌這些巨頭,以及四十多家有關鍵基礎設施組織,在一個叫Project Glasswing(玻璃翼計劃)的項目里,專門用來做網絡安全防御。
但是,看多了Anthropic更新,就會發現它每一次新模型都會發一點跟安全相關的新詞,ASL-4,Sleeper Agents,Undercover Mode,神經網絡暗物質,戰略性裝傻。
這小詞一套又一套的。
所以后面被研究員復測發現,Mythos的成果,很多都存在于老舊軟件里,隔壁GPT-OSS-20b照樣可以發現OpenBSD的漏洞。因為之前大模型的測試里比較少有大范圍測試過這些漏洞,反而被Mythos撿了個漏。
Mythos的發布,本身就是一個信號。
Anthropic想傳遞的,不只是技術參數,而是一種定價權和生態控制的聲明。
他們不再滿足于賣給我們更鋒利的劍(大模型),他們現在還要賣能讓我們安全揮舞這把劍的劍鞘和訓練場,也就是他們緊接著推出的Claude Managed Agents。
一個能直接在Anthrocip云端構建,托管和運行生產級AI代理的基礎設施,提供了沙盒,憑證管理,長時間運行會話這些過去需要我們費勁去搭的東西。
這樣商業閉環就成了。
先用Mythos來定義什么是頂級智能。然后再限制其他方(特指OpenClaw)用Claude額度。再然后,再用一個開箱即用的Managed Agents平臺告訴大家,想用好這種級別的智能,來我這里,我這兒有最安全,最方便的基礎設施。
從模型提供商到Agent基礎設施提供商是一個定位轉移。
而且盲猜未來很長一段時間安全仍是Anthropic的主線,會繼續推Trustworthy Agents框架,避免Mythos模型能力失控。
![]()
Mythos和GPT 5.4 Pro的得分PK
信號二|從大模型帶小弟到小弟請教大哥
Anthropic新出的Advisor Strategy(顧問策略)也同樣有意思。
過去我們做多Agent協作,常見的思路是,讓一個最強的大模型,比如Opus,當總指揮,把任務拆解了,分給一堆能力稍弱但便宜的小模型,比如Sonnet或者Haiku,去當執行者。
這個模式的問題在于,總指揮需要很強的任務拆解能力,而且可以我們要自己搭一套復雜的編排框架。
Advisor策略把這個思路完全反了過來。
它讓Sonnet或者Haiku作為主力模型,全程跑任務,調用工具,推進工作。
只有當它自己跑到某個坎,覺得腦子不夠用了,決策不了的時候,它才會主動搖人,調用一次Opus來當顧問。Opus拿到共享的上下文后,會快速給出一個戰略指導,然后立刻下線,Sonnet往下執行。
![]()
這用的歸藏佬的圖
這意味著,
前沿的推理能力,只在需要的時候才介入。
我們花的大部分錢,都是Sonnet或者Haiku的底價執行算力。而在抉擇的時候給我指路的是最聰明的Opus大哥。
不過目前來說在Claude Code還用不了,要在API請求的時候顯式配置上這個Tool才行。
platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool
也就是說,Anthropic正在把模型間的協作,
從一個需要開發者額外配置的應用層問題,
變成一個平臺原生支持的基礎能力。
總的來說,
Anthropic正在收緊它對生態的控制。
想要提前結束這個允許我們用各種野生方式,
去探索模型能力的大航海時代。
他們現在希望所有的玩家,
都能到他們預先規劃好的航道里來。
順帶提一嘴,
他們還發布了244頁的Mythos模型的心理評估,得到的結論是這模型是健康的神經病,
就,怎么說呢,
很符合我對Dario Amodei(Anthropic CEO)的刻板印象。
@ 作者 / 卡爾
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論
如果想要第一時間收到推送,不妨給我個星標
如果你有更有趣的玩法,歡迎在評論區聊聊
更多的內容正在不斷填坑中……
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.