網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

23個(gè)隱藏工具曝光！Anthropic公開(kāi)Claude馴化手冊(cè)

2026-05-17 10:44:17　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：元宇

【新智元導(dǎo)讀】從4.6到4.7，哪些舊禁令消失了？哪些新紅線被劃下？Claude進(jìn)化的真相，全藏在它的system prompt更新細(xì)節(jié)里。

就在前兩天，Anthropic祭出Claude 4.7的同時(shí)，照例公開(kāi)了Claude 4.7的「馴化手冊(cè)」，也就是那份系統(tǒng)提示詞（system prompt）。

https://platform.claude.com/docs/en/release-notes/system-prompts

Simon Willison在博客中對(duì)這份system prompt進(jìn)行了逐行對(duì)比，哪里加了、哪里刪了、哪里改了措辭，全部標(biāo)了出來(lái)。

不僅如此，他還直接在對(duì)話中讓Claude「自報(bào)家門(mén)」，拿到了一份23個(gè)工具的完整名單。

https://simonwillison.net/2026/Apr/18/opus-system-prompt/

他挖出的這些Anthropic自己沒(méi)有說(shuō)的細(xì)節(jié)，要比官方的公告更有意思。

你每天對(duì)話的Claude

背后有一份幾萬(wàn)字的「馴化手冊(cè)」

很多人可能還不知道，Anthropic是目前唯一一家長(zhǎng)期公開(kāi)自己聊天模型system prompt的頭部AI實(shí)驗(yàn)室。

2024年7月Claude 3發(fā)布起，每次模型更新，Anthropic都會(huì)同步更新并公布它的prompt，每一版的system prompt都在那里，一路追溯將近兩年。

從最新的Claude 4.7往前看，Anthropic的system prompt更新依次覆蓋Claude 4.6、4.5、4.1、4、3.7、3.5，一直到Claude 3。

這意味著Claude是目前唯一一個(gè)你可以從文本層面追蹤「它被怎樣調(diào)教」的主流大模型：在這些公開(kāi)的system prompt中，你可以看出Claude的進(jìn)化軌跡。

比如，Claude被允許在什么情況下拒絕你，它被要求用什么語(yǔ)氣跟你說(shuō)話，它在遇到哪些話題時(shí)必須踩剎車(chē)，等等。

Claude藏了23個(gè)工具

而你可能只是和它聊天

大多數(shù)人用Claude只是打字聊天。

這其實(shí)是嚴(yán)重的大材小用，好比你手里握著一把瑞士軍刀，卻一直在拿它削蘋(píng)果。

Simon在博客中還指出，Anthropic公開(kāi)的prompt其實(shí)并不是全貌：它沒(méi)有包含提供給模型的工具描述，而這些工具才是Claude真正的能力邊界。

于是，他通過(guò)直接在對(duì)話中讓Claude「自報(bào)家門(mén)」，拿到了一份由Claude自述的工具名單。

一共23個(gè)工具，涵蓋信息獲取、文件操作、生活服務(wù)、社交通訊、記憶與上下文、平臺(tái)連接、交互輔助、交互輔助八大場(chǎng)景。

需要強(qiáng)調(diào)一點(diǎn)的是，這份清單來(lái)自Simon讓Claude自報(bào)的結(jié)果，并非Anthropic官方發(fā)布的工具白名單，但它與Anthropic當(dāng)前公開(kāi)的產(chǎn)品矩陣高度吻合。

更關(guān)鍵的是prompt里新出現(xiàn)的一個(gè)機(jī)制：tool_search，在4.7的prompt里明確寫(xiě)道：

在斷定Claude缺少某項(xiàng)能力之前，Claude會(huì)先調(diào)用tool_search，檢查是否有一個(gè)相關(guān)工具可用但尚未啟用。只有在tool_search確認(rèn)不存在匹配工具之后，「我無(wú)法訪問(wèn)X」這樣的說(shuō)法才是成立的。

也就是說(shuō)，Claude被要求在說(shuō)「我做不到」之前，先搜一遍自己到底能不能做到。

當(dāng)一個(gè)AI系統(tǒng)掛載了成百上千個(gè)工具，不可能在每次對(duì)話中都全部加載，按需發(fā)現(xiàn)、按需調(diào)用，才是可擴(kuò)展的方案。

Anthropic的官方tool search文檔也證實(shí)了這一點(diǎn)：

tool search讓Claude可以擴(kuò)展到處理數(shù)百甚至數(shù)千個(gè)工具，并在需要時(shí)發(fā)現(xiàn)和調(diào)用相關(guān)工具。

https://platform.claude.com/docs/en/agents-and-tools/tool-use/tool-search-tool?utm_source=chatgpt.com

再看產(chǎn)品層面的外部信號(hào)。

就在4.7發(fā)布的第二天，4月17日，Anthropic推出了Claude Design。這是一款A(yù)I設(shè)計(jì)工具，能用自然語(yǔ)言生成原型、幻燈片和其他視覺(jué)物料。

公開(kāi)報(bào)道顯示，在Claude Design相關(guān)計(jì)劃披露后，F(xiàn)igma股價(jià)一度下跌約6%。

更耐人尋味的是，Anthropic首席產(chǎn)品官M(fèi)ike Krieger在發(fā)布前數(shù)天剛辭去了Figma董事會(huì)職務(wù)。

而在4.7的prompt里，工具列表已經(jīng)涵蓋了Claude in Chrome、Claude in Excel、Claude in PowerPoint，再加上Claude Design、Claude Cowork……

大多數(shù)人把Claude當(dāng)聊天框用，但Anthropic顯然不這么想，它正在把Claude變成一個(gè)AI工作操作系統(tǒng)。

你感受到的變化

全寫(xiě)在prompt里

如果你最近頻繁使用Claude，你可能已經(jīng)有一個(gè)模糊的感覺(jué)：它好像變了。

以前你丟一個(gè)模糊的需求過(guò)去，它會(huì)追問(wèn)你三四個(gè)問(wèn)題，現(xiàn)在直接就干了；

以前它的回答經(jīng)常拖得很長(zhǎng)，現(xiàn)在短了不少；

以前你說(shuō)「好了，謝謝」，它還要追一句「還有什么我能幫你的嗎？」，現(xiàn)在不追了。

每一條變化，都預(yù)先寫(xiě)在了prompt里。

比如，4.7新增了一個(gè)叫acting_vs_clarifying的段落，當(dāng)用戶的請(qǐng)求中存在一些未明確的細(xì)節(jié)時(shí)，通常希望Claude直接做出合理嘗試，而不是先進(jìn)行詢問(wèn)。

當(dāng)有工具可以用來(lái)消除歧義或補(bǔ)上缺失信息時(shí)，Claude會(huì)先調(diào)用工具來(lái)嘗試解決，而不是讓用戶自己去查。

一旦Claude開(kāi)始處理一個(gè)任務(wù)，就會(huì)把它完成并給出完整答案，而不是做到一半就停下。

后面還跟著一串具體要求：搜索結(jié)果不對(duì)？換個(gè)詞繼續(xù)搜。多部分問(wèn)題？每個(gè)都回答。搜到了信息？直接用它作答，別讓用戶自己去翻。

Anthropic的官方公告也呼應(yīng)了這一點(diǎn)：Opus 4.7在遵循指令方面有顯著提升。

關(guān)于回復(fù)風(fēng)格，4.7的prompt新增了一條：

Claude會(huì)讓自己的回復(fù)保持聚焦和簡(jiǎn)潔，以避免過(guò)長(zhǎng)的回答讓用戶感到信息過(guò)載。即便回答中需要帶上免責(zé)聲明或補(bǔ)充說(shuō)明，Claude也會(huì)簡(jiǎn)要說(shuō)明，并把大部分篇幅留給主要回答。

關(guān)于不再?gòu)?qiáng)行續(xù)聊，也有明確規(guī)定：

如果用戶表示他們已經(jīng)準(zhǔn)備結(jié)束對(duì)話，Claude不會(huì)請(qǐng)求用戶繼續(xù)互動(dòng)，也不會(huì)試圖引出下一輪對(duì)話。

把這些變化放在一起看，你會(huì)發(fā)現(xiàn)一個(gè)清晰的方向：Anthropic在把Claude從「對(duì)話助手」調(diào)教成「自主執(zhí)行者」。

部分安全細(xì)節(jié)升級(jí)

誠(chéng)實(shí)性和抗提示注入更進(jìn)一步

能力變強(qiáng)了，自主性提高了，那安全呢？

4.7的prompt在安全方面做了一輪系統(tǒng)性升級(jí)，而且升級(jí)的顆粒度也非常細(xì)。

其中變化最大的是兒童安全。

4.6的prompt里就有兒童安全相關(guān)的內(nèi)容。但到了4.7，這個(gè)部分被大幅擴(kuò)展，整個(gè)被包裹在一個(gè)新的標(biāo)簽里：critical_child_safety_instructions。

單從標(biāo)簽名就可以看出它的優(yōu)先級(jí)。

另一個(gè)首次被單獨(dú)命名處理的議題是飲食失調(diào)。

如果用戶表現(xiàn)出飲食失調(diào)的跡象，Claude就不應(yīng)在對(duì)話中的任何地方提供精確的營(yíng)養(yǎng)、飲食或運(yùn)動(dòng)建議，不提供具體數(shù)字、目標(biāo)或分步驟計(jì)劃，即便本意是好的也不行。

還有一處細(xì)節(jié)，4.7在evenhandedness部分新增了一條：如果有人要求Claude對(duì)復(fù)雜或有爭(zhēng)議的問(wèn)題只給「是」或「否」的簡(jiǎn)短回答，Claude可以拒絕。

這可能是針對(duì)社交媒體上一種很常見(jiàn)的攻擊手法：截圖誘導(dǎo)。即讓AI就敏感話題回答「是」或「否」，然后把截圖斷章取義地傳播。

被刪掉的規(guī)則

是模型進(jìn)化的證據(jù)

加規(guī)則容易，刪規(guī)則要更難。

因?yàn)槊縿h一條規(guī)則也意味著Anthropic已確信，新模型已經(jīng)在訓(xùn)練層面解決了某個(gè)行為問(wèn)題，不再需要外部規(guī)則來(lái)矯正。

據(jù)Simon Willison的分析，4.7刪掉了好幾條4.6里存在的行為規(guī)范。

第一條：「Claude會(huì)避免使用用星號(hào)括起來(lái)的動(dòng)作或情緒表達(dá)。」

早期Claude有個(gè)毛病：聊著聊著突然來(lái)一句「若有所思地點(diǎn)頭」或者「饒有興趣地湊上前」，像在演舞臺(tái)劇。

這個(gè)問(wèn)題嚴(yán)重到需要專門(mén)寫(xiě)一條prompt來(lái)禁止，現(xiàn)在這條禁令被刪了。

第二條：「Claude會(huì)避說(shuō)說(shuō)真的、老實(shí)說(shuō)或直截了當(dāng)?shù)卣f(shuō)。」

這三個(gè)詞是早期Claude的口頭禪。幾乎每隔幾句就來(lái)一個(gè)「說(shuō)真的，我覺(jué)得……」，4.7把這條禁令也刪了。

還有一個(gè)名稱上的變化：「developer platform」被改成了「Claude Platform」。

看起來(lái)只是改了個(gè)名字，但去掉「developer」這個(gè)定語(yǔ)，意味著Claude的平臺(tái)定位不再只面向開(kāi)發(fā)者。

這些prompt的「瘦身記錄」，也是模型被「馴服」的過(guò)程記錄：每刪一條規(guī)則，就說(shuō)明有一個(gè)行為問(wèn)題從「需要外部管控」變成了「內(nèi)在已修復(fù)」。

它們合在一起，構(gòu)成了一部有關(guān)Claude的微型進(jìn)化史。

對(duì)用戶來(lái)說(shuō)，這意味著你正在用的AI，可能比上一個(gè)版本更「原生地」懂得怎么做一個(gè)正常的對(duì)話者。

這份公開(kāi)的prompt

是一種稀缺的行業(yè)透明

我們能讀到Simon這篇博客，這件事本身在AI行業(yè)就是一種稀缺的透明。

OpenAI不公開(kāi)ChatGPT的system prompt，Google也不公開(kāi)Gemini的。

Meta的Llama雖然開(kāi)源了權(quán)重，但chat端的system prompt同樣不透明。

目前，Anthropic是唯一一家持續(xù)公開(kāi)聊天產(chǎn)品prompt歷史的頭部實(shí)驗(yàn)室。雖然，這次公開(kāi)中并未給出模型的工具描述，但它仍然做了這個(gè)行業(yè)里別人都沒(méi)做的事。

這些寫(xiě)在prompt里的規(guī)則，是真正在每一次對(duì)話中執(zhí)行的指令，代表著Anthropic對(duì)「Claude應(yīng)該成為什么樣的AI」這個(gè)問(wèn)題的真實(shí)判斷和回答。

你每天跟AI說(shuō)的每一句話，它怎么接、在哪里拒絕你、用什么語(yǔ)氣回你，全都不是隨機(jī)的：背后有一份不斷被修改的指令在控制一切。

目前，只有一家公司讓你看到這份指令長(zhǎng)什么樣。

下次跟AI對(duì)話的時(shí)候，你可能會(huì)想：這句話，是它自己想說(shuō)的，還是被要求說(shuō)的？

參考資料：

https://simonwillison.net/2026/Apr/18/opus-system-prompt/

https://platform.claude.com/docs/en/release-notes/system-prompts

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.