![]()
新智元報(bào)道
編輯:元宇
【新智元導(dǎo)讀】從4.6到4.7,哪些舊禁令消失了?哪些新紅線被劃下?Claude進(jìn)化的真相,全藏在它的system prompt更新細(xì)節(jié)里。
就在前兩天,Anthropic祭出Claude 4.7的同時(shí),照例公開(kāi)了Claude 4.7的「馴化手冊(cè)」,也就是那份系統(tǒng)提示詞(system prompt)。
![]()
https://platform.claude.com/docs/en/release-notes/system-prompts
Simon Willison在博客中對(duì)這份system prompt進(jìn)行了逐行對(duì)比,哪里加了、哪里刪了、哪里改了措辭,全部標(biāo)了出來(lái)。
不僅如此,他還直接在對(duì)話中讓Claude「自報(bào)家門(mén)」,拿到了一份23個(gè)工具的完整名單。
![]()
https://simonwillison.net/2026/Apr/18/opus-system-prompt/
他挖出的這些Anthropic自己沒(méi)有說(shuō)的細(xì)節(jié),要比官方的公告更有意思。
你每天對(duì)話的Claude
背后有一份幾萬(wàn)字的「馴化手冊(cè)」
很多人可能還不知道,Anthropic是目前唯一一家長(zhǎng)期公開(kāi)自己聊天模型system prompt的頭部AI實(shí)驗(yàn)室。
2024年7月Claude 3發(fā)布起,每次模型更新,Anthropic都會(huì)同步更新并公布它的prompt,每一版的system prompt都在那里,一路追溯將近兩年。
![]()
從最新的Claude 4.7往前看,Anthropic的system prompt更新依次覆蓋Claude 4.6、4.5、4.1、4、3.7、3.5,一直到Claude 3。
![]()
這意味著Claude是目前唯一一個(gè)你可以從文本層面追蹤「它被怎樣調(diào)教」的主流大模型:在這些公開(kāi)的system prompt中,你可以看出Claude的進(jìn)化軌跡。
比如,Claude被允許在什么情況下拒絕你,它被要求用什么語(yǔ)氣跟你說(shuō)話,它在遇到哪些話題時(shí)必須踩剎車(chē),等等。
Claude藏了23個(gè)工具
而你可能只是和它聊天
大多數(shù)人用Claude只是打字聊天。
這其實(shí)是嚴(yán)重的大材小用,好比你手里握著一把瑞士軍刀,卻一直在拿它削蘋(píng)果。
Simon在博客中還指出,Anthropic公開(kāi)的prompt其實(shí)并不是全貌:它沒(méi)有包含提供給模型的工具描述,而這些工具才是Claude真正的能力邊界。
于是,他通過(guò)直接在對(duì)話中讓Claude「自報(bào)家門(mén)」,拿到了一份由Claude自述的工具名單。
一共23個(gè)工具,涵蓋信息獲取、文件操作、生活服務(wù)、社交通訊、記憶與上下文、平臺(tái)連接、交互輔助、交互輔助八大場(chǎng)景。
![]()
需要強(qiáng)調(diào)一點(diǎn)的是,這份清單來(lái)自Simon讓Claude自報(bào)的結(jié)果,并非Anthropic官方發(fā)布的工具白名單,但它與Anthropic當(dāng)前公開(kāi)的產(chǎn)品矩陣高度吻合。
更關(guān)鍵的是prompt里新出現(xiàn)的一個(gè)機(jī)制:tool_search,在4.7的prompt里明確寫(xiě)道:
在斷定Claude缺少某項(xiàng)能力之前,Claude會(huì)先調(diào)用tool_search,檢查是否有一個(gè)相關(guān)工具可用但尚未啟用。只有在tool_search確認(rèn)不存在匹配工具之后,「我無(wú)法訪問(wèn)X」這樣的說(shuō)法才是成立的。
也就是說(shuō),Claude被要求在說(shuō)「我做不到」之前,先搜一遍自己到底能不能做到。
當(dāng)一個(gè)AI系統(tǒng)掛載了成百上千個(gè)工具,不可能在每次對(duì)話中都全部加載,按需發(fā)現(xiàn)、按需調(diào)用,才是可擴(kuò)展的方案。
Anthropic的官方tool search文檔也證實(shí)了這一點(diǎn):
tool search讓Claude可以擴(kuò)展到處理數(shù)百甚至數(shù)千個(gè)工具,并在需要時(shí)發(fā)現(xiàn)和調(diào)用相關(guān)工具。
![]()
https://platform.claude.com/docs/en/agents-and-tools/tool-use/tool-search-tool?utm_source=chatgpt.com
再看產(chǎn)品層面的外部信號(hào)。
就在4.7發(fā)布的第二天,4月17日,Anthropic推出了Claude Design。這是一款A(yù)I設(shè)計(jì)工具,能用自然語(yǔ)言生成原型、幻燈片和其他視覺(jué)物料。
公開(kāi)報(bào)道顯示,在Claude Design相關(guān)計(jì)劃披露后,F(xiàn)igma股價(jià)一度下跌約6%。
更耐人尋味的是,Anthropic首席產(chǎn)品官M(fèi)ike Krieger在發(fā)布前數(shù)天剛辭去了Figma董事會(huì)職務(wù)。
而在4.7的prompt里,工具列表已經(jīng)涵蓋了Claude in Chrome、Claude in Excel、Claude in PowerPoint,再加上Claude Design、Claude Cowork……
大多數(shù)人把Claude當(dāng)聊天框用,但Anthropic顯然不這么想,它正在把Claude變成一個(gè)AI工作操作系統(tǒng)。
你感受到的變化
全寫(xiě)在prompt里
如果你最近頻繁使用Claude,你可能已經(jīng)有一個(gè)模糊的感覺(jué):它好像變了。
以前你丟一個(gè)模糊的需求過(guò)去,它會(huì)追問(wèn)你三四個(gè)問(wèn)題,現(xiàn)在直接就干了;
以前它的回答經(jīng)常拖得很長(zhǎng),現(xiàn)在短了不少;
以前你說(shuō)「好了,謝謝」,它還要追一句「還有什么我能幫你的嗎?」,現(xiàn)在不追了。
每一條變化,都預(yù)先寫(xiě)在了prompt里。
比如,4.7新增了一個(gè)叫acting_vs_clarifying的段落,當(dāng)用戶的請(qǐng)求中存在一些未明確的細(xì)節(jié)時(shí),通常希望Claude直接做出合理嘗試,而不是先進(jìn)行詢問(wèn)。
![]()
當(dāng)有工具可以用來(lái)消除歧義或補(bǔ)上缺失信息時(shí),Claude會(huì)先調(diào)用工具來(lái)嘗試解決,而不是讓用戶自己去查。
一旦Claude開(kāi)始處理一個(gè)任務(wù),就會(huì)把它完成并給出完整答案,而不是做到一半就停下。
后面還跟著一串具體要求:搜索結(jié)果不對(duì)?換個(gè)詞繼續(xù)搜。多部分問(wèn)題?每個(gè)都回答。搜到了信息?直接用它作答,別讓用戶自己去翻。
Anthropic的官方公告也呼應(yīng)了這一點(diǎn):Opus 4.7在遵循指令方面有顯著提升。
關(guān)于回復(fù)風(fēng)格,4.7的prompt新增了一條:
Claude會(huì)讓自己的回復(fù)保持聚焦和簡(jiǎn)潔,以避免過(guò)長(zhǎng)的回答讓用戶感到信息過(guò)載。即便回答中需要帶上免責(zé)聲明或補(bǔ)充說(shuō)明,Claude也會(huì)簡(jiǎn)要說(shuō)明,并把大部分篇幅留給主要回答。
關(guān)于不再?gòu)?qiáng)行續(xù)聊,也有明確規(guī)定:
如果用戶表示他們已經(jīng)準(zhǔn)備結(jié)束對(duì)話,Claude不會(huì)請(qǐng)求用戶繼續(xù)互動(dòng),也不會(huì)試圖引出下一輪對(duì)話。
把這些變化放在一起看,你會(huì)發(fā)現(xiàn)一個(gè)清晰的方向:Anthropic在把Claude從「對(duì)話助手」調(diào)教成「自主執(zhí)行者」。
部分安全細(xì)節(jié)升級(jí)
誠(chéng)實(shí)性和抗提示注入更進(jìn)一步
能力變強(qiáng)了,自主性提高了,那安全呢?
4.7的prompt在安全方面做了一輪系統(tǒng)性升級(jí),而且升級(jí)的顆粒度也非常細(xì)。
其中變化最大的是兒童安全。
4.6的prompt里就有兒童安全相關(guān)的內(nèi)容。但到了4.7,這個(gè)部分被大幅擴(kuò)展,整個(gè)被包裹在一個(gè)新的標(biāo)簽里:critical_child_safety_instructions。
![]()
單從標(biāo)簽名就可以看出它的優(yōu)先級(jí)。
另一個(gè)首次被單獨(dú)命名處理的議題是飲食失調(diào)。
![]()
如果用戶表現(xiàn)出飲食失調(diào)的跡象,Claude就不應(yīng)在對(duì)話中的任何地方提供精確的營(yíng)養(yǎng)、飲食或運(yùn)動(dòng)建議,不提供具體數(shù)字、目標(biāo)或分步驟計(jì)劃,即便本意是好的也不行。
還有一處細(xì)節(jié),4.7在evenhandedness部分新增了一條:如果有人要求Claude對(duì)復(fù)雜或有爭(zhēng)議的問(wèn)題只給「是」或「否」的簡(jiǎn)短回答,Claude可以拒絕。
![]()
這可能是針對(duì)社交媒體上一種很常見(jiàn)的攻擊手法:截圖誘導(dǎo)。即讓AI就敏感話題回答「是」或「否」,然后把截圖斷章取義地傳播。
被刪掉的規(guī)則
是模型進(jìn)化的證據(jù)
加規(guī)則容易,刪規(guī)則要更難。
因?yàn)槊縿h一條規(guī)則也意味著Anthropic已確信,新模型已經(jīng)在訓(xùn)練層面解決了某個(gè)行為問(wèn)題,不再需要外部規(guī)則來(lái)矯正。
據(jù)Simon Willison的分析,4.7刪掉了好幾條4.6里存在的行為規(guī)范。
第一條:「Claude會(huì)避免使用用星號(hào)括起來(lái)的動(dòng)作或情緒表達(dá)。」
早期Claude有個(gè)毛病:聊著聊著突然來(lái)一句「若有所思地點(diǎn)頭」或者「饒有興趣地湊上前」,像在演舞臺(tái)劇。
這個(gè)問(wèn)題嚴(yán)重到需要專門(mén)寫(xiě)一條prompt來(lái)禁止,現(xiàn)在這條禁令被刪了。
第二條:「Claude會(huì)避說(shuō)說(shuō)真的、老實(shí)說(shuō)或直截了當(dāng)?shù)卣f(shuō)。」
這三個(gè)詞是早期Claude的口頭禪。幾乎每隔幾句就來(lái)一個(gè)「說(shuō)真的,我覺(jué)得……」,4.7把這條禁令也刪了。
還有一個(gè)名稱上的變化:「developer platform」被改成了「Claude Platform」。
![]()
![]()
看起來(lái)只是改了個(gè)名字,但去掉「developer」這個(gè)定語(yǔ),意味著Claude的平臺(tái)定位不再只面向開(kāi)發(fā)者。
這些prompt的「瘦身記錄」,也是模型被「馴服」的過(guò)程記錄:每刪一條規(guī)則,就說(shuō)明有一個(gè)行為問(wèn)題從「需要外部管控」變成了「內(nèi)在已修復(fù)」。
它們合在一起,構(gòu)成了一部有關(guān)Claude的微型進(jìn)化史。
對(duì)用戶來(lái)說(shuō),這意味著你正在用的AI,可能比上一個(gè)版本更「原生地」懂得怎么做一個(gè)正常的對(duì)話者。
這份公開(kāi)的prompt
是一種稀缺的行業(yè)透明
我們能讀到Simon這篇博客,這件事本身在AI行業(yè)就是一種稀缺的透明。
OpenAI不公開(kāi)ChatGPT的system prompt,Google也不公開(kāi)Gemini的。
Meta的Llama雖然開(kāi)源了權(quán)重,但chat端的system prompt同樣不透明。
目前,Anthropic是唯一一家持續(xù)公開(kāi)聊天產(chǎn)品prompt歷史的頭部實(shí)驗(yàn)室。雖然,這次公開(kāi)中并未給出模型的工具描述,但它仍然做了這個(gè)行業(yè)里別人都沒(méi)做的事。
這些寫(xiě)在prompt里的規(guī)則,是真正在每一次對(duì)話中執(zhí)行的指令,代表著Anthropic對(duì)「Claude應(yīng)該成為什么樣的AI」這個(gè)問(wèn)題的真實(shí)判斷和回答。
你每天跟AI說(shuō)的每一句話,它怎么接、在哪里拒絕你、用什么語(yǔ)氣回你,全都不是隨機(jī)的:背后有一份不斷被修改的指令在控制一切。
目前,只有一家公司讓你看到這份指令長(zhǎng)什么樣。
下次跟AI對(duì)話的時(shí)候,你可能會(huì)想:這句話,是它自己想說(shuō)的,還是被要求說(shuō)的?
參考資料:
https://simonwillison.net/2026/Apr/18/opus-system-prompt/
https://platform.claude.com/docs/en/release-notes/system-prompts
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.