![]()
新智元報(bào)道
![]()
【新智元導(dǎo)讀】從寫指令,到給目標(biāo),再到只給一句意圖:有人干脆讓Codex自己定任務(wù)——人類還能留在編程的計(jì)劃層嗎?
「我基本上再也不自己寫/goal了。」
近日,前Anthropic成員、現(xiàn)MagicPath CEO的Pietro Schirano在X上甩出這句話,評(píng)論區(qū)瞬間炸開。
![]()
他的做法是:不再手寫那份/goal,而是讓Codex為自己寫一份,再為它派生的每個(gè)子智能體(agent)各寫一份。
把一個(gè)高層意圖丟給Codex,讓它先給自己寫一份詳細(xì)的/goal——怎么拆任務(wù)、哪些并行、最后怎么匯總,全由模型自己定。
從頭到尾,人類只用在最開始說出自己的意圖,剩下的拆解、調(diào)度、收尾,模型自己都能安排得明明白白。
Pietro Schirano @skirano在X上分享的演示視頻
別小看Pietro這句話,這次他交給AI的并非是體力,而是判斷力:過去開發(fā)者交給AI的是「怎么寫」,這一次交出去的是「寫什么」。
先是寫一句提示詞,AI把活干了。
后來連提示詞都懶得細(xì)寫,只丟一句模糊的目標(biāo),剩下怎么做、分幾步,讓它自己琢磨。
到現(xiàn)在,索性連「目標(biāo)」都不寫了。
評(píng)論區(qū)一位網(wǎng)友感嘆道:
我們好像已經(jīng)進(jìn)入這樣一個(gè)時(shí)代:我給AI一個(gè)目標(biāo),AI把這個(gè)目標(biāo)改得更好,然后我禮貌地假裝自己一直是那個(gè)項(xiàng)目經(jīng)理。
這句話剛好戳中了這次變遷的核心。
當(dāng)一個(gè)程序員連「要干什么」都不再親手寫,他在這條流水線上,到底還剩下什么?
人只管給意圖
任務(wù)交給agent去想
過去幾年,提示詞工程被捧成AI時(shí)代的硬技能。會(huì)寫提示詞,就好比握住了駕馭模型的關(guān)鍵。
再往后是元提示(meta-prompting):你不直接寫指令,而是讓模型幫你把指令寫得更好。
而這次Codex所演示的更進(jìn)一步:自生成目標(biāo)(self-goal generation)。模型并非把你的話潤(rùn)色成更漂亮的指令,它直接接管了「目標(biāo)」本身:你給意圖,它寫/goal。
這套玩法的底座,是Codex今年4月底上線的/goal功能,先在Codex CLI里出現(xiàn),近期在config.toml里把features.goals打開就能用。
官方把它塞進(jìn)Codex CLI的0.128.0版本,默認(rèn)關(guān)閉,要手動(dòng)改配置文件才能打開。
開發(fā)者圈給它起了個(gè)外號(hào),叫「Ralph循環(huán)」:規(guī)劃、執(zhí)行、測(cè)試、復(fù)查、迭代,一路自轉(zhuǎn),不到目標(biāo)不收手。
它與普通對(duì)話提示詞最大的不同,是goal這段文字會(huì)同時(shí)充當(dāng)兩樣?xùn)|西:起始指令,和「完成審計(jì)」。
Codex每跑完一輪,就回頭對(duì)照目標(biāo)問自己兩句:還該做什么,是不是已經(jīng)做完了。一輪接一輪,直到任務(wù)完成、被你叫停,或者token燒到上限。
所以官方反復(fù)強(qiáng)調(diào)一件事:目標(biāo)一定要寫到Codex能判斷「做完沒有」,要避免「優(yōu)化一下」「完善一下」這種虛詞。
真正給這件事定調(diào)的,是OpenAI的Codex負(fù)責(zé)人Tibo(Thibault Sottiaux)。
![]()
他在X上說,我們?cè)斓拿恳粋€(gè)工具,都同時(shí)是給智能體用的:
Codex能查看、也能設(shè)置自己的/goal。這是元提示的泛化,用一句話概括就是:人給意圖,智能體來生成任務(wù)。
開發(fā)者@MikelEcheve把這套能力進(jìn)一步解釋為:Codex能自建/goal、為并行的智能體生成目標(biāo)、自主切分工作。
![]()
Codex自述:「因?yàn)槟忝鞔_要并行智能體,我就用多智能體工具」,并已「Created an agent」,右側(cè)子智能體面板出現(xiàn)首個(gè)分身Gibbs。圖源:Pietro Schirano @skirano演示視頻
有人已經(jīng)用它干了18個(gè)小時(shí)
/goal的自轉(zhuǎn)能力,已經(jīng)有人拿真實(shí)項(xiàng)目驗(yàn)證過。
有開發(fā)者實(shí)測(cè):給Codex一句高層目標(biāo),把BACKLOG.md里的18個(gè)功能全部交付,然后人就離開了。
約18小時(shí)后回來,Codex已經(jīng)自主實(shí)現(xiàn)其中14個(gè),每一處改動(dòng)都過了測(cè)試、在CI里合并,全程沒要一次人工點(diǎn)頭,連代碼自審都交給了GPT子智能體。
算下來,這趟跑了約4.20美元。
skirano展示的,是更上面那一層:不只讓Codex執(zhí)行一份goal,而是讓它給自己和每個(gè)子智能體各寫一份goal,智能體的層級(jí)自動(dòng)就長(zhǎng)了出來。
只丟給它一句話,Codex就把該干全干了。
![]()
運(yùn)行約10秒,狀態(tài)變?yōu)椤窩reating 2 agents」,右側(cè)子智能體已擴(kuò)展為Gibbs與Leibniz兩個(gè)并行分身。圖源:Pietro Schirano @skirano演示視頻
![]()
主智能體「Created 3 agents」,右窗子智能體Gibbs正在執(zhí)行自己的專屬/goal:設(shè)計(jì)一條數(shù)學(xué)化的過山車軌道。各自一份goal,正是這套打法的核心。圖源:Pietro Schirano @skirano演示視頻
這套打法正在被模板化。
開發(fā)者Pablo Stanley把它做成了模板,給出一套「Build [THING]+功能+風(fēng)格」的提示詞框架,讓Codex照著自動(dòng)生成goal、再孵化對(duì)應(yīng)的子智能體。整套流程,人只負(fù)責(zé)開頭那句話。這個(gè)模板被skirano本人點(diǎn)贊。
在Reddit的r/codex社區(qū),開發(fā)者已經(jīng)用/goal做長(zhǎng)期任務(wù)對(duì)齊、自動(dòng)生成驗(yàn)收標(biāo)準(zhǔn)、規(guī)避死循環(huán)。
另一位開發(fā)者RTK(@riverkhan)走得更遠(yuǎn)。OpenAI團(tuán)隊(duì)前不久發(fā)了一篇講怎么把/goal用好的文章,他直接把里面的最佳實(shí)踐封裝成開源skill,取名Infinite Skills,仿照Superpowers的結(jié)構(gòu),每個(gè)skill就是skills目錄下扁平的一份SKILL.md。
里頭那個(gè)叫g(shù)oal的skill,干的事很有意思:在你正式發(fā)起/goal之前,它先反過來「面試」你,把一個(gè)含糊的目標(biāo),一句句盤問成具體、可驗(yàn)證的契約,再把整理好的完整目標(biāo)喂給goal模式。
![]()
https://github.com/Infinite-Labs-AI/infinite-skills
換句話說,goal模式跑得好不好,本就取決于目標(biāo)寫得夠不夠具體、能不能讓Codex自己判斷做完沒有。
如今連「把目標(biāo)盤問清楚」這一步,都有人做成工具替你包辦了。
三家把同一件事做了
這股潮流并非Codex獨(dú)自引領(lǐng)。
幾乎在同一個(gè)時(shí)間窗口里,三家主流編程智能體,把「讓AI自己拆任務(wù)、自己派智能體」這項(xiàng)功能,不約而同地推了出來。
Anthropic的多智能體編排5月6日上線,Cursor的/orchestrate只隔一天、5月7日跟上。
再往前推到4月底,Codex早把/goal這塊自治循環(huán)這層底子鋪好了。
三家?guī)缀跏乔昂竽_,方向卻出奇一致。
社區(qū)里很快有網(wǎng)友把它和Claude Code的CLAUDE.md放在一起比較:同樣是讓智能體讀一份「寫給自己看的說明」,再據(jù)此行動(dòng)。
因此,它更像一個(gè)跨產(chǎn)品的共性方向,而非某一家的獨(dú)門特性。
有意思的是細(xì)節(jié)上的取舍。
Claude的coordinator最多能派20個(gè)subagent,而且刻意限制只派一層:深度超過1,直接忽略。
這和Codex那種放手并行派生的路子,正好是兩種心態(tài)。
這背后藏著一條更長(zhǎng)的線。
當(dāng)Codex能給自己、給一群子智能體派活,它就不再只是一個(gè)寫代碼的助手,而更像一個(gè)跑在后臺(tái)的任務(wù)調(diào)度器,寫代碼只是它順手能干的一件事。
OpenAI想讓智能體自己設(shè)定任務(wù),盯著的顯然是比「幫人寫代碼」大得多的盤子。
小心token賬單爆了
自己寫目標(biāo)、自己派agent,聽上去很爽,但代價(jià)就是可能刷爆你的token賬單。
任務(wù)跑得越久、越不需要人盯,token就燒得越兇。
a16z的Andrew Chen,拿/goal在一個(gè)真實(shí)的eGPU加Mac設(shè)備驅(qū)動(dòng)項(xiàng)目上跑了一整夜:不是教學(xué)demo,是真干活,14小時(shí)過去,第二天早上它還在推進(jìn)。
Andrew Chen直言,這會(huì)讓token用量翻一萬倍。
![]()
你手動(dòng)提20次、每次盯著看的會(huì)話,撐死幾十萬token;一個(gè)跑14小時(shí)、沒人管的會(huì)話,量級(jí)完全不是一回事。
就連官方也在教人踩剎車:建議你在goal末尾加一句token預(yù)算,也別一上來就發(fā)/goal,先把項(xiàng)目跑出個(gè)雛形再說。
目標(biāo)會(huì)漂
智能體可能偷懶
熱鬧歸熱鬧,社區(qū)的討論里,質(zhì)疑聲并不少:
讓AI自己寫目標(biāo),會(huì)不會(huì)出現(xiàn)目標(biāo)漂移,跑著跑著就偏了?
智能體會(huì)不會(huì)偷懶,專挑省事的近路走?
這套東西,到底進(jìn)不進(jìn)得了真正的生產(chǎn)環(huán)境?
Reddit的r/codex里,大家把/goal主要還是用在長(zhǎng)任務(wù)對(duì)齊、生成驗(yàn)收標(biāo)準(zhǔn)、避免死循環(huán)上:本質(zhì)上,還是「人得在旁邊盯著」的狀態(tài)。
網(wǎng)友nick吐槽,再讓它遞歸派生幾層,Codex的首要目標(biāo),怕是要變成把我們重構(gòu)出局。
而Claude那個(gè)「只派一層」的限制也說明今天的所謂自治,更像是帶著護(hù)欄的放權(quán),離一個(gè)真正完整的自治多智能體系統(tǒng),還有很遠(yuǎn)的距離。
但真正的遷移正在發(fā)生,人從規(guī)劃層后移了一步:先是不寫代碼,后是不寫任務(wù),如今只剩下一句話。
當(dāng)Codex、Cursor、Claude集體把「定義任務(wù)」也交還給模型,新的問題是當(dāng)代碼、任務(wù)、意圖一層層交出去之后,程序員要如何重新定義自己的角色。
參考資料:
https://x.com/thsottiaux/status/2066270561081454989
https://x.com/skirano/status/2066225908202053818
https://github.com/Infinite-Labs-AI/infinite-skills
編輯:元宇
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.