網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

碼農(nóng)連任務(wù)都不寫了？Codex開始自己給自己派活

2026-06-16 00:12:50　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

【新智元導(dǎo)讀】從寫指令，到給目標(biāo)，再到只給一句意圖：有人干脆讓Codex自己定任務(wù)——人類還能留在編程的計(jì)劃層嗎？

「我基本上再也不自己寫/goal了。」

近日，前Anthropic成員、現(xiàn)MagicPath CEO的Pietro Schirano在X上甩出這句話，評(píng)論區(qū)瞬間炸開。

他的做法是：不再手寫那份/goal，而是讓Codex為自己寫一份，再為它派生的每個(gè)子智能體（agent）各寫一份。

把一個(gè)高層意圖丟給Codex，讓它先給自己寫一份詳細(xì)的/goal——怎么拆任務(wù)、哪些并行、最后怎么匯總，全由模型自己定。

從頭到尾，人類只用在最開始說出自己的意圖，剩下的拆解、調(diào)度、收尾，模型自己都能安排得明明白白。

Pietro Schirano @skirano在X上分享的演示視頻

別小看Pietro這句話，這次他交給AI的并非是體力，而是判斷力：過去開發(fā)者交給AI的是「怎么寫」，這一次交出去的是「寫什么」。

先是寫一句提示詞，AI把活干了。

后來連提示詞都懶得細(xì)寫，只丟一句模糊的目標(biāo)，剩下怎么做、分幾步，讓它自己琢磨。

到現(xiàn)在，索性連「目標(biāo)」都不寫了。

評(píng)論區(qū)一位網(wǎng)友感嘆道：

我們好像已經(jīng)進(jìn)入這樣一個(gè)時(shí)代：我給AI一個(gè)目標(biāo)，AI把這個(gè)目標(biāo)改得更好，然后我禮貌地假裝自己一直是那個(gè)項(xiàng)目經(jīng)理。

這句話剛好戳中了這次變遷的核心。

當(dāng)一個(gè)程序員連「要干什么」都不再親手寫，他在這條流水線上，到底還剩下什么？

人只管給意圖

任務(wù)交給agent去想

過去幾年，提示詞工程被捧成AI時(shí)代的硬技能。會(huì)寫提示詞，就好比握住了駕馭模型的關(guān)鍵。

再往后是元提示（meta-prompting）：你不直接寫指令，而是讓模型幫你把指令寫得更好。

而這次Codex所演示的更進(jìn)一步：自生成目標(biāo)（self-goal generation）。模型并非把你的話潤(rùn)色成更漂亮的指令，它直接接管了「目標(biāo)」本身：你給意圖，它寫/goal。

這套玩法的底座，是Codex今年4月底上線的/goal功能，先在Codex CLI里出現(xiàn)，近期在config.toml里把features.goals打開就能用。

官方把它塞進(jìn)Codex CLI的0.128.0版本，默認(rèn)關(guān)閉，要手動(dòng)改配置文件才能打開。

開發(fā)者圈給它起了個(gè)外號(hào)，叫「Ralph循環(huán)」：規(guī)劃、執(zhí)行、測(cè)試、復(fù)查、迭代，一路自轉(zhuǎn)，不到目標(biāo)不收手。

它與普通對(duì)話提示詞最大的不同，是goal這段文字會(huì)同時(shí)充當(dāng)兩樣?xùn)|西：起始指令，和「完成審計(jì)」。

Codex每跑完一輪，就回頭對(duì)照目標(biāo)問自己兩句：還該做什么，是不是已經(jīng)做完了。一輪接一輪，直到任務(wù)完成、被你叫停，或者token燒到上限。

所以官方反復(fù)強(qiáng)調(diào)一件事：目標(biāo)一定要寫到Codex能判斷「做完沒有」，要避免「優(yōu)化一下」「完善一下」這種虛詞。

真正給這件事定調(diào)的，是OpenAI的Codex負(fù)責(zé)人Tibo（Thibault Sottiaux）。

他在X上說，我們?cè)斓拿恳粋€(gè)工具，都同時(shí)是給智能體用的：

Codex能查看、也能設(shè)置自己的/goal。這是元提示的泛化，用一句話概括就是：人給意圖，智能體來生成任務(wù)。

開發(fā)者@MikelEcheve把這套能力進(jìn)一步解釋為：Codex能自建/goal、為并行的智能體生成目標(biāo)、自主切分工作。

Codex自述：「因?yàn)槟忝鞔_要并行智能體，我就用多智能體工具」，并已「Created an agent」，右側(cè)子智能體面板出現(xiàn)首個(gè)分身Gibbs。圖源：Pietro Schirano @skirano演示視頻

有人已經(jīng)用它干了18個(gè)小時(shí)

/goal的自轉(zhuǎn)能力，已經(jīng)有人拿真實(shí)項(xiàng)目驗(yàn)證過。

有開發(fā)者實(shí)測(cè)：給Codex一句高層目標(biāo)，把BACKLOG.md里的18個(gè)功能全部交付，然后人就離開了。

約18小時(shí)后回來，Codex已經(jīng)自主實(shí)現(xiàn)其中14個(gè)，每一處改動(dòng)都過了測(cè)試、在CI里合并，全程沒要一次人工點(diǎn)頭，連代碼自審都交給了GPT子智能體。

算下來，這趟跑了約4.20美元。

skirano展示的，是更上面那一層：不只讓Codex執(zhí)行一份goal，而是讓它給自己和每個(gè)子智能體各寫一份goal，智能體的層級(jí)自動(dòng)就長(zhǎng)了出來。

只丟給它一句話，Codex就把該干全干了。

運(yùn)行約10秒，狀態(tài)變?yōu)椤窩reating 2 agents」，右側(cè)子智能體已擴(kuò)展為Gibbs與Leibniz兩個(gè)并行分身。圖源：Pietro Schirano @skirano演示視頻

主智能體「Created 3 agents」，右窗子智能體Gibbs正在執(zhí)行自己的專屬/goal：設(shè)計(jì)一條數(shù)學(xué)化的過山車軌道。各自一份goal，正是這套打法的核心。圖源：Pietro Schirano @skirano演示視頻

這套打法正在被模板化。

開發(fā)者Pablo Stanley把它做成了模板，給出一套「Build [THING]＋功能＋風(fēng)格」的提示詞框架，讓Codex照著自動(dòng)生成goal、再孵化對(duì)應(yīng)的子智能體。整套流程，人只負(fù)責(zé)開頭那句話。這個(gè)模板被skirano本人點(diǎn)贊。

在Reddit的r/codex社區(qū)，開發(fā)者已經(jīng)用/goal做長(zhǎng)期任務(wù)對(duì)齊、自動(dòng)生成驗(yàn)收標(biāo)準(zhǔn)、規(guī)避死循環(huán)。

另一位開發(fā)者RTK（@riverkhan）走得更遠(yuǎn)。OpenAI團(tuán)隊(duì)前不久發(fā)了一篇講怎么把/goal用好的文章，他直接把里面的最佳實(shí)踐封裝成開源skill，取名Infinite Skills，仿照Superpowers的結(jié)構(gòu)，每個(gè)skill就是skills目錄下扁平的一份SKILL.md。

里頭那個(gè)叫g(shù)oal的skill，干的事很有意思：在你正式發(fā)起/goal之前，它先反過來「面試」你，把一個(gè)含糊的目標(biāo)，一句句盤問成具體、可驗(yàn)證的契約，再把整理好的完整目標(biāo)喂給goal模式。

https://github.com/Infinite-Labs-AI/infinite-skills

換句話說，goal模式跑得好不好，本就取決于目標(biāo)寫得夠不夠具體、能不能讓Codex自己判斷做完沒有。

如今連「把目標(biāo)盤問清楚」這一步，都有人做成工具替你包辦了。

三家把同一件事做了

這股潮流并非Codex獨(dú)自引領(lǐng)。

幾乎在同一個(gè)時(shí)間窗口里，三家主流編程智能體，把「讓AI自己拆任務(wù)、自己派智能體」這項(xiàng)功能，不約而同地推了出來。

Anthropic的多智能體編排5月6日上線，Cursor的/orchestrate只隔一天、5月7日跟上。

再往前推到4月底，Codex早把/goal這塊自治循環(huán)這層底子鋪好了。

三家?guī)缀跏乔昂竽_，方向卻出奇一致。

社區(qū)里很快有網(wǎng)友把它和Claude Code的CLAUDE.md放在一起比較：同樣是讓智能體讀一份「寫給自己看的說明」，再據(jù)此行動(dòng)。

因此，它更像一個(gè)跨產(chǎn)品的共性方向，而非某一家的獨(dú)門特性。

有意思的是細(xì)節(jié)上的取舍。

Claude的coordinator最多能派20個(gè)subagent，而且刻意限制只派一層：深度超過1，直接忽略。

這和Codex那種放手并行派生的路子，正好是兩種心態(tài)。

這背后藏著一條更長(zhǎng)的線。

當(dāng)Codex能給自己、給一群子智能體派活，它就不再只是一個(gè)寫代碼的助手，而更像一個(gè)跑在后臺(tái)的任務(wù)調(diào)度器，寫代碼只是它順手能干的一件事。

OpenAI想讓智能體自己設(shè)定任務(wù)，盯著的顯然是比「幫人寫代碼」大得多的盤子。

小心token賬單爆了

自己寫目標(biāo)、自己派agent，聽上去很爽，但代價(jià)就是可能刷爆你的token賬單。

任務(wù)跑得越久、越不需要人盯，token就燒得越兇。

a16z的Andrew Chen，拿/goal在一個(gè)真實(shí)的eGPU加Mac設(shè)備驅(qū)動(dòng)項(xiàng)目上跑了一整夜：不是教學(xué)demo，是真干活，14小時(shí)過去，第二天早上它還在推進(jìn)。

Andrew Chen直言，這會(huì)讓token用量翻一萬倍。

你手動(dòng)提20次、每次盯著看的會(huì)話，撐死幾十萬token；一個(gè)跑14小時(shí)、沒人管的會(huì)話，量級(jí)完全不是一回事。

就連官方也在教人踩剎車：建議你在goal末尾加一句token預(yù)算，也別一上來就發(fā)/goal，先把項(xiàng)目跑出個(gè)雛形再說。

目標(biāo)會(huì)漂

智能體可能偷懶

熱鬧歸熱鬧，社區(qū)的討論里，質(zhì)疑聲并不少：

讓AI自己寫目標(biāo)，會(huì)不會(huì)出現(xiàn)目標(biāo)漂移，跑著跑著就偏了？

智能體會(huì)不會(huì)偷懶，專挑省事的近路走？

這套東西，到底進(jìn)不進(jìn)得了真正的生產(chǎn)環(huán)境？

Reddit的r/codex里，大家把/goal主要還是用在長(zhǎng)任務(wù)對(duì)齊、生成驗(yàn)收標(biāo)準(zhǔn)、避免死循環(huán)上：本質(zhì)上，還是「人得在旁邊盯著」的狀態(tài)。

網(wǎng)友nick吐槽，再讓它遞歸派生幾層，Codex的首要目標(biāo)，怕是要變成把我們重構(gòu)出局。

而Claude那個(gè)「只派一層」的限制也說明今天的所謂自治，更像是帶著護(hù)欄的放權(quán)，離一個(gè)真正完整的自治多智能體系統(tǒng)，還有很遠(yuǎn)的距離。

但真正的遷移正在發(fā)生，人從規(guī)劃層后移了一步：先是不寫代碼，后是不寫任務(wù)，如今只剩下一句話。

當(dāng)Codex、Cursor、Claude集體把「定義任務(wù)」也交還給模型，新的問題是當(dāng)代碼、任務(wù)、意圖一層層交出去之后，程序員要如何重新定義自己的角色。

參考資料：

https://x.com/thsottiaux/status/2066270561081454989

https://x.com/skirano/status/2066225908202053818

https://github.com/Infinite-Labs-AI/infinite-skills

編輯：元宇

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.