无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

澳洲放羊大叔引爆AI編程革命!Claude Code急推goal模式,不干完不許停

0
分享至


新智元報道

編輯:好困 KingZH

【新智元導讀】澳洲牧羊大叔隨手寫的三行bash,11天內被OpenAI、Anthropic和Hermes集體收編了。

一覺醒來,Claude Code又更新!

為了讓Claude 持續工作直到任務完成,Claude Code最近推出的新功能:/goal 。


你只要設定條件,Claude不完成任務它絕不罷休!


用過AI編程工具的人都懂,這到底多重要!

你給Agent下了一個任務,它跑了三個回合,改了兩個文件,突然停下來問你「接下來需要我做什么?」

不是,bug你這還沒修完呢啊!


Agent越來越聰明,寫代碼越來越快,但「從頭到尾把一件事干完」這件事,到2026年初都沒有一家能做到。

然后,一位來自澳大利亞的牧羊大叔Geoffrey Huntley,用三行bash解決了。

done

他把它命名為Ralph Loop,致敬《辛普森一家》里那個永遠搞不清狀況但從不放棄的小孩Ralph Wiggum。

邏輯極其粗暴,無限循環,反復把同一個prompt喂給Agent。進度寫在文件系統和Git歷史里,上下文滿了就開新實例,讀文件接著干。


原始,不優雅,但十分有效。

有效到OpenAI看見了,Nous Research看見了,Anthropic也看見了。

11天,三家頂級AI實驗室,不約而同地把這三行bash寫進了官方產品。

這一刻,所有人都明白了一件事——

通用人工智能的臨門一腳,可能不是更聰明的模型,而是「把事做完」的模型。

換句話說,AI編程的核心戰場正在從「生成代碼」轉向「閉環交付」。

11天,三條線,同一個終點

4月30日,OpenAI的Codex率先上線/goal

Greg Brockman在X上只丟了一句,「Codex現已內置Ralph loop++」。


一周后,Hermes Agent跟上。又過4天,Claude Code也上了。

11天。三家。同一個命令。同一個功能。

但實現路徑,差了十萬八千里。

Codex「不忘事」,Hermes「不爛尾」,Claude Code「不自欺」。


Codex:

把目標存成一條數據庫記錄

OpenAI是三家里最先出手的,方案也最簡潔。

在Codex里,/goal是一個持久化的工作流對象,存在本地的app-server狀態層里。

關掉終端、合上筆記本、甚至重啟系統,目標都不會丟。下次打開Codex,自動接上。


模型通過結構化的update_goal工具匯報進度狀態,token預算耗盡時觸發「軟著陸」而非硬停。

有人用這個功能連續跑了14個小時,中間暫停5小時去睡覺,回來Codex從斷點續跑,把一個設備驅動項目做完了。

工程化,干凈,但克制。


Hermes Agent:

一個人干不完,那就上一個團隊

Hermes Agent的野心最大。

在這里,/goal只是冰山一角。真正的重頭戲是多智能體看板系統,Hermes把「讓AI把活干完」從單Agent問題升級成了團隊協作問題。


看板的底層是本地SQLite,持久化存儲,跨重啟不丟。

你在上面創建一個任務卡片,Hermes會直接把它拆成多個子任務,分配給不同的Agent worker。每個worker是一個獨立的OS進程,有自己的身份、模型配置和工作目錄。

看板和/goal是兩套互補的系統。/goal管的是單個Agent的目標鎖定(Ralph loop),看板管的是多個Agent之間的任務調度。一個縱向深入,一個橫向鋪開。

最后,是五層防爛尾機制。

第一層,心跳檢測。每個worker定期向看板報到,證明自己還活著。

第二層,僵尸回收。worker超時沒響應?系統自動判定死亡,回收它手上的任務重新分配。macOS上還有專門的達爾文僵尸檢測邏輯。

第三層,退出攔截。worker沒完成任務就退出了?系統自動把它標記為blocked,不讓它再接新活,防止「摸魚型Agent」反復領任務又不做。

第四層,幻覺攔截。這是最狠的一層。AI說「我做完了」不算數,系統會驗證它實際產出的代碼是否真的落盤了。Agent說自己創建了一個文件但實際上沒有?抓住,回滾,重來。

第五層,重試預算。每個任務有獨立的max_retries,最多重試N次,超過就上報人類。絕對不會無限循環到死機。


Claude Code:

做事的人和驗收的人,不能是同一個

Anthropic是三家里最后出手的,但方案最巧妙。

本質上,Claude Code的/goal是一個session級別的Stop Hook。

你設定一個完成條件(比如「test/auth目錄下所有測試通過且lint無報錯」),Claude就開始干活。


關鍵設計在驗收環節。每干完一輪,系統不讓Claude自己判斷「我做完了沒有」。

它把對話記錄和你的完成條件一起發給一個獨立的小模型(默認是Haiku),讓這個小模型來裁判。

小模型如果覺得沒完成,就需要返回一個具體理由(比如「test_login.py還有2個failure」)。然后這個理由會被注入Claude下一輪的上下文,指導它接著干。

如果小模型認為完成了,目標就會自動清除,任務結束。

值得一提的是,這個裁判模型不調用任何工具,不讀文件,不跑命令。它只看Claude在對話里產出的內容。

所以,你的完成條件必須是Claude在對話中能證明的東西。

它最長支持4000字符,因此你可以寫得很細。

甚至,還可以在條件里加約束,比如「不修改其他測試文件」「20輪內完成否則停止」等等。


決賽進行時:工作流入口

把視角拉遠一步。

Claude Code背后站著Anthropic,Codex背后站著OpenAI,Hermes Agent接入了兩邊的模型,同時也是DeepSeek V4等模型的主力分發渠道。

三條路徑,恰好覆蓋了ASI決賽的三個生態入口。

而他們爭的,也是同一樣東西——工作流。

誰的Agent先讓開發者養成「設完目標就走開」的習慣,誰就鎖死了工作流入口。

因為習慣一旦形成,遷移成本是指數級的。

你不會輕易離開一個已經跑通了看板調度、斷點續傳、checkpoint回滾的Agent基礎設施。

一個看似很小的/goal命令,背后卡的是整條Agent工作流的護城河。

參考資料:

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
5月13日俄烏:烏克蘭正向美國傳授戰爭之道

5月13日俄烏:烏克蘭正向美國傳授戰爭之道

山河路口
2026-05-13 18:51:46
搶在接機前,特朗普隨行名單又變,馬斯克回歸,黃仁勛被自己坑了

搶在接機前,特朗普隨行名單又變,馬斯克回歸,黃仁勛被自己坑了

比利
2026-05-13 14:21:24
給男性一條血淋淋的忠告:千萬不要和酒后女性(非配偶)發生關系

給男性一條血淋淋的忠告:千萬不要和酒后女性(非配偶)發生關系

大秦共和國
2026-05-12 18:26:18
清理門戶!廣東出局第一天,5人或離隊,1將恐退役,杜鋒洗牌

清理門戶!廣東出局第一天,5人或離隊,1將恐退役,杜鋒洗牌

男足的小球童
2026-05-13 18:08:27
泰王蘇提達出席春耕大典,歐拉弄也分到座位,靚麗4仙女跪地行禮

泰王蘇提達出席春耕大典,歐拉弄也分到座位,靚麗4仙女跪地行禮

喜歡歷史的阿繁
2026-05-13 16:19:09
41:0全票通過!歐盟突對華重磅表態,中方立場鮮明正面回應

41:0全票通過!歐盟突對華重磅表態,中方立場鮮明正面回應

安珈使者啊
2026-05-13 16:48:33
從7元到172,因為概念與業績,四年漲了25倍,能拿住的有幾人?

從7元到172,因為概念與業績,四年漲了25倍,能拿住的有幾人?

丁丁鯉史紀
2026-05-13 14:18:20
比亞迪重磅王炸!2026固態電池首發 1218km續航2027量產

比亞迪重磅王炸!2026固態電池首發 1218km續航2027量產

三農老歷
2026-05-13 12:04:27
上海地鐵撕扯吐痰事件反轉!目擊者澄清:不是搶座,侄子被噴一臉

上海地鐵撕扯吐痰事件反轉!目擊者澄清:不是搶座,侄子被噴一臉

娛樂圈的筆娛君
2026-05-13 13:37:48
1500萬潮汕人移民東南亞,當年究竟有多慘烈?| 地球知識局

1500萬潮汕人移民東南亞,當年究竟有多慘烈?| 地球知識局

地球知識局
2026-05-13 07:30:17
足球裝備網:阿迪達斯將為曼聯推出球隊史上首款賽季第四球衣

足球裝備網:阿迪達斯將為曼聯推出球隊史上首款賽季第四球衣

懂球帝
2026-05-13 00:56:05
今天13至14時,北京全市測到最高氣溫為37.2℃

今天13至14時,北京全市測到最高氣溫為37.2℃

新京報
2026-05-13 15:17:07
南京審計大學偷拍者被開除后續!疑知情校友曝猛料,顧某是慣犯

南京審計大學偷拍者被開除后續!疑知情校友曝猛料,顧某是慣犯

小徐講八卦
2026-05-13 11:54:03
奶奶騎臺鈴電動車接6歲孫子,NFC解鎖后方向突然鎖死兩人摔傷;家屬:不到一年發生七八次事故;臺鈴回應

奶奶騎臺鈴電動車接6歲孫子,NFC解鎖后方向突然鎖死兩人摔傷;家屬:不到一年發生七八次事故;臺鈴回應

大象新聞
2026-05-12 19:46:06
長得太美被導演占為己有,25歲生下3個孩子,如今個個都給她爭光

長得太美被導演占為己有,25歲生下3個孩子,如今個個都給她爭光

攬星河的筆記
2026-05-13 13:26:24
太恐怖!奶奶侵犯10歲的孫子,從孩子3歲就開始了

太恐怖!奶奶侵犯10歲的孫子,從孩子3歲就開始了

魔都姐姐雜談
2026-05-13 14:35:02
胖虎:有一次巴西隊半場出現爭執,安帥抽完煙后講話平復眾人

胖虎:有一次巴西隊半場出現爭執,安帥抽完煙后講話平復眾人

懂球帝
2026-05-13 08:57:18
中國排協高層變動,賴亞文升任,惠若琪劉曉彤在列,奧運冠軍落選

中國排協高層變動,賴亞文升任,惠若琪劉曉彤在列,奧運冠軍落選

娛說瑜悅
2026-05-13 17:05:09
蔚來李斌直言:今年車賣不好,公司就沒了,形勢很嚴重了!

蔚來李斌直言:今年車賣不好,公司就沒了,形勢很嚴重了!

老特有話說
2026-05-11 16:12:23
“你兒子比農村土狗還好養!”中學男孩全碳水飲食,吃出可憐面相

“你兒子比農村土狗還好養!”中學男孩全碳水飲食,吃出可憐面相

妍妍教育日記
2026-05-12 17:35:01
2026-05-13 21:11:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15202文章數 66865關注度
往期回顧 全部

科技要聞

騰訊一季度營收1964.6億元 同比增9%

頭條要聞

美國總統時隔9年再次訪華 特朗普抵達北京

頭條要聞

美國總統時隔9年再次訪華 特朗普抵達北京

體育要聞

14年半,74萬,何冰嬌沒選那條更安穩的路

娛樂要聞

白鹿掉20萬粉,網友為李晨鳴不平

財經要聞

美國總統特朗普抵達北京

汽車要聞

C級純電轎跑 吉利銀河"TT"申報圖來了

態度原創

本地
健康
房產
旅游
公開課

本地新聞

用蘇繡的方式,打開江西婺源

干細胞能讓人“返老還童”嗎

房產要聞

卷瘋了!最低殺到7字頭!手握30萬,海口樓市橫著走!

旅游要聞

五月泉城水勢豐盈,濟南“月牙飛瀑”在線249天刷新紀錄

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版