无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Fable 5一天干完兩個月,這類工程師更值錢了

0
分享至


新智元報道


【新智元導(dǎo)讀】Fable 5發(fā)布后,Claude Code團(tuán)隊說,他們不再驗證Claude有沒有把活干對,而是開始驗證它有沒有在干對的事。開發(fā)者開始從盯代碼輸出的監(jiān)工,轉(zhuǎn)變?yōu)槎?biāo)準(zhǔn)的產(chǎn)品經(jīng)理,衡量優(yōu)秀工程師的標(biāo)準(zhǔn)也隨之變了。

一夜之間,全網(wǎng)被一張由飛舞蝴蝶拼成的「5」字刷屏了。

這張圖的主角,正是Anthropic剛端出的最強(qiáng)模型——Claude Fable 5。


https://www.anthropic.com/news/claude-fable-5-mythos-5

Anthropic官宣,這是他們第一款為通用場景做好安全處理的Mythos級模型,能力超過此前公開發(fā)布的任何一款。


緊接著,官方又公布了將所有用戶的5小時和每周速率限制全部清零,讓大家「盡情享受Fable 5」。

開發(fā)者這邊,也一夜變天。

用Claude Code團(tuán)隊自己的話說:過去,他們盯的是Claude有沒有正確完成工作;現(xiàn)在,他們盯的是Claude有沒有在做正確的事。

Claude Code團(tuán)隊成員Thariq Shihipar認(rèn)為,F(xiàn)able是模型領(lǐng)域的一次重大突破,將改變?nèi)藗兣cClaude的協(xié)作方式,有了這樣的利器加持,「是時候更有雄心了」。


Thariq是AskUserQuestion工具的作者。這個工具的功能,就是讓AI反過來采訪你:動手寫代碼前,先拋一串選擇題,把實現(xiàn)細(xì)節(jié)、邊界情況、取舍問清楚。模型能自己跑得越久,這種事先問清楚的能力就越重要。

Thariq也分享了團(tuán)隊總結(jié)的Fable 5所帶來的變化——

三件事被改寫了:你怎么給它交代任務(wù)、你怎么驗收它、你一個人能同時指揮多少個它。

先看Anthropic發(fā)布文中的Stripe案例:5000萬行Ruby代碼庫全庫遷移,人工需兩個多月,F(xiàn)able 5一天完成。


一個5000萬行的Ruby代碼庫,要做全庫遷移,按人手算,一個團(tuán)隊得干兩個多月,F(xiàn)able 5用了一天

把兩個多月壓成一天,這已經(jīng)不是提速那么簡單,人與AI的分工又一次被重新定義了。

從盯過程的監(jiān)工

到定標(biāo)準(zhǔn)的產(chǎn)品經(jīng)理

這輪升級的焦點,并不是跑分。

Anthropic給Claude Code的定位是「智能體編程環(huán)境(agentic coding environment)」。

它能讀文件、跑命令、改代碼,在你盯著、打斷、或者干脆離開的時候,自己把問題推進(jìn)下去。

這才是關(guān)鍵:它能自己干活了你還盯什么?Claude Code官方最佳實踐里提到這樣一句話:

如果你不給Claude一個能跑的檢查項,那你自己就會變成那個驗證循環(huán)。每一個錯誤,都得等你親眼發(fā)現(xiàn)。


Claude Code官方最佳實踐:給Claude一個能跑的檢查,測試、構(gòu)建或截圖對比,否則你自己就成了驗證循環(huán)

意思是說,過去你是監(jiān)工,蹲在屏幕前看它一步步寫,寫錯一行改一行?,F(xiàn)在不一樣了。你的活,從「逐步指揮」變成了「定義目標(biāo)、給夠上下文、立好驗收標(biāo)準(zhǔn)」。

「給目標(biāo)、給上下文」聽起來不復(fù)雜,落地卻不容易,官方最佳實踐也給出了方向。

別一上來就讓它寫代碼,先讓它探索、再讓它計劃、最后才動手,免得它埋頭解決了一個錯的問題。

還有關(guān)鍵一點:用剛才提到的AskUserQuestion,讓Claude先反過來采訪你,把你沒想清楚的實現(xiàn)細(xì)節(jié)、邊界情況、取舍一條條問出來,最后落成一份SPEC.md。

不要擔(dān)心這些準(zhǔn)備工作浪費(fèi)時間。當(dāng)模型能力足夠強(qiáng),能夠自主干活,把需求說清楚,比你盯著它寫代碼就要值錢得多了。

這正是Claude Code團(tuán)隊身上發(fā)生的事:從以前驗證Claude有沒有做對事情,到現(xiàn)在驗證它有沒有在做對的事情。

放手很爽

如何才能信任

放手聽起來很爽,但憑什么信任Claude?

它最讓人頭疼的一點,是錯了還一臉篤定。而且模型越強(qiáng),輸出越像模像樣,錯起來越難被一眼看穿。

Claude會在「看起來做完了」的時候停下來,可這恰恰是最危險的信號。

沒有一個能跑的檢查,「看起來完成」就成了Claude唯一的判斷依據(jù),到頭來可能就成了你的麻煩。

官方的解法是:給它一個能判斷「通過」或「失敗」的東西。

比如一套測試、一個構(gòu)建的退出碼、一段把結(jié)果和設(shè)計稿做對比的截圖。它干活、跑檢查、讀結(jié)果、再改,直到檢查通過。這個循環(huán)自己就閉環(huán)了。

更進(jìn)一步,是Claude Code里的/goal。你設(shè)一個完成條件,它就跨輪次一直干,不用你一輪輪去催。

每干完一輪,會有另一個小模型出來打分:它不是干活那個Claude,而是一個更小更快、更便宜的模型(默認(rèn)是Haiku),專門讀一遍完成條件和這輪對話,判一句「達(dá)成」還是「沒達(dá)成」,再附一句理由。沒達(dá)成就接著干,達(dá)成了自動收工。


Claude Code的/goal命令:設(shè)好完成條件,每輪由一個小模型判斷是否達(dá)成,沒達(dá)成就繼續(xù)干

看上去像無人駕駛。但有一點必須講清楚:那個打分的小模型,不會自己去跑命令,也不會自己去讀文件,它只能看Claude在對話里擺出來的證據(jù)。

也就是說,這套循環(huán)轉(zhuǎn)得順不順,全看Claude有沒有把真東西擺出來。條件寫得松一點,或者Claude只是嘴上說「跑過了」,評估器照樣可能通過。

所以自檢交付不等于無人審稿。

敢放手,靠的是隨時能看到證據(jù),不是賭模型聰明。

一個人

開始指揮上百個智能體

如果說/goal是讓一個Claude干得更久,那Dynamic workflows是讓一群Claude一起干。

它的玩法是,Claude替你寫一段JavaScript腳本,這段腳本去編排大量子智能體在后臺跑。

官方給的適用場景有全庫的代碼審計、500個文件的大遷移、需要交叉驗證的研究問題等。

運(yùn)行規(guī)模有多大?一次運(yùn)行最多能調(diào)動1000個智能體,同時并發(fā)最多16個。


Claude Code官方文檔的workflows約束表,高亮處顯示單次運(yùn)行最多1000個智能體

Claude Code甚至內(nèi)置了一個叫/deep-research的workflow,專門把一個問題拆成多個角度去搜、去交叉核驗、再投票篩掉站不住的說法,最后給你一份帶引用的報告。

這意味著什么?Claude Code已經(jīng)不只是終端里那個陪你聊天的對話框了,它在向一個能持續(xù)運(yùn)行、能編排、能復(fù)用的工程代理系統(tǒng)靠攏。

一個人指揮一支AI軍團(tuán),現(xiàn)在只用/workflows里的一行命令就能辦到。

自主不等于替代

Fable 5確實更強(qiáng)。

官方說它能比此前任何Claude模型更長時間自主工作,任務(wù)越長越復(fù)雜,它領(lǐng)先得越多,但這不等于程序員完全可以撒手不管了。

恰恰相反,官方最佳實踐通篇在強(qiáng)調(diào)四件必須要交給人去干的活:定驗證標(biāo)準(zhǔn)、管權(quán)限、控上下文、審證據(jù)。


它甚至專門列出了一些應(yīng)當(dāng)避免的常見失敗模式,其中一類錯誤叫「信任但不驗證的缺口」(The trust-then-verify gap),說的正是Claude給出一份看著像模像樣、實則沒處理邊界的情況。

解法只有一個:你能驗證它,才能發(fā)布它;驗證不了,就別發(fā)布。

成本和門檻,也繞不過去。

Fable 5的價格是每百萬輸入token 10美元、每百萬輸出token 50美元。能力更猛的「孿生兄弟」Mythos 5,底層是同一個模型,只是放寬了部分安全保護(hù),眼下只開放給一小部分網(wǎng)絡(luò)防御者和基礎(chǔ)設(shè)施提供方。

Fable 5本身還帶著一層分類器護(hù)欄。

碰到網(wǎng)絡(luò)安全、生物化學(xué)這類敏感話題,它會自動把回答交給Opus 4.8接管。官方說超過95.0%的會話不會觸發(fā)這種回退,但護(hù)欄調(diào)得偏保守,偶爾也可能誤傷正常請求。

敢接長任務(wù),不等于敢完全撒手。越自主,越要會驗收。

回到Thariq那句話:是時候更有雄心了。

這個雄心背后的潛臺詞是讓你敢把更大的問題交出去。但放手的過程還要有掌控,這更像是一種融合了經(jīng)驗與直覺的藝術(shù)。

規(guī)則是起點

不是教條

說了這么多規(guī)則和方法后,Anthropic官方補(bǔ)了一條:它們?nèi)瞧瘘c,不是教條。

也就是說,這套最佳實踐在多數(shù)情況下好用,卻未必適合每個場景。

有時候,你該讓上下文一直攢著,因為你正啃一個復(fù)雜問題,那段歷史很重要;有時候,你該跳過計劃直接讓Claude上,因為任務(wù)本就是探索性的;有時候,一句含糊的提示恰恰是對的,因為你想先看看它怎么理解,再決定要不要框住它。

訣竅是留心什么管用,沒有一定之規(guī)。

Claude干得漂亮?xí)r,回想你做了什么:提示怎么寫的、給了哪些上下文、用的哪個模式;它卡殼時,反思一下:提示太空、任務(wù)一口吃不下?

慢慢地,你會長出一種沒有任何指南可以教的直覺:什么時候該說細(xì)、什么時候該留白;什么時候該計劃、什么時候該放它去探索——

到了那一步,你才算真懂了怎么和它一起干活。

當(dāng)Fable 5能把兩個多月的活一天干完之后,程序員最稀缺的能力已經(jīng)變了:不再是把代碼寫好,而是定義什么才是好代碼,「會編程」這件事的定義,也在被悄悄改寫。

未來最值錢的工程師,不再是代碼監(jiān)工,而是那個最會提問、定標(biāo)準(zhǔn)、驗收的人。

參考資料:

https://www.anthropic.com/news/claude-fable-5-mythos-5%20%20

https://code.claude.com/docs/en/best-practices%20

https://code.claude.com/docs/en/common-workflows%20

https://x.com/ClaudeDevs/status/2064399512664526853

編輯:元宇

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
諾坎普夢碎!巴薩官宣放棄買斷,拉什福德果斷行動刪社媒劃清界限

諾坎普夢碎!巴薩官宣放棄買斷,拉什福德果斷行動刪社媒劃清界限

夜白侃球
2026-06-12 13:43:07
生育率的“回旋鏢”還是呼啦啦來了

生育率的“回旋鏢”還是呼啦啦來了

新浪財經(jīng)
2026-05-18 07:42:35
一場離婚拿走近90億,她憑什么能安靜躺賺,一年分紅超4000萬

一場離婚拿走近90億,她憑什么能安靜躺賺,一年分紅超4000萬

青眼財經(jīng)
2026-06-10 22:14:05
烏克蘭再摧毀克里米亞的阿爾米揚(yáng)斯克橋!打掉50輛軍車

烏克蘭再摧毀克里米亞的阿爾米揚(yáng)斯克橋!打掉50輛軍車

項鵬飛
2026-06-12 18:19:53
“貴州富婆”楊小娟:嫁三婚演員呂良偉,婚后生一子,幸福美滿

“貴州富婆”楊小娟:嫁三婚演員呂良偉,婚后生一子,幸福美滿

飄飄然的娛樂匯
2026-06-09 20:10:04
俄遠(yuǎn)程火炮中將為防刺殺躲進(jìn)烏克蘭家屬院,卻被車座下的炸彈炸飛

俄遠(yuǎn)程火炮中將為防刺殺躲進(jìn)烏克蘭家屬院,卻被車座下的炸彈炸飛

荷蘭豆愛健康
2026-06-10 17:45:21
國籍風(fēng)波不過7年,央視出手,鄧亞萍迎噩耗,曝出兩點重要信息

國籍風(fēng)波不過7年,央視出手,鄧亞萍迎噩耗,曝出兩點重要信息

梨花黛娛
2026-04-08 14:51:22
斷糧斷水快撐不住了,菲方對中國喊話:再不撤就開打,必有一戰(zhàn)

斷糧斷水快撐不住了,菲方對中國喊話:再不撤就開打,必有一戰(zhàn)

瀲滟晴方DAY
2026-06-12 18:49:43
大羅:安切洛蒂是歷史前三的教練,巴西沒有人達(dá)到他的水平

大羅:安切洛蒂是歷史前三的教練,巴西沒有人達(dá)到他的水平

懂球帝
2026-06-12 17:51:06
曝迪麗熱巴陳飛宇熱戀一年半,男的愛到瘋魔卻摳搜,買二手送熱巴

曝迪麗熱巴陳飛宇熱戀一年半,男的愛到瘋魔卻摳搜,買二手送熱巴

陳意小可愛
2026-06-12 00:43:25
2027款豐田賽那SIENNA上市 售29.88萬元起

2027款豐田賽那SIENNA上市 售29.88萬元起

車質(zhì)網(wǎng)
2026-06-12 13:03:05
董路邀請孫繼海:你若愿意參賽我給你直通卡!咱們能碰上就踢一場

董路邀請孫繼海:你若愿意參賽我給你直通卡!咱們能碰上就踢一場

念洲
2026-06-12 10:57:20
相親角來了個印度小伙,全程拽得不行,張嘴就吹自己是印度高種姓

相親角來了個印度小伙,全程拽得不行,張嘴就吹自己是印度高種姓

西樓知趣雜談
2026-05-25 11:51:00
6.12乒乓賽:林詩棟讓二追三顯實力,溫瑞博3-1大勝

6.12乒乓賽:林詩棟讓二追三顯實力,溫瑞博3-1大勝

鏗鏘格斗
2026-06-12 20:59:58
又一“國民飲料”塌房,背后全是科技與狠活,網(wǎng)友:又搞擦邊

又一“國民飲料”塌房,背后全是科技與狠活,網(wǎng)友:又搞擦邊

南宗歷史
2026-06-10 19:15:07
3換1!尼克斯神級交易!老六和家人都哭了

3換1!尼克斯神級交易!老六和家人都哭了

籃球教學(xué)論壇
2026-06-12 16:33:57
笑瘋了!女子嫌胸部太大,忍無可忍果斷縮胸,評論區(qū)太敢說了!

笑瘋了!女子嫌胸部太大,忍無可忍果斷縮胸,評論區(qū)太敢說了!

譚談社會
2026-06-08 11:58:48
中方連夜通告全球,菲律賓暴怒,菲防長徹底破防:我只是說了實話

中方連夜通告全球,菲律賓暴怒,菲防長徹底破防:我只是說了實話

共工之錨
2026-06-13 00:20:29
CBA官宣選秀大會初始完整順位:四川狀元簽 江蘇榜眼簽天津探花簽

CBA官宣選秀大會初始完整順位:四川狀元簽 江蘇榜眼簽天津探花簽

醉臥浮生
2026-06-12 18:15:15
主角原著:憶秦娥的兒子為何是智障,不是劉紅兵飲酒,而是她自己

主角原著:憶秦娥的兒子為何是智障,不是劉紅兵飲酒,而是她自己

陳意小可愛
2026-06-12 15:20:58
2026-06-13 01:55:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
15454文章數(shù) 66922關(guān)注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

美加墨世界杯第二場比賽就現(xiàn)空座 英媒:尷尬

頭條要聞

美加墨世界杯第二場比賽就現(xiàn)空座 英媒:尷尬

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰(zhàn)熱巴最意外

財經(jīng)要聞

萬億美元順差背后,透露這些信號

汽車要聞

標(biāo)配激光雷達(dá)/雙動力可選 昊鉑S600限時售17.99萬起

態(tài)度原創(chuàng)

教育
房產(chǎn)
時尚
數(shù)碼
軍事航空

教育要聞

家長成了“瘋女人”,被女兒作業(yè)搞崩潰,網(wǎng)友:太真實

房產(chǎn)要聞

海南最賺錢行業(yè)曝光!最快4年半,??谌钯I三房!

夏天別總穿一身白或一身黑!試試一半彩色、一半基礎(chǔ)色,高級亮眼

數(shù)碼要聞

英國監(jiān)管機(jī)構(gòu)警告:亞馬遜、eBay仍在售可能致命的假冒手機(jī)充電器

軍事要聞

伊朗媒體:已故最高領(lǐng)袖葬禮推遲舉行

無障礙瀏覽 進(jìn)入關(guān)懷版