无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Claude Fable 5最強深度實測!5個小時,我把想了很久的Mac App做出來了!

0
分享至

早上一覺醒來,Anthropic又又又發新模型了:Claude Fable 5。

Claude 5來了是挺好的,但是為什么特么又整出個Fable出來...Opus、Sonnet、Haiku這套名字還不夠煩人么。

以及,為啥也不叫Mythos??A社在這個細節上還真是挺有硅谷大公司瞎特么起名的風范的。

不過,吐槽歸吐槽,這個模型確實夠強的。一句話說清它是什么:Fable 5,就是加了安全護欄的Mythos。Mythos是Anthropic那個之前只開放給政府和受邀機構、外界只聞其名的模型,這次加上護欄,公開發售了。

以及你最該知道的是:從現在到6月22日,Fable 5直接包含在Claude訂閱里,Pro和Max用戶免費用。6月23日起它會從訂閱額度里移除,想繼續用得另外充值、按量計費。想白嫖的話,只有這兩周窗口。

能力上看一張圖就夠了:


SWE-Bench Pro這個測試,是把真實開源項目里的bug丟給模型自己修。80.3%意思是十個真實bug它能獨立修好八個,第二名被甩開11個百分點。官方公告還反復強調一句:任務越長、越復雜,它的領先越大。最有畫面感的官方案例是Stripe:5000萬行Ruby代碼庫遷移,團隊原本評估要兩個月,Fable 5一天跑完。


這篇文章前一半把這個模型講清楚,后一半給你看一個別處看不到的實測:我用它把一個想了很久的App真的做了出來,從動手到打包好安裝包,一天。

我大概用了5個小時后的感受是:Fable 5寫代碼的穩定性比之前強了不少,只要你能把需求或者說你要解決的問題說清楚,基本上它就能給你一次性搞定。

Fable是什么來歷

今年4月,Anthropic啟動了一個叫Project Glasswing的項目,把Mythos開放給政府網絡防御部門和關鍵基礎設施提供方。只有受邀機構能用,外界只聞其名。

6月9日這次發布,其實是同時發了兩個模型:Claude Mythos 5和Claude Fable 5。兩者是同一個底層模型,區別只在安全分類器。這東西你可以理解成站在模型門口的安檢員,檢查進出的問題和回答,碰到生化武器、網絡攻擊這類危險話題直接攔下。Mythos 5安檢松,繼續只給受邀合作方;Fable 5安檢嚴,公開發售。官方的定義很直接:a Mythos-class model made safe for general use。

名字也是配套的:Mythos是希臘語的「神話」,Fable是拉丁語里的「寓言」,一個希臘語一個拉丁語,都是講故事。同一個故事,兩種講法,護欄的松緊直接寫進了產品名里。

設計邏輯我看懂了,但還是想吐槽一句:Haiku、Sonnet、Opus這套大中小,用戶好不容易才記住誰是誰,現在又冒出來Fable和Mythos兩個新名字,模型選擇器越來越像文學選修課。有情懷,但真沒必要。老老實實叫Claude 5,天塌不下來。

幾個指標順手列一下:上下文窗口1M token,單次輸出最高128K,思考模式強制開啟、關都關不掉。這個「關不掉」后面還會提到,它和我的使用體感直接相關。

貴不貴?說說我今天的真實用量

API價格是討論最多的地方:10/百萬輸入,10/百萬輸入,10/百萬輸入,50/百萬輸出,正好是Opus 4.8的兩倍。目前在Claude Code中的消耗速度也會是Opus模型的2倍。

說說我自己的情況:我今天9點起床之后,一直同步在做2-3個項目,全程Fable 5,200美元的Max版本到現在沒遇到限制。

不過有個前提,Anthropic在發布模型的時候把用量reset了一波,相當于給所有人發了張新卡。希望OpenAI趕緊特么參與競爭,讓這種reset來得更猛一些。

至于6月23號之后,如果真按API價格收費的話,那確實會有點太貴了。所以我的態度是:這兩周先往死里用,23號之后的事23號再說。

我手上正好壓著一個想了很久的項目

模型講完了。對我來說,判斷一個模型好不好,標準只有一個:能不能把我想做的東西真的做出來

事情是這樣的:我從來不會寫代碼,所有產品都是AI寫的。這種工作方式有個很具體的副作用:AI幫你一個下午起十個項目,但它們散落在各個文件夾里,名字認不出,agent改了什么也看不見。

具體到每天的場景,我的需求其實很樸素:agent起好的項目,我想輕松點開看;寫作類的項目很多,稿子要反復改,我需要一個順手的編輯器;繪圖和設計類的任務,我得一張張查看agent的生成結果;agent做出來的東西出問題、不符合我預期的時候,我希望能更容易地截圖、把參考文件拖進去投喂給它。

這些事沒有一件是寫代碼,但每一件都卡在文件系統和agent中間:Finder看得見文件、不好喂agent,終端喂得了agent、看不見文件。所以我的日常就是在Finder、Cursor、瀏覽器三個窗口之間來回切,找一個昨天生成的文件要翻半天。

我一直想要的,是文件系統和agent之間有真正的聯動:左邊瀏覽和預覽本機文件,右邊一個真的終端跑coding agent,agent每改一個文件,左邊當場亮起來。一個vibe coding的駕駛艙。

之前搭過一個網頁版的雛形,一個本地文件瀏覽頁,能搜能預覽,僅此而已。真正想要的部分全卡在后面:內嵌真終端、文件監聽、編輯器、打包簽名,這是一個完整桌面App的工程量。以前不是做不了,主要是改起來太磨人,我提一個需求要來回拉扯很多輪,想想就先放下了。

Fable 5發布當天,我決定拿它試試。

一天,從想法到安裝包

時間線是這樣的:

6月9日下午我先拿Opus 4.8做了個基礎的版本。Electron桌面殼、內嵌終端、文件×終端×預覽三方聯動。但是有些核心的體驗一直沒跑通。

6月10日早上,拿到Fable后開啟大改:代碼編輯器、Markdown所見即所得、圖片標注編輯、整個布局重構。然后打包、簽名,生成dmg安裝包。

中間沒有跳過驗收。我給這個項目定的交付標準是:5個獨立的AI subagent分別扮演重度vibe coder、原生審美設計師、零文檔新用戶、終端十年老兵、破壞性質量官,對著成品、真機截圖和代碼打分,全部≥90分且無紅線才算達標。第一輪就被打回來了:審美踩紅線、終端健壯性不夠、數據安全有口子。修完再審,總共折騰了四輪,才算過關。

它不是demo,也不是原型。它裝在我的Applications文件夾里,我寫這篇文章的此刻,它就開著。


右下角終端里掛著的,正好是Fable 5的上線通知。

翻箱FanBox:它長什么樣

App叫翻箱,英文名FanBox。你也可以把它讀成一個agent box:一個更好地管理agent和文件系統的工具,把「找文件 → 跑agent → 看它改了什么」收進一個窗口。

設計目標是每種文件「長得像它自己」,不點開就知道是什么。

幾個我自己最常用的能力:

活的儀表盤。agent每寫一個文件,那張文件卡片當場蕩開漣漪、按改動頻率發光。多個項目并行跑agent的時候,agent寫到哪,光就走到哪,「看AI干活」第一次有了現場感。

會話回放。變更面板里有個播放鍵,像刷視頻一樣拖時間軸,重現這段時間agent一步步改了哪些文件。agent跑了半小時長任務,回來拖一遍就知道它都干了什么。

拖文件喂agent。從文件列表把文件或文件夾拖進終端,路徑自動插進輸入行;在預覽里選中一段文字,點一下就發到終端給agent當上下文。反過來,終端里出現的文件路徑可以直接點擊,在翻箱里打開。

?K找回。記得名字片段就能搜到文件和文件夾,文件夾卡片右上角自動標上node/web/py這些項目類型徽章,一下午起的十個項目一眼認出來。

原地輕改。代碼和JSON用Monaco(VS Code同款內核),Markdown是Notion式所見即所得,圖片可以直接標注、畫箭頭、打碼。看到哪改到哪,不用再開一個編輯器。

這篇文章就是在翻箱里寫的,左邊預覽草稿,右邊終端掛著Claude Code:


下面這張是我自己堆滿截圖和錄屏的桌面,不開啟終端agent窗口的情況下和finder沒太大區別:


agent剛在一個文件夾里改了兩處,那張卡片就這樣亮起來:


順便,它有三套皮膚,配色、字體、圖標、代碼高亮整體切換:熒光綠炭黑的終端風、奶油紙赤陶橙的檔案風、黑白紅的索引風。


我自己對這個產品定義的邊界是:翻箱不跟Finder拼文件管理,不做插件不做調試,重活繼續甩給IDE。它只把「找回 + 預覽 + 輕改 + 指揮agent」這一條鏈路做到順手。全部本地運行,零外網請求,數據不出本機。

不過呢,它現在還是個挺初級的版本,主要解決我自己的問題,審美和功能都按我自己的需要來,沒打算討好誰。我估計很長一段時間,它都會是我的一個簡單的個人項目。

開發過程里,Fable 5給我的真實體感

回到模型本身。這次開發前一天用Opus 4.8打底,后一天用Fable 5大改,同一個項目前后腳換了兩代模型,差別很具體:不是更快,是犯錯更少,一次就把問題解決

舉個最典型的例子。翻箱的圖片縮略圖功能,初版在圖多的文件夾里點擊會卡好幾秒。這種性能問題以前是最磨人的:模型猜一個原因,改一版,好一點但沒解決,再猜再改,三四輪下來代碼越來越亂。

這次我就描述了一句「圖多的目錄點擊很卡」。它定位出來兩個疊加的根因:縮略圖在加載原圖整個文件,以及每次點擊都在重建整個文件網格。然后一次改完:加了一個帶緩存的縮略圖接口,點擊改成只切換選中樣式不重建。點擊響應降到0.1秒內,肉眼無感。一輪,沒有返工。

類似的還有終端里中文目錄名亂碼的問題。這涉及xterm.js的寬字符處理,挺冷門的。它直接指出要用unicode11這個addon,還提醒這是個實驗性API需要顯式開啟。這種準確命中偏門問題的瞬間,一天里出現了很多次。

打包階段更明顯。Electron打包在國內網絡環境下是個連環坑:二進制下載被擋、原生模塊編譯失敗、新版node讓構建工具直接掛掉。以前這種環境問題能耗掉一晚上,這次它一路換鏡像、換編譯方案、調整打包配置,把一串坑都繞過去了,我全程只負責看著。

為什么會這樣?我猜答案就藏在前面那個「關不掉」里。Fable 5的思考模式是強制開啟的,單個回復明顯比Opus要等得久。慢和準很可能是同一枚硬幣的兩面:動手之前想得久,猜錯率就低,猜錯率低,就不用返工。它省掉的不是打字時間,是返工。

說句誠實的:我沒拿同一個問題去喂舊模型做對照實驗,上面這些是體感對比,不是同題實測。但「以前五輪拉鋸、現在一輪解決」這種差別,大到不需要儀器。

后來我看到Claude Code的作者Boris Cherny對Fable 5的評價:「自Opus 4.5以來最大的一步」,他強調的也是判斷力和debug能力。跟我的體感,完全對上了。

最后

翻箱的安裝包已經打好了,并且,已開源發布,你也可以拿我的開源代碼去改出一個更適合你自己的agent box來

https://github.com/alchaincyf/fanbox


至于Fable 5,我的建議很簡單:如果你是Pro或Max訂閱用戶,6月23日之前,在Claude Code里把模型切到Fable 5,拿一個你一直想做但覺得「太麻煩」的項目喂給它。免費額度你也有,我做翻箱用的就是它。

還沒上手過Claude Code的,可以從我的橙皮書《Claude Code: 從入門到精通》開始,微信讀書就能看。

我想了很久的駕駛艙,從拿到Fable 5到完成MacOS應用打包,5個小時。

你那個擱置很久的項目,說不定也就差一個這樣的周末。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
男人搞定50歲女人最好方法,喂飽了她兩個需求,她就會主動依你

男人搞定50歲女人最好方法,喂飽了她兩個需求,她就會主動依你

心理觀察局
2026-05-04 08:20:08
0-2不敵澳大利亞,土耳其首次在世界杯輸給亞足聯球隊

0-2不敵澳大利亞,土耳其首次在世界杯輸給亞足聯球隊

懂球帝
2026-06-14 14:16:16
中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

殘夢重生來
2026-06-14 04:59:12
“機密”文件竟在微信群中傳播!查明:檔案局服務人員發現涉密文件與兒子工作有關,遂拍照發家庭群,已被辭退;相關負責人被黨內嚴重警告

“機密”文件竟在微信群中傳播!查明:檔案局服務人員發現涉密文件與兒子工作有關,遂拍照發家庭群,已被辭退;相關負責人被黨內嚴重警告

揚子晚報
2026-06-03 07:37:03
6月14日競彩足球推薦分析:周日賽事解析附勝平負進球數比分參考

6月14日競彩足球推薦分析:周日賽事解析附勝平負進球數比分參考

每日精選二串一推薦
2026-06-14 13:55:39
全網心痛的“女兒要媽媽報名6萬美術班”事件,逼瘋多少普通父母

全網心痛的“女兒要媽媽報名6萬美術班”事件,逼瘋多少普通父母

另子維愛讀史
2026-06-11 22:19:19
“亞視一哥”罕曝離開亞視真相,曾因缺席臺慶惹怒高層

“亞視一哥”罕曝離開亞視真相,曾因缺席臺慶惹怒高層

東方不敗然多多
2026-06-14 15:23:17
中國鬧了個烏龍,沙漠種麥本為保糧倉,誰料金黃麥浪竟成治沙神器

中國鬧了個烏龍,沙漠種麥本為保糧倉,誰料金黃麥浪竟成治沙神器

蜉蝣說
2026-06-14 09:20:24
黃仁勛說清穿皮夾克原因,17歲后全靠老婆買衣服,30度高溫也不脫

黃仁勛說清穿皮夾克原因,17歲后全靠老婆買衣服,30度高溫也不脫

大廠編外實習生
2026-06-12 17:45:33
“SpaceX沒說,但所有線索都指向中國”

“SpaceX沒說,但所有線索都指向中國”

觀察者網
2026-06-12 09:23:04
上海一特斯拉內30萬現金“憑空蒸發”?很多車主都在犯這致命錯誤

上海一特斯拉內30萬現金“憑空蒸發”?很多車主都在犯這致命錯誤

環球網資訊
2026-06-13 18:49:28
世界杯直播解說臺起爭執!管澤元銳評姆巴佩,范志毅當場回懟

世界杯直播解說臺起爭執!管澤元銳評姆巴佩,范志毅當場回懟

小琴動漫
2026-06-14 03:13:31
朝鮮霸占四個世界第一,至今無人超越,難怪美國對朝鮮如此客氣

朝鮮霸占四個世界第一,至今無人超越,難怪美國對朝鮮如此客氣

今夜繁星墜落
2026-06-13 05:28:13
我住院未婚妻從未探望,我沉默退婚,出院當天她瘋狂來電質問

我住院未婚妻從未探望,我沉默退婚,出院當天她瘋狂來電質問

云端小院
2026-06-14 06:51:39
摩根士丹利投資的“中國最大骨科連鎖醫院”,就快撐不下去了

摩根士丹利投資的“中國最大骨科連鎖醫院”,就快撐不下去了

健識局
2026-06-12 20:40:19
喜訊!遼籃2米15內線開發新技術,赴美特訓收獲大新賽季值得期待

喜訊!遼籃2米15內線開發新技術,赴美特訓收獲大新賽季值得期待

星Xin辰大海
2026-06-14 14:30:46
別不信!央國企裁員,最先安全的不是95后,是45歲這批“老油條”

別不信!央國企裁員,最先安全的不是95后,是45歲這批“老油條”

職場資深秘書
2026-06-14 10:17:44
你無意中發現了不得的事?網友:大保健里遇見嫂子

你無意中發現了不得的事?網友:大保健里遇見嫂子

夜深愛雜談
2026-05-28 07:59:33
自我葬送的冠軍!三重致命崩盤,揭秘馬刺總決賽潰敗真正真相

自我葬送的冠軍!三重致命崩盤,揭秘馬刺總決賽潰敗真正真相

君馬體育
2026-06-14 13:55:54
18歲黃多多正式官宣出道,內娛小花們集體瑟瑟發抖!

18歲黃多多正式官宣出道,內娛小花們集體瑟瑟發抖!

玥來玥好講故事
2025-05-19 21:20:33
2026-06-14 16:11:00
AI進化論花生 incentive-icons
AI進化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發者
233文章數 121關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

蓋茨出軌20多次 愛潑斯坦曾鼓勵女醫生與其發展性關系

頭條要聞

蓋茨出軌20多次 愛潑斯坦曾鼓勵女醫生與其發展性關系

體育要聞

8年8隊奪冠,鄧肯那句話,現在還給了馬刺

娛樂要聞

鄧超攜子觀戰NBA,等等帥氣十足

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

綜合續航超1600km/零百加速4秒級 2027款星途ES預售18.99萬起

態度原創

本地
時尚
數碼
游戲
親子

本地新聞

AK劉彰邂逅河北南大港濕地

伊姐周六熱推:電視劇《南部檔案》;電視劇《意外調查組》......

數碼要聞

從3DGS到小藝Claw,華為智慧屏MateTV在HDC展示鴻蒙生態破界之力

內存漲價幅度已經達到700%!Xbox賣一臺虧幾百美刀

親子要聞

爸爸怎么不喜歡我了,太逗了

無障礙瀏覽 進入關懷版