網易首頁 > 網易號 > 正文申請入駐

Claude Fable 5最強深度實測！5個小時，我把想了很久的Mac App做出來了！

2026-06-10 16:11:21　來源: AI進化論花生

北京舉報

分享至

早上一覺醒來，Anthropic又又又發新模型了：Claude Fable 5。

Claude 5來了是挺好的，但是為什么特么又整出個Fable出來...Opus、Sonnet、Haiku這套名字還不夠煩人么。

以及，為啥也不叫Mythos？？A社在這個細節上還真是挺有硅谷大公司瞎特么起名的風范的。

不過，吐槽歸吐槽，這個模型確實夠強的。一句話說清它是什么：Fable 5，就是加了安全護欄的Mythos。Mythos是Anthropic那個之前只開放給政府和受邀機構、外界只聞其名的模型，這次加上護欄，公開發售了。

以及你最該知道的是：從現在到6月22日，Fable 5直接包含在Claude訂閱里，Pro和Max用戶免費用。6月23日起它會從訂閱額度里移除，想繼續用得另外充值、按量計費。想白嫖的話，只有這兩周窗口。

能力上看一張圖就夠了：

SWE-Bench Pro這個測試，是把真實開源項目里的bug丟給模型自己修。80.3%意思是十個真實bug它能獨立修好八個，第二名被甩開11個百分點。官方公告還反復強調一句：任務越長、越復雜，它的領先越大。最有畫面感的官方案例是Stripe：5000萬行Ruby代碼庫遷移，團隊原本評估要兩個月，Fable 5一天跑完。

這篇文章前一半把這個模型講清楚，后一半給你看一個別處看不到的實測：我用它把一個想了很久的App真的做了出來，從動手到打包好安裝包，一天。

我大概用了5個小時后的感受是：Fable 5寫代碼的穩定性比之前強了不少，只要你能把需求或者說你要解決的問題說清楚，基本上它就能給你一次性搞定。

Fable是什么來歷

今年4月，Anthropic啟動了一個叫Project Glasswing的項目，把Mythos開放給政府網絡防御部門和關鍵基礎設施提供方。只有受邀機構能用，外界只聞其名。

6月9日這次發布，其實是同時發了兩個模型：Claude Mythos 5和Claude Fable 5。兩者是同一個底層模型，區別只在安全分類器。這東西你可以理解成站在模型門口的安檢員，檢查進出的問題和回答，碰到生化武器、網絡攻擊這類危險話題直接攔下。Mythos 5安檢松，繼續只給受邀合作方；Fable 5安檢嚴，公開發售。官方的定義很直接：a Mythos-class model made safe for general use。

名字也是配套的：Mythos是希臘語的「神話」，Fable是拉丁語里的「寓言」，一個希臘語一個拉丁語，都是講故事。同一個故事，兩種講法，護欄的松緊直接寫進了產品名里。

設計邏輯我看懂了，但還是想吐槽一句：Haiku、Sonnet、Opus這套大中小，用戶好不容易才記住誰是誰，現在又冒出來Fable和Mythos兩個新名字，模型選擇器越來越像文學選修課。有情懷，但真沒必要。老老實實叫Claude 5，天塌不下來。

幾個指標順手列一下：上下文窗口1M token，單次輸出最高128K，思考模式強制開啟、關都關不掉。這個「關不掉」后面還會提到，它和我的使用體感直接相關。

貴不貴？說說我今天的真實用量

API價格是討論最多的地方：10/百萬輸入，10/百萬輸入，10/百萬輸入，50/百萬輸出，正好是Opus 4.8的兩倍。目前在Claude Code中的消耗速度也會是Opus模型的2倍。

說說我自己的情況：我今天9點起床之后，一直同步在做2-3個項目，全程Fable 5，200美元的Max版本到現在沒遇到限制。

不過有個前提，Anthropic在發布模型的時候把用量reset了一波，相當于給所有人發了張新卡。希望OpenAI趕緊特么參與競爭，讓這種reset來得更猛一些。

至于6月23號之后，如果真按API價格收費的話，那確實會有點太貴了。所以我的態度是：這兩周先往死里用，23號之后的事23號再說。

我手上正好壓著一個想了很久的項目

模型講完了。對我來說，判斷一個模型好不好，標準只有一個：能不能把我想做的東西真的做出來。

事情是這樣的：我從來不會寫代碼，所有產品都是AI寫的。這種工作方式有個很具體的副作用：AI幫你一個下午起十個項目，但它們散落在各個文件夾里，名字認不出，agent改了什么也看不見。

具體到每天的場景，我的需求其實很樸素：agent起好的項目，我想輕松點開看；寫作類的項目很多，稿子要反復改，我需要一個順手的編輯器；繪圖和設計類的任務，我得一張張查看agent的生成結果；agent做出來的東西出問題、不符合我預期的時候，我希望能更容易地截圖、把參考文件拖進去投喂給它。

這些事沒有一件是寫代碼，但每一件都卡在文件系統和agent中間：Finder看得見文件、不好喂agent，終端喂得了agent、看不見文件。所以我的日常就是在Finder、Cursor、瀏覽器三個窗口之間來回切，找一個昨天生成的文件要翻半天。

我一直想要的，是文件系統和agent之間有真正的聯動：左邊瀏覽和預覽本機文件，右邊一個真的終端跑coding agent，agent每改一個文件，左邊當場亮起來。一個vibe coding的駕駛艙。

之前搭過一個網頁版的雛形，一個本地文件瀏覽頁，能搜能預覽，僅此而已。真正想要的部分全卡在后面：內嵌真終端、文件監聽、編輯器、打包簽名，這是一個完整桌面App的工程量。以前不是做不了，主要是改起來太磨人，我提一個需求要來回拉扯很多輪，想想就先放下了。

Fable 5發布當天，我決定拿它試試。

一天，從想法到安裝包

時間線是這樣的：

6月9日下午我先拿Opus 4.8做了個基礎的版本。Electron桌面殼、內嵌終端、文件×終端×預覽三方聯動。但是有些核心的體驗一直沒跑通。

6月10日早上，拿到Fable后開啟大改：代碼編輯器、Markdown所見即所得、圖片標注編輯、整個布局重構。然后打包、簽名，生成dmg安裝包。

中間沒有跳過驗收。我給這個項目定的交付標準是：5個獨立的AI subagent分別扮演重度vibe coder、原生審美設計師、零文檔新用戶、終端十年老兵、破壞性質量官，對著成品、真機截圖和代碼打分，全部≥90分且無紅線才算達標。第一輪就被打回來了：審美踩紅線、終端健壯性不夠、數據安全有口子。修完再審，總共折騰了四輪，才算過關。

它不是demo，也不是原型。它裝在我的Applications文件夾里，我寫這篇文章的此刻，它就開著。

右下角終端里掛著的，正好是Fable 5的上線通知。

翻箱FanBox：它長什么樣

App叫翻箱，英文名FanBox。你也可以把它讀成一個agent box：一個更好地管理agent和文件系統的工具，把「找文件 → 跑agent → 看它改了什么」收進一個窗口。

設計目標是每種文件「長得像它自己」，不點開就知道是什么。

幾個我自己最常用的能力：

活的儀表盤。agent每寫一個文件，那張文件卡片當場蕩開漣漪、按改動頻率發光。多個項目并行跑agent的時候，agent寫到哪，光就走到哪，「看AI干活」第一次有了現場感。

會話回放。變更面板里有個播放鍵，像刷視頻一樣拖時間軸，重現這段時間agent一步步改了哪些文件。agent跑了半小時長任務，回來拖一遍就知道它都干了什么。

拖文件喂agent。從文件列表把文件或文件夾拖進終端，路徑自動插進輸入行；在預覽里選中一段文字，點一下就發到終端給agent當上下文。反過來，終端里出現的文件路徑可以直接點擊，在翻箱里打開。

?K找回。記得名字片段就能搜到文件和文件夾，文件夾卡片右上角自動標上node/web/py這些項目類型徽章，一下午起的十個項目一眼認出來。

原地輕改。代碼和JSON用Monaco（VS Code同款內核），Markdown是Notion式所見即所得，圖片可以直接標注、畫箭頭、打碼。看到哪改到哪，不用再開一個編輯器。

這篇文章就是在翻箱里寫的，左邊預覽草稿，右邊終端掛著Claude Code：

下面這張是我自己堆滿截圖和錄屏的桌面，不開啟終端agent窗口的情況下和finder沒太大區別：

agent剛在一個文件夾里改了兩處，那張卡片就這樣亮起來：

順便，它有三套皮膚，配色、字體、圖標、代碼高亮整體切換：熒光綠炭黑的終端風、奶油紙赤陶橙的檔案風、黑白紅的索引風。

我自己對這個產品定義的邊界是：翻箱不跟Finder拼文件管理，不做插件不做調試，重活繼續甩給IDE。它只把「找回 + 預覽 + 輕改 + 指揮agent」這一條鏈路做到順手。全部本地運行，零外網請求，數據不出本機。

不過呢，它現在還是個挺初級的版本，主要解決我自己的問題，審美和功能都按我自己的需要來，沒打算討好誰。我估計很長一段時間，它都會是我的一個簡單的個人項目。

開發過程里，Fable 5給我的真實體感

回到模型本身。這次開發前一天用Opus 4.8打底，后一天用Fable 5大改，同一個項目前后腳換了兩代模型，差別很具體：不是更快，是犯錯更少，一次就把問題解決。

舉個最典型的例子。翻箱的圖片縮略圖功能，初版在圖多的文件夾里點擊會卡好幾秒。這種性能問題以前是最磨人的：模型猜一個原因，改一版，好一點但沒解決，再猜再改，三四輪下來代碼越來越亂。

這次我就描述了一句「圖多的目錄點擊很卡」。它定位出來兩個疊加的根因：縮略圖在加載原圖整個文件，以及每次點擊都在重建整個文件網格。然后一次改完：加了一個帶緩存的縮略圖接口，點擊改成只切換選中樣式不重建。點擊響應降到0.1秒內，肉眼無感。一輪，沒有返工。

類似的還有終端里中文目錄名亂碼的問題。這涉及xterm.js的寬字符處理，挺冷門的。它直接指出要用unicode11這個addon，還提醒這是個實驗性API需要顯式開啟。這種準確命中偏門問題的瞬間，一天里出現了很多次。

打包階段更明顯。Electron打包在國內網絡環境下是個連環坑：二進制下載被擋、原生模塊編譯失敗、新版node讓構建工具直接掛掉。以前這種環境問題能耗掉一晚上，這次它一路換鏡像、換編譯方案、調整打包配置，把一串坑都繞過去了，我全程只負責看著。

為什么會這樣？我猜答案就藏在前面那個「關不掉」里。Fable 5的思考模式是強制開啟的，單個回復明顯比Opus要等得久。慢和準很可能是同一枚硬幣的兩面：動手之前想得久，猜錯率就低，猜錯率低，就不用返工。它省掉的不是打字時間，是返工。

說句誠實的：我沒拿同一個問題去喂舊模型做對照實驗，上面這些是體感對比，不是同題實測。但「以前五輪拉鋸、現在一輪解決」這種差別，大到不需要儀器。

后來我看到Claude Code的作者Boris Cherny對Fable 5的評價：「自Opus 4.5以來最大的一步」，他強調的也是判斷力和debug能力。跟我的體感，完全對上了。

最后

翻箱的安裝包已經打好了，并且，已開源發布，你也可以拿我的開源代碼去改出一個更適合你自己的agent box來

https://github.com/alchaincyf/fanbox

至于Fable 5，我的建議很簡單：如果你是Pro或Max訂閱用戶，6月23日之前，在Claude Code里把模型切到Fable 5，拿一個你一直想做但覺得「太麻煩」的項目喂給它。免費額度你也有，我做翻箱用的就是它。

還沒上手過Claude Code的，可以從我的橙皮書《Claude Code: 從入門到精通》開始，微信讀書就能看。

我想了很久的駕駛艙，從拿到Fable 5到完成MacOS應用打包，5個小時。

你那個擱置很久的項目，說不定也就差一個這樣的周末。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.