Agent界不能沒有Coding Plan和Max x20訂閱,就像麻婆豆腐里不能沒有豆腐。
中轉API確實能省錢,但緩存失效之后9折沒了,額度虛標,速率跟不上,上下文被動縮水,這些苦我是一點也不想吃了。Claude的API我現(xiàn)在也沒什么招,老被封。GPT Pro現(xiàn)在也不敢斷,誰也不知道它會不會哪天也學一下友商,突然來個身份驗證。
所以這次我想測一個更具體的,
如果把國內模型API接進Codex App,它到底還能不能撐起一套真實可用的Agent工作流?
剛好,Codex團隊最近分享了如何把Codex用到極致的教程。
于是我跟上線兩個月,剛剛又上了新模型,之前也沒專門測過的階躍星辰Step Plan一拍即合,做了這次國內Codex玩法合集。
![]()
我最先關心兩個點。
接了API之后,還能不能用手機端連Codex?鎖屏狀態(tài)下呢?
答案是可以。
Codex最近更新的雙擊Command鍵,然后截屏整個屏幕的功能,API模式下還能不能用?
答案也是可以。
這兩個點解決了我最擔心的事情,API模式不是一個殘血版Codex,至少在我這次測試里,它還能保留Codex App關鍵的入口和交互。
Step Plan這次可以通過配置模型名step-router-v1,根據任務復雜度自動在deepseek-v4-pro和step-3.5-flash之間切換。v4-pro剛還宣布了繼續(xù)保持2.5折。四舍五入一下,這就有點像DeepSeek也出了一個Coding Plan。
對Coding Plan我的要求其實不高,
能隨時買到的,額度別虛標的,Max token別動不動卡到8K的,
上面這些缺點大家可以對號入座一把。。。
![]()
PS:deepseek-v4-pro和step-3.5-flash的模型綜合能力分,2603是step-3.5-flash的迭代版本
![]()
PS:deepseek-v4-pro和step-3.5-flash的價格排名
Step Plan里還塞了一個6B以下的image-edit-2模型,支持文生圖和圖像編輯。
這個我后面也順手測了一下。
把API接進Codex
先說最實用的部分。
我給大家做了一個腳本,它會自動引導你完成所有的配置,
./install_stepfun_codex_adapter.sh這個腳本主要做幾件事,
選擇訂閱類型,比如Plan或者普通訂閱,選擇對應模型;
檢查你的電腦是否已經安裝cc-switch和Codex,如果沒有,它會幫你裝好;
在cc-switch里把Step的API轉換成Codex需要的Responses API格式。
![]()
完成之后再打開Codex App,如果你在對話框右下角看到StepFun開頭,就說明Codex已經從GPT賬號登錄切換到了API模式。
![]()
接上API,Codex的功能還剩多少?
開頭我們已經測試了手機調用Codex App以及雙擊按鍵屏幕截圖的功能。
那下一步我們繼續(xù)跟著Codex團隊的思路,測了最近用得很多的瀏覽器自動化和電腦自動化。
這次我還故意加了一個坑,
我同時打開了兩個不同個人資料的賬號,這兩個賬號上都裝了Codex的瀏覽器插件。
在我的日常使用里,GPT-5.5有時候也會被這個場景迷惑到,不知道我要在哪個賬號發(fā)X。
從截圖里可以看到,一開始step-3.5-flash它確實被虛晃了一槍,后面它發(fā)現(xiàn)需要切換到另一個Profile,最后大概探索了3到4輪,完成了推特發(fā)布。
![]()
Computer Use當然也能做。
我讓它在飛書里給我的Hermes發(fā)一條消息,問問能不能操作Claude Code的文字信息。
這怎么不算一次性把御三家都用上呢?
![]()
這里也順手把Codex App里的幾個入口捋一下,
browser|適合在側邊欄里做網頁審查、閱讀網頁、標記頁面,
@chrome|適合那些需要瀏覽器登錄態(tài)的工作流,
@computer|適合處理只能在桌面GUI里點來點去的任務。
Step Plan里還帶了一個image-edit-2。
來都來了,我在測試API接入Codex之后,在計劃模式還能不能正常用的情況下,讓他給我開發(fā)了一個可以調用這個圖像模型的腳本。
![]()
我試了一下,讓6B以下模型生成一個大小字體的中文圖片,難度還是比較高的。
但我更多測試之后發(fā)現(xiàn),拿它來修改圖片里的文字,速度很快而且也很少改錯。
![]()
![]()
還有兩個我常用到的能力邊界也要講清楚。
在測試過程中,對話時自動壓縮上下文的能力是正常生效的。
目前比較明確沒有生效的是,因為是API登錄,不是賬號登錄,所以如果你想通過已經登錄到這個賬號上的設備做連接,比如用MacBook Pro去操作非局域網的Mac mini,就不能直接連,這個時候還是要走SSH。
![]()
Codex還有一個我很喜歡的交互就是任務跑一半的時候,可以進行任務干預。
這個干預分成兩種。
第一種是引導,
當你發(fā)現(xiàn)AI跑偏了,可以直接把它拉回來。比如我發(fā)送之后才臨時想起來,想在第一個模塊里加一些文字特效,就可以直接補進去。
第二種是排隊,
它不會打斷現(xiàn)在正在運行的任務,而是把新任務排在隊伍后面。
![]()
這也是順帶測了一下切換到DeepSeek V4 Pro后,模型做出來的網頁質量了。
除了上面這些功能測試,Codex團隊分享的自動化和目標設定(goal),也是我這次重點想測的地方。
自動化的成功率還是比較高的。在Codex里面,它很多時候是以一個提示語的方式存在。右側欄可以看到每次運行的成功率和失敗率,也可以主動觸發(fā)。
我這里直接搬了一個AI日報提示語,用之前開發(fā)的AI熱點伯樂Skill跑了一次。
跟自動化不同,
Goals是為了更長時間的Codex任務準備的。
你給它寫一個明確目標之后,AI會在一段時間內持續(xù)完成它。
如果你直接打Goal,Codex里沒有出現(xiàn)相關選項,可以先在終端里輸入:
Enabled feature `goals` in config.toml.等它起作用之后,重啟Codex App,就會看到一個叫設置目標的選項。
這就是我設計的一個目標,讓模型開發(fā)一個用于AI圖片展示的畫廊網頁。
![]()
BTW,目標本身是可以中途修改的。
當Codex能跑更長時間任務之后,我的下一個問題API版本的Codex還能保留記憶嗎?
Codex團隊在用Codex的時候打開共享記憶,也推薦我們把持久上下文存在Obsidian這樣的知識庫里。
我自己就是這么做的。
我的Hermes,OpenClaw,Claude Code和CodeX,它們的默認目錄就是Obsidian的vault。我會通過Agent.md來約束它們每次讀取文件的次數。這樣雖然我每次加載消耗的 token 會比直接在空目錄上面要多一些,但我能以最快的速度啟動我的任務。
這次我讓step-3.5-flash幫我查了一下,Obsidian里過去兩個月存下來的、跟Codex工作流相關的數據有哪些,它們的路徑分別在哪。
測試到這里的時候,我又發(fā)現(xiàn)了一個 API 版 Codex 缺失的功能,
Chronicle記憶組件,它能幫Codex從你最近屏幕上發(fā)生的事情中提取并構建記憶,但是換成API后,這個功能就關了。
![]()
最后又到了大家最關心的價格環(huán)節(jié),
Plan能不能長期用,最后還是要回到價格,額度和穩(wěn)定性。
這次我直接讓GPT用絕對精準、不忽悠、把事情拆得明明白白、不焦慮、不踩坑、特別直白、不要繞圈子的方式,給了一版對比。
![]()
我的感受是,這類測試Case很適合以后有新模型時繼續(xù)復用。
因為Codex現(xiàn)在的生態(tài)正在從一個編程Agent,逐步切換成一個通用Agent。
你在它上面測功能完整度,提示語適配度,瀏覽器能力,桌面能力,長期任務和記憶協(xié)作,基本能很快看出一個模型到底能不能放到Agent里用。
最后,也回答一下大家問得最多的問題:
我的主力Agent到底是Hermes、Codex,還是Claude Code?
我的選擇是,
都要,但分工不同。
Hermes更適合做我的IM入口和長期調度層。
我在手機上配置了快捷鍵,按一下就能打開飛書,飛書里對接Hermes。它適合長期任務,多群組多會話。所以它很適合做計劃,再通過tmux控制Codex或者子Agent派發(fā)出去執(zhí)行。
所以沒有必要在它們之間二選一。
買Coding Plan和訂閱Max20最大的爽點,
不就是可以盡情嘗試不同的Agent,
并保留各自好用的點嗎?
就像買手機殼一樣。
在預算允許的情況下,
我買它個四五種不同材質換著用,
豈不美滋滋。
@ 作者 / 卡爾
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發(fā)|評論
如果想要第一時間收到推送,不妨給我個星標
如果你有更有趣的玩法,歡迎在評論區(qū)聊聊
更多的內容正在不斷填坑中……
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.