AI范兒 · 教程實測? 20 分鐘
Codex、Claude Code 是當前最牛逼的 Agent 產品,但它們都被這個名字給耽誤了。
大家以為它們只是用來寫代碼的,其實它們是一個真正的智能體,能幫你做完除了寫代碼以外的很多事情。
所以用過 Codex 和 Claude Code 的人,幾乎就不會再去用類似于小龍蝦這樣的東西了。
今年以來 Codex 的熱度非常高,到目前為止已經有 500 多萬的周活躍用戶,而且其中有 20% 以上是非程序員,增長速度甚至是程序員的 3 倍。
我的群里有很多人經常在問 Codex 到底怎么用、怎么安裝。
目前好像確實沒有一篇非常詳細的、給小白用戶的教程,所以我決定來寫這么一篇。
01它到底是什么?
所以說它到底是什么?
大家都知道 ChatGPT 這樣的工具主要用來做問答,那如果你把它理解為你的“嘴替”,那么 Codex 就是你的“手替”。它可以真正幫你好完成一些任務,比如說:
ChatGPT 嘴替 · 只會跟你聊 你問它一個問題 ↓ 它給你一段話 ↓ 然后…… 還是你自己干 Codex 手替 · 替你動手干 你給它派個活 ↓ 它自己動手做 ↓ 做完告訴你 “搞定了,你看看”
▲ 圖:嘴替 vs 手替
1幫你寫個游戲、寫個 APP
2做個海報、寫個 PPT、畫個圖
3甚至還包括整理文件、整理數據等等
希望你能理解,它是一個智能體,比“小龍蝦 OpenClaw”、“Hermes” 還強大很多的智能體,它還能完整地操控你的電腦
它不只是用來寫代碼的,而且也能夠在手機端進行使用。當然,目前仍然是用來寫代碼的人多。
02Codex 的前世今生
很多人以為 Codex 在 Claude Code 出來之后,OpenAI 為了競爭推出的產品。
雖然它是今年才進入大部分人視野的,但其實這玩意在 2021 年就有了,當時它只是一個用來寫代碼的工具。
后來到了 GPT-4 出來之后,因為 GPT-4 本身寫代碼的能力就很強,所以當時OpenAI 就停掉了這個項目。
但讓人沒想到的是,這兩年 Claude Code 一騎絕塵,幾乎變成了所有程序員首選的編程工具。
這下可把 OpenAI 給急壞了,所以又把 Codex 重新撿了起來。
因為 Claude Code 已經非常強大了,所以 OpenAI 做的事情很簡單,就是全面復制 Claude Code。
其實這么做的還有一家公司,就是谷歌,他們推出了類似產品 antigravity,但真的很糟糕。
OpenAI 的追趕速度非常快,而且口碑也非常好,所以有大量的曾經用 Claude Code 的用戶,在很短的時間內都轉過來了。
而且相對來說,Claude 的這家公司還是比較傲嬌的,動不動就把用戶的賬號給封了,它不僅貴,而且額度限制真的很讓人抓狂。在這方面,Codex 就會好很多。
03怎么安裝
我們可以通過多種方式來使用 Codex,包括:
1使用 APP
2在你的 IDE 里面用
3使用命令行
4在瀏覽器里面使用
但我最推薦的還是使用它的 APP 了。
在下載之前還是得先說一下,使用它的前提是需要“魔法”和一個 ChatGPT 的賬號,然后才可以繼續。
現在不管是 Windows 還是 macOS,也不管是英特爾的 CPU還是蘋果的芯片,都有對應的版本。
所以首先,我們到這個地址去下載對應的版本:https://openai.com/zh-Hans-CN/codex/get-started/
我用的是 Mac,所以我整個演示也都是基于蘋果芯片的 macOS。
![]()
▲ 圖:下載 macOS 版本
所有的 ChatGPT 套餐都包含了 Codex。也就是說,Codex 的額度是在你的 ChatGPT 賬號里面的。
下載完成之后,我們可以用 ChatGPT 賬號來直接登錄,當然你也可以用 OpenAI 的 API 密鑰的方式來登錄。
![]()
▲ 圖:用 ChatGPT 賬號登錄
需要注意的是,如果您用 API 密鑰的方式登錄,有些功能是不能使用的,具體可以看官方文檔。
![]()
▲ 圖:OpenAI API 秘鑰方式登錄
成功登錄之后,我們就可以來使用 Codex 了。
04認識 Codex 的界面
如果你從來沒有用過 Codex,打開之后你發現挺懵逼的,因為它的界面不像 ChatGPT 一樣只有一個輸入框,它還多了蠻多東西。
所以在正式使用前,我覺得還是有必要先來熟悉一下它的整個界面。
![]()
右邊的對話區域,其實跟熟悉的ChatGPT 的界面基本類似。
重點在于左邊,左邊又分為上下兩個部分:
1上面這部分可以理解為功能所在的區域(功能區)
2下面就是我們所有的對話或者是項目記錄,都會在這里展示(對話歷史區)
然后在右側的頂部,我們還會發現有兩個按鈕。
我們先來看右邊最主要的對話區,也就是聊天框所在的這個區域。
![]()
這里跟 ChatGPT 這樣的聊天框很像,但是仔細看,它下面還多了一些選項。
首先我們可以在這里選擇模型的版本,比如是 GPT 5.5 還是 5.4,這個大家就很熟悉了,但這里還多了兩項:一個是推理,另外一個是速度。
![]()
所謂的“推理”,其實就是要告訴這個模型,在執行任務的時候應該思考多少。這里分了四個檔:低、中、高,還有超高檔。
簡單來說,推理程度越低就越快,消耗的 token 也會越少。但對于一些比較難、復雜問題,你可能需要很高的推理,這樣的話它用的時間會比較長,消耗的 token 也會比較多。
默認我們選擇“中”就可以了。如果你還不清楚到底該怎么選,其實官方有一張表格,你可以去參考一下。
檔位
適合什么場景
低
low
稍微想一下,速度和成本優先。比如數據分析、起草文字、執行類的編碼、客服對話
中
medium · 默認
質量和可靠性都要,任務需要規劃和判斷。大多數活默認選它,最均衡。比如寫代碼、做調研、處理表格和幻燈片
高
high
難題、復雜調試、深度規劃,質量比速度更重要。比如復雜的智能體任務、長線調研
超高
xhigh
要跑很久的深度任務,只在確實值得花這個時間和錢時才用。比如安全審查、代碼審查、更深的研究
▲ 表:推理檔位怎么選(據 OpenAI 官方文檔整理)
這里還有一個“速度”選項,它可以在不降智的情況下提高模型運行速度。
![]()
這很容易理解:通常情況下,速度越快代表思考越少,質量就會隨之下降。但如果你想又快又好,就可以選擇這個快速模式,代價是消耗的 token 會更多。
快速模式支持將模型速度提高 1.5 倍,目前支持這個模式的是 GPT-5.5 和 GPT-5.4。
它們的消耗情況如下:
![]()
好,左邊我們還看到會有一個選擇權限的功能。這還蠻顯眼的,因為這個 App 可以在你電腦上操作你的文件,那操作文件就意味著會有權限的問題。
那這個時候怎么處理這個權限呢?你可以選擇以下幾種模式:
![]()
▲ 圖:三種權限模式
我建議你可以選擇“替我審批”,這樣的話兩者就都兼顧了。
這里下面還有一個很關鍵的“進入項目工作”,這是啥意思呢?
就是在 Codex 里面,我們可以跟 ChatGPT 一樣直接對話,也可以基于某一個特定的項目。
比如你已經有了一個代碼庫,那你現在所有的操作都是基于這個代碼庫去改代碼,或者做其他事情。
當然也可以是其他項目,比如你做數據分析,你希望所有跟這個數據分析相關的事情都在這個項目里面操作。
你可以理解為,這個“項目”其實就是一個文件夾。在這個文件夾里面,你可以發起很多很多不同的對話。這其實就是幫我們組織對話的一種方式。
這個項目你可以添加,也可以利用現有的一個項目文件夾。比如說一個已經有的代碼庫。
理解了這一點之后,我們來看左側有兩個分類:一個是“項目”,一個是“對話”。
![]()
1項目:你所有的項目都會以文件夾的形式出現在這個分類里。
2對話:不在項目里的單獨對話,就會出現在“對話”分類中。
這其實和 ChatGPT 的對話記錄非常類似,每一個對話都會有一個單獨的 Session 出來。
講完這個,我們再來看左側上面那個部分。這里面有新對話、搜索、插件、自動化、Codex 移動版這幾個功能,我們可以把這里定義成“功能區”。
新對話很簡單,就是發起一個新的對話。搜索可以在你所有的對話歷史記錄中進行搜索。
插件這里非常重要。
OpenAI Codex 中有很多預置的插件,通過這些插件你可以做很多事情:操作你的電腦、用瀏覽器插件操控瀏覽器、進行產品設計和數據分析等。
這些功能都是以插件的方式呈現的,插件的存在大大擴展了 Codex 的能力。
用過小龍蝦的人都應該知道 Skills,沒有 Skills 小龍蝦就啥也干不了。 Codex 里面也可以使用 Skills,它也在那個插件的分類里面。
而且因為 Skills 是通用的標準,所以你在小龍蝦里面或者在 Claude Code 里面用 Skills,都可以直接在這里面安裝使用。
因為這個部分實在太重要了,所以后面我會單獨一節來寫。
這里還有一個自動化工具叫小龍插件,它可以自動化地幫你處理一些事務,比如每日簡報、每周回顧、項目監控。
![]()
最后一個是Codex 移動版,它可以把手機連接到這臺 Mac 上。這樣當你在外地的時候,就可以通過手機來遠程控制你的電腦,讓電腦幫你干活。
我想像這種操作你應該已經很熟悉了。
左下角這邊還有一個設置,你點擊之后可以看到你的剩余用量。
![]()
這里還會顯示 5 小時剩余多少、一周剩余多少。
當然,這里面還有最重要的是,你可以在設置里面對 Codex 做很全面的設置。
05小試牛刀:做一個網站
到這里,你可能已經蠢蠢欲動,想馬上用起來了。所以接下來我們就以一個具體案例,來展示一下 Codex 到底怎么用。
這個案例我們來設計一個虛擬的咖啡館網站:
1創建項目
首先我們要創建一個項目,因為這樣我們后面生成的所有文件都會在這個項目里。
![]()
2開啟計劃模式
這里記得,創建完項目之后不要馬上讓它開始干活,我們要先打開“計劃模式”。
![]()
為什么要打開這個模式呢?是因為我們要讓它先把所有的計劃列出來,等我們確認沒問題之后再去執行。
我們人類也是這么干活的。
3提交提示詞與確認
做好這兩步之后,就可以把提示詞丟給它了。
![]()
在接下來的過程中,它會不斷跟你確認一些東西,以彈窗的方式呈現,你只要做選擇就可以了。
![]()
4需求文檔與執行
確認到最后,它會把你理解的所有需求整理成一份文檔給你,這就是計劃模式最后呈現的結果。
如果你覺得沒問題,可以直接選擇按這個方案執行;如果有問題,也可以讓它修改。
![]()
在這個案例里,我就直接讓它執行了,接下來它就吭哧吭哧地幫我把這個咖啡館的網站給做出來了。
整個網站最后都會以 HTML 的方式呈現,我們可以直接點擊打開。因為 Codex 里面已經內置了一個瀏覽器,我們在右邊就可以看到這個預覽。
可以看到整個網站設計還是非常美觀且實用的,就像一個真實的網站一樣。我覺得它比大部分公司做的網站可能還要漂亮。
![]()
▲ 圖:做出來的咖啡館網站
但是有個問題:如果要修改怎么辦呢?
你可能會想到直接在對話框里面寫一堆的文字要求讓它改,但這是一種比較麻煩的方式。
因為有些東西你可能很難描述清楚,比如在哪個具體位置修改什么內容,很簡單的事情要寫成文字,反而會非常麻煩。
那么有沒有一種方式,能讓我們實現“指哪改哪”?
還真有。
可以看到在右上角有一個加號,點擊這個加號就可以進入評論模式。
在這個模式下,當我們在頁面上移動鼠標時,會發現這些元素一個個都拆開來了。
![]()
假設你要修改某個地方,直接點擊那里,就會彈出一個對話框。在這個框里,你就可以輸入評論,寫下你希望它如何修改的具體要求。
![]()
實際上這里有兩種方式:
1輸入評論,讓它直接改
2通過設置選項修改
如果只是簡單地改個字體、顏色,甚至改一段文本,你可以點擊左側的設置選項。這里會彈出一個菜單,讓你直接修改字體和顏色。
![]()
這真的太方便了!比如我在這里改個字體,改完之后直接能看到效果,點確認。注意,最后記得右上角的發送進行最終的修改。
如果你發現改了之后好像沒生效,那應該是緩存的問題。別忘了點一下左上角那個刷新的按鈕就可以了。
我相信用過的人一定會特別喜歡這個功能。
其實左上角還有一個截屏的按鈕,一點這個就直接把當前你看到的這部分截圖,這樣的話你就可以很方便地把你的設計分享給別人了。
![]()
可以說 Codex 的設計還是非常非常方便我們真正來進行一些實際工作的。
06技能與插件:讓它真正變強
如果只是寫一個簡單的頁面,那其實沒什么亮點,現在很多工具都能做。
但Codex 能做的遠不止這些,它能操控電腦、操控瀏覽器、處理大量文件和數據、做財務分析以及生成PPT啥的。
這些功能,就的通過插件和技能來實現了。
也正是因為這些,才讓 Codex 真正變得強大、能幫你干活,變成一個智能體,而不只是聊天機器人。
玩過小龍蝦的人,對技能(Skills)應該再熟悉不過了,我們可以把很多重復要做的事情寫成技能,下次直接調用就好了。
所以技能會包括指令、用到的資源以及還可能包含一些腳本。
Codex 的插件標簽進去之后會看到“插件”和“技能”兩個分類,進入到“技能”里面會看到這里有很多預置的技能可以使用。
![]()
可以在這里啟用或者禁用某個技能,也可以在這創建一個技能。
![]()
點“創建”-》“技能”,就可以創建一個技能了。
會看到它實際上會調用“Skill Creator”這個技能來創建技能,然后輸入我們需要相應的提示詞就好了。
比如我想創建一個生成公眾號封面圖的skill,我寫了這樣的提示詞:
創建一個技能,用來給一篇文章生成封面圖,要求21:9比例,不要有文字。
![]()
完了,它就會自動創建這個skills。
用的時候只需要在聊天框里面輸入/會能彈出所有的skills,我們選擇剛才創建的那個article cover Image。
![]()
▲ 圖:輸入 / 調用技能
實際上,我們很多時候也不需要這么麻煩,直接在聊天框里面說創建某個skill,它就會自動調用skill creator來創建。
用的時候很多時候,它也會根據上下文自動調用某個對應的skill。
插件比技能更復雜也更強大,它把技能、MCP服務、應用程序全部打包到一起了。
比如說做數據分析,可能要從Gmail、Google Drive里面讀數據,還要用到一些根據來做數據處理、生成報表,最后又可能要寫入某個地方,比如Notion。
插件會把這些根據都鏈接上,同時還提供了一堆相關的skills。我們看 CodeX 的數據分析插件,里面就可以發現它有 17 個應用和 15 個技能。
![]()
▲ 圖:數據分析插件,17 個應用 + 15 個技能
實際上今天 Codex 一口氣發布了 6 個這樣超強的插件包。除了數據分析,還包括:產品設計、創意制作、銷售、財務分析、投資。
![]()
在這些插件里面,比較重要的有這么幾個:
Computer Use
它是用來操控你的電腦,以及電腦里的任何程序的。
Chrome 插件
它是用來操控 Chrome 瀏覽器的。
辦公處理插件
包括處理電子表格以及 PPT 的插件。
比如說,我想用 Presentation 這個插件來生成一個介紹 Codex 的 PPT,那我就可以直接調用這個插件,然后提交相關的提示詞就可以了。
![]()
當然我們也可以把某個文檔(比如說一個 Word 文檔)用這個插件來轉成 PPT
07三個讓它「長出手腳」的功能
前面這些,說到底還都是它自己在屏幕里搗鼓。但真正讓我覺得這玩意兒不一樣的,是它能伸手到屏幕外面來。
有三個功能你一定要知道,我把它們理解成給 Codex 裝上了眼睛、手,和一根能隨時戳你的觸角。
給 Codex 裝上「眼睛、手、和觸角」 Computer Use 替你操作 電腦上的軟件 Appshots 一鍵把當前窗口 甩給它看 Chrome 插件 替你操作 瀏覽器
▲ 圖:三個伸到屏幕外的功能
Computer Use:它能直接動你的鼠標鍵盤
這是最科幻的一個。
裝上這個插件,Codex 就能看見你 Mac 上的畫面,然后像個真人一樣去點鼠標、敲鍵盤、操作軟件。
什么時候用得上它?那些沒法靠命令行、也沒現成插件搞定的活,就輪到它出馬了。
比如你讓它測一個正在做的 App、幫你點開某個軟件改設置、或者復現一個只在界面上才會出現的 bug。它會自己打開那個軟件,一步步點給你看。
當然,能動你的電腦這事兒,聽著就讓人有點緊張。
所以它做得很克制:每次要動某個軟件之前,都會先問你一句"我能用這個嗎"。你點同意它才動,也可以選"以后都允許"。任何時候你想喊停、想自己接管,隨時都行。
比如我通過 Computer Use 讓它給微信里面的某個人發條消息,它很快就會彈出這樣一個確認框。
![]()
有幾個它碰不了的紅線,反而讓我更放心:它不能替你輸系統密碼、不能批準那些安全和隱私的彈窗、也不能去自動化終端。
說白了,真正危險的那幾步,它沒權限替你做主。
提醒一句:目前這個功能只在 macOS 上有,而且歐洲、英國、瑞士暫時還用不了。
Appshots:一鍵把眼前的窗口甩給它
這個功能特別順手。
你正在某個軟件里忙活,突然想讓 Codex 搭把手,又懶得跟它解釋半天你在干嘛——按個快捷鍵(左右兩個?鍵),它就把你當前最前面那個窗口"咔"地截下來,連同里面能讀到的文字一起,發給 Codex。
比如我在瀏覽某個英文網頁,我想直接讓 Codex 幫我翻譯總結,我就可以直接按下 Command,然后讓 Codex 幫我總結。
![]()
你不用打一個字描述上下文,它直接就看到了你眼前的東西。然后你說"幫我看看這個",它就接著干。
當然我這里只是演示,一般你要翻譯的話,肯定不會這么操作。
這個功能更多是用于原來需要截圖處理的場景,比如:你看到一張圖,不知道是什么意思;或者說看到一個報錯,直接把這個報錯發給 AI 來處理。
以此類推,主要是針對這類場景。
Chrome 插件:讓它替你逛網頁
這個就好理解了,裝上它,Codex 就能操控你的 Chrome 瀏覽器——幫你翻網頁、點按鈕、填表單,干那些你平時在瀏覽器里點來點去的活。
不過這里有句話我必須替你叮囑:它操作的是你已經登錄的瀏覽器,也就是說它點的每一下,網站都當成是你本人在點。
所以讓它逛網頁的時候,你最好像自己親手在操作一樣盯著點,別讓它在你登錄的賬號里亂來。
如果你想一邊自己用瀏覽器、一邊讓它干活,可以讓它去開另一個瀏覽器,兩邊不打架。
08人在外面,也能遙控它干活
前面說的都是你坐在電腦前用。但有個場景特別戳我:人不在電腦前,怎么辦?
比如你出門吃個飯、散個步,腦子里突然冒出個想法,想立刻讓 Codex 開干。又或者你給它派了個要跑半天的活,出門在外想瞄一眼進度。
這時候,手機就派上用場了。
手機當遙控器,活還在家里那臺電腦上跑 你的手機 在外面下指令 隔空喊話 家里的電腦 真正干活的地方 文件、軟件都在這
▲ 圖:手機是遙控器,不是搬家
這里有個關鍵,你一定要搞清楚:手機只是個"遙控器",真正干活的還是你家里那臺電腦。
什么意思呢?你的文件、你裝的插件、你的項目,全都待在那臺電腦上,沒搬家。手機只是隔空喊一嗓子,告訴它"開干""繼續""這步同意"。活兒在電腦那頭跑,你在手機這頭看結果、下指令、點同意。
所以你在手機上能干的事不少:發起新任務、追加指令、回答它的提問、審批它要做的操作、甚至中途換個模型。就像你人雖然不在工位,但能隨時給同事發消息安排活。
養過蝦的朋友應該已經聞到了熟悉的味道,不過這里不能跟小龍蝦一樣接入微信、飛書什么的。
怎么連?記住幾個要點:
第一,配對要從電腦上的 Codex App 發起,CLI 和 IDE 插件里弄不了。如下面這個圖所示,選擇Codex功能區里面的“Codex 移動版”,然后“開始設置”:
![]()
接下來會問你是否允許你的設備控制這臺電腦,我們選允許就可以了
![]()
然后到手機端的機器里面點 Codex,然后按照步驟操作一下就可以了。
注意確保手機這頭用的是最新版的 ChatGPT App(iOS 或安卓都行),如果你在 App 里沒看到 Codex,先把 ChatGPT 更新一下。
![]()
現在我們就能在手機的 ChatGPT 里面看到電腦的 Codex 里面的內容了。
當然,如果需要這樣遠程操作。你家里那臺當"主機"的電腦,得一直開著、聯網、登著。
它要是關機了,你在外面自然就遙控不了它了。所以如果你想認真玩這個,最好專門留一臺一直開著的電腦當主機,比如一臺 Mac mini 扔在家里 24 小時待命。我到這里已經寫了很長的一篇文章了,你覺得我還有哪些功能,或是哪些內容需要補充進來?
09一些重要的設置
默認情況下,我們不需要做太多的設置,也可以很好地把 Codex 用起來。但如果你想提高一些效率的話,我建議有些設置你還是要去設置一下。
在“常規”里面有一個“跟進行為”,這是干嘛的呢?這就是說,在開發過程當中是否可以隨時發消息來調整任務。
這個地方我們建議選擇“引導”,不然的話,你只有等上一個任務完成之后才能做調整,那很麻煩。
![]()
▲ 圖:跟進行為選“引導”
然后在個性化設置里,我們可以設置自定義指令。這個地方主要告訴 Codex,你希望它怎么跟你協作,比如怎么改代碼、怎么解釋和輸出等等。
目前網上最流行的就是使用 Karpathy 的指南。這個指南現在在 GitHub 上面有 16 萬顆星,你直接復制過來就可以了。
地址:https://github.com/multica-ai/andrej-karpathy-skills
![]()
▲ 圖:把自定義指令填進去
最后一個就是類似于 小龍蝦 這樣的記憶功能。你打開的話,它就會從你的聊天當中生成記憶,并且可以帶入到下一個聊天里面去。
![]()
作為一般用戶,到這里你其實已經可以很好地把 Codex 用起來了。裝好、選個模型、把活兒派給它,剩下的就是動動嘴皮子。
但說實話,Codex 的功能遠不止這些。特別是如果你涉及開發,它還有一大堆高級玩法沒展開,我這篇是給普通人看的,就沒往深里挖。
等你上手熟了,想再往下鉆,可以去翻翻官方文檔:https://developers.openai.com/codex。那里面藏著更多狠貨。
寫到這兒才發現,不知不覺這篇已經拖得老長了。我坐在電腦前,也是花了大半天才把它碼完。
寫這么多,就一個念想:希望你看完能真的搞懂 Codex 是個什么玩意兒,更重要的是,能把它真正用起來。
你裝成功了嗎?或者卡在了哪一步?評論區聊聊。
覺得這篇有用,順手點個贊、點個在看,轉給那個總說“我不懂技術”的朋友。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.