![]()
Codex做了一次很大的更新,從一個(gè)代碼編寫工具變成了能操作電腦的助手。
官方用了一句很夸張的話作為宣傳:“Codex for (almost) everything.”
簡(jiǎn)單地說,過去的Codex作為編碼工具,邊界一直還算清晰:你提出需求,它生成代碼。
但這次更新之后,這個(gè)邊界被狠狠擴(kuò)展了。
它開始操作你的電腦,使用應(yīng)用,在不同工具之間來回切換;它可以把任務(wù)留到幾天之后再繼續(xù),也能根據(jù)你過去的習(xí)慣,給出下一步該做什么的建議。
這些能力拼在一起,讓Codex有了龍蝦(OpenClaw)的既視感。
它開始“工作”了。
![]()
01
從寫代碼到“動(dòng)手干活”
這次更新最核心的亮點(diǎn)是,Codex開始直接操作電腦了。
按官方的說法,Codex現(xiàn)在可以通過“看到屏幕、點(diǎn)擊鼠標(biāo)、輸入鍵盤”的方式,直接使用你電腦上的應(yīng)用。它會(huì)用自己的光標(biāo),在界面上完成操作,而不是調(diào)用API接口。
可以這么理解:過去AI通常依賴API接口來完成工作,一旦遇到?jīng)]有接口的工具,比如設(shè)計(jì)軟件、本地應(yīng)用、內(nèi)部系統(tǒng)等等,它的能力就會(huì)受限。
但現(xiàn)在,它可以繞過這些限制,直接在界面上動(dòng)手。
而且這種操作并不會(huì)打斷你當(dāng)前的工作,多個(gè)Agent可以在后臺(tái)并行運(yùn)行,在不同應(yīng)用之間切換,用戶依然可以正常使用電腦。
這個(gè)功能目前在macOS搶先上線,其它系統(tǒng)還需要再等待一段時(shí)間。
![]()
除此之外,這一版本的Codex開始直接接入網(wǎng)頁。
桌面應(yīng)用內(nèi)置了瀏覽器,你可以在頁面上圈出某個(gè)按鈕、某一段區(qū)域,甚至直接寫下評(píng)論,把“位置”本身變成指令,讓它據(jù)此修改界面、調(diào)整邏輯或檢查問題。
這個(gè)功能對(duì)前端設(shè)計(jì)和游戲開發(fā)非常有用,如果原本是用Codex生成的代碼,在生成的界面上直接標(biāo)注就好。
官方文檔顯示,他們計(jì)劃隨著時(shí)間推移擴(kuò)展這一功能,使Codex能更完整地控制瀏覽器,不再局限于本地運(yùn)行的網(wǎng)頁應(yīng)用。
同時(shí)還添加了原生的圖像生成功能:Codex現(xiàn)在可以使用gpt-image-1.5生成和迭代圖像,用于產(chǎn)品設(shè)計(jì)、界面草圖或游戲素材,不需要額外接API。
![]()
圍繞開發(fā)流程本身,這次更新把很多原本分散的環(huán)節(jié)也補(bǔ)上了,例如可以處理GitHub的評(píng)審評(píng)論;打開多個(gè)終端標(biāo)簽;通過SSH連接遠(yuǎn)程開發(fā)環(huán)境;在側(cè)邊欄直接預(yù)覽PDF、表格和文檔。
還有一個(gè)匯總面板,可以看到當(dāng)前在做什么、用了哪些信息、產(chǎn)出了什么結(jié)果。
這些能力并不完全是從零開始的新功能,只是以前零散存在,現(xiàn)在被放進(jìn)了Codex的整個(gè)開發(fā)流程里。
Codex還擴(kuò)展了插件和工具集成,接入了90多個(gè)插件,包括JIRA、GitLab、Microsoft套件等等。
任務(wù)開始跨工具流動(dòng),而不是停在某一個(gè)應(yīng)用里。你可以一句話讓它同時(shí)查Slack、Gmail、Notion,再給你一個(gè)需要處理的事情列表。
![]()
還有一個(gè)很關(guān)鍵的升級(jí)是,Codex現(xiàn)在可以把任務(wù)“留到以后再做”。
它可以復(fù)用已有的上下文,在未來某個(gè)時(shí)間點(diǎn)自動(dòng)繼續(xù)執(zhí)行任務(wù),整個(gè)過程可以跨越幾天甚至幾周。
也就是說,之前已經(jīng)完成的整理、討論過的問題,以及還沒做完的工作,都不會(huì)被丟掉。它們可以被帶入下一步,成為后續(xù)任務(wù)的一部分。
與此同時(shí),記憶能力也開始生效。Codex會(huì)記錄你的偏好、修改習(xí)慣以及已經(jīng)整理過的信息,讓后續(xù)任務(wù)在不需要反復(fù)說明的情況下繼續(xù)推進(jìn),并逐漸貼合你的工作方式。
當(dāng)它掌握了足夠的上下文之后,Codex就可以從不同工具中提取信息,識(shí)別出需要處理的評(píng)論或任務(wù),整理出一份有優(yōu)先級(jí)的行動(dòng)建議,告訴你應(yīng)該從哪里開始繼續(xù)一個(gè)項(xiàng)目。
![]()
02
不只是功能升級(jí)
上面羅列的很多功能乍一看可能互不搭嘎,但它們指向了同一個(gè)變化:工作流。
過去,Codex存在于某一個(gè)具體環(huán)節(jié)里,寫代碼、改代碼、解釋代碼。你需要在不同工具之間來回切換,把任務(wù)拆成一段一段再交給它完成。
但現(xiàn)在這些事情開始連在一起了:它可以在應(yīng)用里執(zhí)行操作,在網(wǎng)頁中獲取信息,在終端里運(yùn)行命令,再把結(jié)果帶回到代碼里;它也可以把這些步驟延續(xù)下去,在幾天之后繼續(xù)推進(jìn)同一個(gè)任務(wù)。
可以說,原本分散在不同工具、不同時(shí)間里的工作,開始被串成一條連續(xù)的流程,被收在了一個(gè)系統(tǒng)里。
原生的Mac集成,讓Codex可以操作你的電腦,在本地環(huán)境中操作應(yīng)用、協(xié)調(diào)任務(wù),并在不同工具之間流轉(zhuǎn)信息。
它沒有取代原本的應(yīng)用,但開始在這些應(yīng)用之間流動(dòng),把任務(wù)從一個(gè)地方帶到另一個(gè)地方。
這也是為什么有人會(huì)認(rèn)為,Codex正在變成知識(shí)工作的”操作系統(tǒng)“。
![]()
另外,相比接入更多應(yīng)用,有人認(rèn)為記憶能力可能才是這次更新的關(guān)鍵。
因?yàn)橐坏〢I開始理解你的工作方式,并在后續(xù)任務(wù)中復(fù)用這些信息,它會(huì)逐漸貼合你的習(xí)慣,讓你用得越來越順手。
這確實(shí)指向了一個(gè)趨勢(shì):未來的AI競(jìng)爭(zhēng),可能不只是模型能力本身,還是誰能更深入地嵌入你的工作流程,并持續(xù)理解你是如何完成工作的。
![]()
03
“超級(jí)應(yīng)用”
說到深入工作流的能力,很多人可能會(huì)覺得和OpenClaw很相似,兩者的方向確實(shí)一致,都是讓AI去完成任務(wù),而不是只回答問題。
不同的地方在于,OpenClaw更偏“調(diào)用工具”,通過接口把流程串起來;而Codex這次更新把AI放進(jìn)了系統(tǒng)內(nèi)部,讓它直接操作應(yīng)用。
所以會(huì)說它是“龍蝦”上身——把這套邏輯并入系統(tǒng)里,可不是上身么。
這種相似或許和Peter Steinberger(OpenClaw創(chuàng)始人)加入OpenAI有點(diǎn)關(guān)系,不過更可能的情況是OpenAI本身就想做生態(tài)整合,做一個(gè)能搞定所有事情的“超級(jí)應(yīng)用”(super app)。
據(jù)OpenAI官方統(tǒng)計(jì),Codex現(xiàn)在每周有超過300萬用戶,其中有近一半的使用是非編碼任務(wù)。它的使用場(chǎng)景已經(jīng)不再局限于代碼,這次的更新可能就是OpenAI想做“超級(jí)應(yīng)用”的第一步。
從上線節(jié)奏來看,這次更新也在分階段推進(jìn):桌面控制的功能目前只在macOS上推出;記憶和上下文感知建議的功能先開放給美國用戶,歐盟、英國、教育版、企業(yè)版稍后。
能力還在鋪開,但方向已經(jīng)很明確了:Codex正在從一個(gè)寫代碼的工具,變成一個(gè)可以跨應(yīng)用、跨時(shí)間持續(xù)完成任務(wù)的系統(tǒng)。
這條路也不只是OpenAI在走,幾乎是同一時(shí)間,Perplexity AI也發(fā)布了名為“Personal Computer”的Mac桌面應(yīng)用,同樣在嘗試把本地文件、原生應(yīng)用和瀏覽器操作整合在一起,讓AI可以在一個(gè)統(tǒng)一環(huán)境中執(zhí)行任務(wù)。順便一提,最近更新的Claude Opus 4.7已成為Personal Computer的默認(rèn)協(xié)作(orchestration)模型。
而Anthropic,他們的產(chǎn)品本身已經(jīng)具備較強(qiáng)的Agent能力,可以調(diào)用工具、執(zhí)行多步任務(wù),但更多集中在開發(fā)環(huán)境和工具調(diào)用層面,暫時(shí)還沒有形成一個(gè)直接操作桌面應(yīng)用的統(tǒng)一系統(tǒng)。
國內(nèi)的趨勢(shì)也大致相同:幾乎所有大廠都在布局類似OpenClaw的Agent體系,同時(shí)也開始嘗試讓AI直接操作本地環(huán)境、執(zhí)行任務(wù)。
說白了,目標(biāo)都是讓AI不再停留在對(duì)話里,能夠進(jìn)入實(shí)際的工作環(huán)境。
從聊天到寫代碼,到操作應(yīng)用,再到跨時(shí)間推進(jìn)工作,當(dāng)AI開始“動(dòng)手”,工作方式就發(fā)生了變化。
“龍蝦”上身的Codex,只是其中一步。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.