6月17日,X 上 OpenAI Codex 團隊負責人 Tibo(@thsottiaux)發了一條推文,提醒大家 Codex App、CLI 和 SDK 現在可以接任何開源模型,不只限于 OpenAI 自己的模型。他還直接貼了官方配置文檔的鏈接,指向 OSS 模式和本地 provider 的部分。看到這條消息的時候,我第一反應其實挺意外的,因為 OpenAI 長期以來給人的印象一直是比較封閉,這次突然把自定義模型供應商的門打開,確實有點不一樣。
主要是,Codex 并不一個普通的工具,它本質上是一個完整的工作臺,能讓模型讀文件、寫文件、調用 shell、抓取網頁、執行命令,還能根據工具返回的結果繼續推理判斷,最后輸出可交付的成果。也就是說在 Codex 里,模型不光要會說話,更重要的是得真能干活。
![]()
(圖源:X)
過去很多人吐槽 OpenAI 封閉,其實不光是因為模型不開源,更核心的原因是它的工具、模型和工作流都被整個包在自家體系里,你可以用,但很難拆開重組。尤其是 Codex 這種 Agent 工具,本質上是模型能力、工具調用、上下文管理、權限控制和本地環境的組合。也就是模型越強,工作臺越完整,用戶就越不容易離開。現在 OpenAI 給 Codex 留出了 custom model provider 入口,至少在產品姿態上不再只把 Codex 死死綁定在自家模型上。
但你以為 OpenAI 真的突然就徹底放開了嗎?雷科技(ID:leitech)實測下來發現,根本就沒有這么簡單。
填個 Key 就想用第三方模型?沒這么簡單
這次最容易被誤讀的地方,其實就是“Codex 支持第三方模型”這句話。很多人看到這里,第一反應會是既然 DeepSeek、Qwen、Kimi 這些模型都提供 API,有些還號稱兼容 OpenAI API,那我把接口地址和 API Key 填進 Codex,是不是就能直接用了?我們一開始也是這么測的。Codex 的官方高級配置文檔里確實寫到了自定義模型供應商,簡單說一個 provider 可以定義 Codex 連接模型的方式,包括接口地址、協議類型、鑒權方式和一些附加請求信息。你可以在配置文件里新增一個模型供應商,再讓 Codex 指向它。
但我們第一次嘗試接入 DeepSeek V4 Pro 的 API,卻失敗了。
翻閱官方技術文檔之后,答案很明顯了,那就是 Codex 確實開放了,但只開放了一半,是有條件地開放。文檔里寫得很清楚,當前自定義供應商公開支持的協議只有 Responses API 這一種,省略不填時它也是默認協議。簡單來說,Codex 允許你換模型供應商,但它當前公開配置路徑吃的是 Responses API 這套協議,模型供應商能不能進來,不只看它有沒有 API,還要看它能不能給 Codex 提供它要的 Responses 形態。
![]()
(圖源:雷科技制圖)
DeepSeek 官方 API 主入口是 Chat Completions,它可以用 OpenAI SDK 調用,模型也能正常填 DeepSeek V4 Pro,對很多聊天應用、普通 API 調用、OpenAI SDK 兼容場景來說,這都沒問題,但 Codex 不是這么請求的。我們嘗試讓 Codex 直連 DeepSeek,模型填 DeepSeek V4 Pro,鑒權也走 DeepSeek 的 Key,啟動之后 Codex 實際去找的是 DeepSeek 官方并不存在的 Responses 接口,結果返回 404。
其實就是DeepSeek 官方的 OpenAI 格式入口并沒有提供 Codex 當前要訪問的 Responses API 端點。
同樣叫“兼容 OpenAI”,里面也分很多層。Chat Completions 是一套接口,Responses API 是另一套接口。普通聊天、工具調用、流式輸出、推理塊、函數調用結果回傳,在不同協議里結構并不完全一樣。對用戶來說這些差別都藏在配置后面,對 Codex 這種 Agent 工作臺來說,它們會直接決定任務能不能跑起來。
真正的轉機來自 DeepSeek 的另一個入口,也就是 Anthropic API 兼容端點。DeepSeek 官方文檔里除了常見的 OpenAI 格式入口,還提供了 Anthropic 格式入口,后者更適合承載工具調用、工具返回結果這類 Agent 場景需要的結構,和 Codex 的工作方式更接近。我們最后跑通的路徑,不是讓 Codex 直接訪問 DeepSeek,而是在本機加了一層輕量“翻譯器”。Codex 仍然按自己熟悉的方式發起任務,這個翻譯器再把請求轉成 DeepSeek 能理解的格式,DeepSeek 返回后,再翻譯回 Codex 可以繼續執行工具的形態。
![]()
(圖源:雷科技制圖)
更直接地說,目前大家期待的 DeepSeek、Mimo、Kimi、智譜 GLM,目前都沒有辦法直接拿 API Key 去接入到 Codex,只能用轉接橋,和之前流行的 CC Swich 方案差不太多。當然,非要嘗嘗「直接」也不是不行,阿里百煉大模型目前提供了Responses 接口,價格嘛,200 元/月,有剛需的小伙伴們可以試試。
Deepseek驅動的Codex,體驗真的好嗎?
跑通配置之后,我們選擇讓 DeepSeek + Codex 去一些更符合雷科技日常的任務,其實主要就是看看第三方開源模型和 Codex 結合,會不會水土不服。
第一個任務是全網搜索雷科技相關資料,結合官網介紹、文章、特色報道,比如 MWC、IFA、AWE 等展會報道,做一份雷科技的商務招商文檔,輸出成 Markdown 文件。這個任務看起來像寫稿,其實包含好幾個 Agent 能力點。它要先找資料,找不到搜索工具時要能換策略。拿到網頁后要能提取有用信息,信息不能只堆在一起,還要按招商文檔的結構重新組織,最后它還要把結果寫成本地 Markdown 文件。
![]()
(圖源:雷科技制圖)
DeepSeek V4 Pro 一開始嘗試的時候內置網頁搜索工具不可用,網頁搜索的能力也不順暢,它直接換了一個方式,從本地終端直接抓取雷科技官網的一手頁面,包括首頁、關于我們、聯系我們、歷史專題列表、MWC26 專題、MWC26 凱旋報道、AWE2026 專題等。最后它生成了一份 320 行的 Markdown 文檔。內容上它整理出了雷科技的品牌定位、媒體矩陣、用戶畫像、內容欄目、核心數據、展會報道能力、視頻化分發、商務合作模式、合作案例和聯系方式。
![]()
(圖源:雷科技制圖)
雖然頁面比較粗糙,但是還是能用的。
第二個任務更進一步,讀取上一步生成的招商文檔,再做一份雷科技 2026 年度招商報告 PPT,輸出成 HTML 格式。這一步測試的是連續任務能力。如果第一步只是從網頁到 Markdown,第二步就是從已有文檔到結構化展示。模型需要理解上一步文件里的 9 個章節,再把它們改造成 10 頁 slide,包括封面、關于雷科技、媒體矩陣、內容體系、核心數據、全球展會、視頻戰略、商務合作、合作案例、聯系我們。
![]()
(圖源:雷科技制圖)
最終輸出是一個單文件 HTML,約 790 行,接近 40KB,里面包含暗色科技風主題、藍紫強調色、滾動觸發動畫、右側圓點導航、鍵盤上下翻頁、響應式布局和打印導出 PDF 支持。這不是精修設計稿,但已經是一個可打開、可預覽、可繼續修改的交付物。從完成度看,DeepSeek 在這組輕量任務里是能用的。它的強項很明顯,資料整理速度快,長文檔組織能力不錯,遇到工具不可用時會嘗試繞路,生成 Markdown 和 HTML 這類文本型文件比較順。對于“寫一份介紹”“整理一份資料”“根據文檔生成展示頁”這類任務,它已經可以承擔初稿生產。
![]()
(圖源:雷科技制圖)
但體驗上,它還不像官方模型那樣成熟。Codex + GPT 5.5 所有能力都在同一個生態里,模型、工具調用、上下文、視覺能力等都能順利調用。但 Deepseek 在 Codex 里跑的鏈路很長,中間還經過了一層轉接橋,速度自然是比不上「官配」組合的。
所以在響應速度上,DeepSeek 在簡單文本和資料整理任務里沒有慢到不能用,但確實不如官方模型來得快。尤其進入 Codex 這種 Agent 工作流之后,它不是一次性回答完,而是要一邊調用工具,一邊等待結果,一邊繼續推理。鏈路多了一層本地翻譯,工具調用也要來回跑,速度體感自然會慢一些。
消耗上,這次體感就很直接了,我們給 DeepSeek 賬戶充了 10 塊錢,跑完這兩個任務,中間還夾著幾輪聊天和調試,最后余額還剩 9.27 元。也就是說這一整輪輕量實測實際只花掉了 7 毛多。DeepSeek 真不愧是性價比之王,假如全都是這類型的任務,那確實可以拋棄 ChatGPT Plus 每月 20 美元的訂閱費了。
這波要讓智譜和 DeepSeek們贏麻?
體驗下來,對于多數普通用戶而言,Codex 能不能搞第三方模型,意義其實沒有那么大,假如只想要簡單、絲滑的體驗,那么開通個 Plus 會員性價比也不低,畢竟它是和 ChatGPT 打包在一起的。
真正有利的,是那些開源模型。
過去國產和開源模型想進入開發者真實工作流,需要自己做很多產品層能力。一個模型發布 API 只是第一步,后面還有 IDE 插件、命令行工具、文件權限、工具調用、項目上下文、任務記憶、錯誤恢復、協作界面、審閱流程,這些東西不是模型論文能解決的。
Codex 這類工具的價值,是它把工作臺先搭好了。它負責和本地文件系統交互,負責執行命令,負責展示工具調用,負責把任務拆成多輪,負責讓模型在上下文里持續工作。第三方模型一旦能接進去,就相當于直接獲得了一個成熟 Agent 容器。這對智譜、DeepSeek、Qwen、Kimi 們都是機會。
![]()
(圖源:雷科技制圖)
比如智譜,智譜最近上線了 GLM-5.2,直接強調 1M 無損上下文、長程任務能力提升,Coding 與長程任務評測達到開源 SOTA,在復雜系統工程、深度調試里表現更穩。過去幾天,開發者圈對這個模型的評價很高,很多人夸它在代碼任務和長程 Agent 場景里的性能非常強。更有意思的是,智譜的 GLM Coding Plan 也開始變成一種稀缺資源,因為太火爆,不少人搶不到,但這其實已經說明國產模型的競爭不再只是發布一個強模型,而是開始圍繞 Coding Plan、開發工具接入、Agent 工作流額度和真實工程體驗展開。
![]()
(圖源:智譜)
當然,智譜并不是沒有自己的 Agent 工具。它也在做類似 Codex 的圖形化 Agent 工作臺,用戶可以在里面交給模型代碼任務、長程任務和工程任務。問題在于,對模型廠商來說,自建工作臺和接入 Codex 這類成熟工作臺并不沖突。自家工具更適合展示完整能力和打磨閉環體驗;接入 Codex,則更像進入一個已經被大量開發者熟悉的工作環境。用戶原本就在 Codex 里寫代碼、跑命令、讀項目、交付文件,如果國產模型能出現在同一個任務流里,被使用和被比較的機會都會變多。
在 OpenAI 釋出消息后,智譜的股價一路飆升,今天盤中一度大漲超 22%,股價突破 2000 港元大關,市值也站上新高,創下近期新紀錄,這已經很能說明問題。
![]()
(圖源:雅虎財經)
不過,OpenAI 也有自己的考量,Codex 開放 provider 并不意味著 OpenAI 放棄了控制權。恰恰相反,工作臺標準仍然由它定義。Responses API、模型配置、官方推薦模型、工具調用協議、權限機制,這些關鍵環節仍然圍繞 OpenAI 的體系展開,OpenAI 可能想要的局面,是讓 Codex 成為更通用的 Agent 工作臺。官方模型負責最強能力和最佳體驗,第三方模型負責擴展場景、降低成本、覆蓋更多供應商需求。用戶可以有選擇,但選擇發生在 OpenAI 定義的工作臺里,這肯定比單純封閉更聰明。
說到底,Codex 開放明顯是雙贏的局面,對 OpenAI 來說,它能把 Codex 往平臺方向推,讓其在不久的將來有可能成為一家獨大的 AI 工作臺;對對國產和開源模型來說,它們終于有機會進入一個成熟工作臺,而不是只待在自己的 Agent 里。可目前來說,OpenAI 開放得還不夠,遠遠不夠。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.