无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<blockquote id="50dg3"></blockquote>

<fieldset id="50dg3"></fieldset>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-5.4發布，最適合OpenClaw的天選模型登場了。

2026-03-06 06:39:03　來源: 數字生命卡茲克

天津舉報

0

分享至

深夜凌晨2點，我剛準備睡覺。

然后，GPT-5.4，突然發布。

一下子激動的睡不著了。

真的，這真不是我天天咋咋呼呼啥的，我真的也很少會用激動的睡不著覺這種表述。

這是因為，我一直在等正式版的GPT-5.3或者GPT-5.4，來作為我的OpenClaw的首選模型。

理由特別簡單，因為現代世界三十年，本質上基層都是代碼，我們現在看到的關于計算機和互聯網的一切，幾乎都建立在代碼的基礎之上。

所以你可以理解為，代碼能力，在很多時候，就代表著Agent能力的一根粗壯的腿。

一個優秀的Agent基座模型，在我的理解里，一般來說，需要三種都很強：

代碼能力、世界知識、多模態理解。

當你這三個都能SOTA的時候，你幾乎必然就是最牛逼的Agent模型，當然，還有一個重要的因素，就是價格。

在過去，Claude Opus 4.6，幾乎就是Agent模型的代名詞，因為代碼、世界知識都很強，多模態能力雖然比不過Seed 2.0和Gemini 3.1 Pro，但是在一些場景里面，也夠了，因為現在的Agent，跟現實物理交互還沒有那么多，那個已經是具身智能的范疇了。

而我過去很喜歡的GPT-5.3-Codex，代碼能力確實強，在做任務執行的時候，那簡直就是指哪打哪。

但是最大的問題，這玩意是一個編程特化模型啊，世界知識就是一坨屎，連GPT-5.2都不如，所以OpenAI當時也是沒辦法，為了跟Claude打一打，只能加個Codex的后綴給放出來了。

所以你會發現，在規劃能力上，是完全比不過Claude Opus 4.6的，但是最大的問題，其實還是因為世界知識的問題，就導致這玩意。

它說天書，講的那些話，真的，我不是程序員出身，我看那個話，看的就真的超級費勁。

就比如說，我讓他之前對我的一個AI熱點網站的項目進行審查，主要就是review一下我的文檔規范和我整個代碼庫。

然后，這哥們寫的文檔，我尼瑪。。。

你再對比一下Claude Opus 4.6寫的。

對比起來應該一目了然。。。

就是因為這玩意不說人話，世界知識也不行，所以，只是在Codex里面用用還好，但是你要是把它接到你的OpenClaw里面，去當做默認模型，你就知道啥叫災難了，這哥們幾乎沒有人味，說起話來我想揍他。

所以我當時試了一下，就直接棄了，還是在我的OpenClaw里面，用的Claude Opus 4.6和Sonnet 4.6，做了一下場景調用。

那為啥說，我很期待GPT-5.4呢。

因為，Claude哪都好，但是，它貴啊！！！

它真的好貴啊！！！！！！

而且因為Anthropic這個呆逼，它把OpenClaw給瘋了，所以我訂閱的Claude的Max Plan的額度，是完全不能給OpenClaw用的，只能在Claude Code用，你想在OpenClaw上用，只能硬接API Key用。

但是大家都知道，Claude的API有多貴，那根本不是我們這種窮逼團隊能用的起的，小規模用用還好，大規模用那公司直接破產了。

之前還有一條路是用反代，把Google家的Antigravity里面的Claude額度用插件代理出來，扔給OpenClaw用。

但是后面Google開始大批量封號，導致也沒辦法用了。

我過年的時候Google賬號還被封了，被迫用AI去給Google寫了一份聲淚俱下的郵件。

我說我錯了，我再也不會了。

后面Google才給我解封，但是反代肯定是用不了了。

而OpenAI就不一樣了，最開始Claude瘋狂封OpenCode賬號的時候，OpenAI大手一揮，就站了出來，說我們不封，大家全力使用。

這是御三家里，唯一一個這么支持態度的，可以用第三方的工具，調用Codex的額度的。

那對OpenClaw自然也不例外了，也是幾個頂級模型里面，為數不多的，可以直接走登錄的，其他的都得用API。

真的，OpenAI這會真的是大善人。

還瘋狂的給Codex加額度。

所以啊，Claude在OpenClaw里用，好是好，但是不能用訂閱額度，只能用API，貴的一筆。

OpenAI的模型倒是可以用訂閱額度，但是GPT-5.2代碼又不行，GPT-5.3-codex又不說人話。

你看，要多別扭有多別扭。

而這一次，GPT-5.4來了！！！

終于把這個短板給補上了！

代碼能力跟GPT-5.3-Codex齊平，世界知識比GPT-5.2還要強，還能使用訂閱額度，20刀就可以用的超級爽。

你就說，這不是最適合OpenClaw的天選模型，還有誰是？嗯？

從今天開始，用OpenClaw的，都把默認模型切換到GPT-5.4去，真的，信我。

回到GPT-5.4，老規矩，先看跑分。

就很爽。

先看最關鍵的幾個。

GDPval：83.0%

這個是測AI在真實工作任務中表現的，包括金融、法律等44種職業的知識工作。

GPT-5.4 Thinking拿了83.0%，Claude Opus 4.6是78.0%，GPT-5.3 Codex是70.9%。

在真實業務場景里，GPT-5.4不只是會寫代碼，它還能跟你聊業務、聊金融、聊法律、聊各種專業領域的東西。

而且是用人話聊，不是用天書聊。

SWE-Bench Pro：57.7%

這個是測AI解決真實軟件工程問題的，不只是Python，而是測四種編程語言。

GPT-5.4 Thinking拿了57.7%，GPT-5.3 Codex是56.8%。

基本持平。

這就是我最想看到的結果。

代碼能力保住了GPT-5.3 Codex的水平，世界知識又補上來了。

OSWorld-Verified也是，75.0%。這個是測AI操作電腦的能力的，就是讓AI像人一樣，用鼠標點擊、用鍵盤輸入、在不同應用之間切換，完成各種任務。

GPT-5.4 Thinking拿了75.0%，超過了Claude Opus 4.6的72.7%，也保持了跟GPT-5.3-Codex的持平。

而且，GPT-5.4操作電腦的速度，快的離譜。

看下這個沒有加速過的視頻，會更直觀。

ToolAthon：54.6%

這個是測AI使用工具的能力的，也就是Agent能力的核心指標之一。

GPT-5.4 Thinking拿了54.6%，Claude Opus 4.6是44.8%。

差了將近10個點。

至于學術知識之類的，跟GPT-5.3-codex就沒法比了，因為OpenAI自己也知道，所以，直接當時就沒跑。

總之，翻譯成大白話就是。

GPT-5.4 = GPT-5.3 Codex的代碼能力 + 比GPT-5.2還強的世界知識 + 更強的工具使用能力 + 超級便宜的codex額度。

這四樣加在一起，就是一個完美的OpenClaw天選基座模型。

然后還有幾個很棒的特性更新：

1. 100萬token的上下文窗口。

這是GPT-5.4的一個大升級。

之前GPT-5.3的上下文窗口是40萬token，GPT-5.4直接翻了一倍多，到了100萬。

這對Agent來說太重要了。

因為Agent在執行任務的時候，需要保持對整個任務的上下文理解。如果上下文窗口不夠大，Agent干著干著就會忘事兒，前面說的東西后面就不記得了。

100萬token，基本上足夠應對絕大部分的Agent任務了。

當然，OpenAI也不傻，他們說，超過27萬token之后，你的額度就算兩倍了。

不過因為Codex給的額度實在是太多太多了，所以即使是2倍，其實也還好。

2. 原生計算機使用能力。

這個是GPT-5.4的另一個大賣點。

OpenAI說，GPT-5.4是他們第一個內置原生計算機使用能力的主線模型。

它在編寫通過Playwright等庫操作計算機的代碼方面表現非常的出色，同時也能根據屏幕截圖發出鼠標和鍵盤命令。

也就是代碼和視覺齊飛，我感覺，這個小龍蝦接入以后，就真的可以，直接用視覺，操控你電腦上絕大多數的軟件了，真的，原生操控，想想都激動。

他們基于此，還發布了一個新的skills，叫playwright-interactive。

允許Codex同時以代碼和視覺的兩種方式，調試Web和Electron應用。

網址在此，大家可以自行安裝。

https://github.com/openai/skills/tree/main/skills/.curated/playwright-interactive

3. 支持了工具搜索。

以前呢，當模型被賦予工具時，所有工具定義都會預先包含在提示中。

對于擁有大量工具的系統，這可能會為每個請求增加數千甚至數萬個token，而且絕大多數的時候，都毫無意義，平白無故的導致成本上升、響應變慢，并在上下文中充斥模型可能永遠不會使用的信息。

所以呢，這次他們也支持了工具搜索，就是GPT?5.4不再直接接收完整工具定義，而是接收一份可用工具的輕量列表以及工具搜索功能。

當模型需要使用某個工具時，它可以查找該工具的定義并在當時將其追加到對話中。

就非常像Skills漸進式呈現的方式，目的很簡單，還是優化上下文工程。

OpenAI在自己測試完以后，發現工具搜索配置在保持相同準確率的同時將總體token使用量減少47%，這個就非常牛逼了。

GPT-5.4 Thinking大概就是這樣。

這次他們其實還發了個GPT-5.4 Pro，我就不細說了，反正就是一切都更牛逼了，但是對于大多數人來說，太貴了，也沒啥大用，必須得200刀的Pro會員才能用。

API的整體價格還是得說一下，雖然大家大概率用的都會是訂閱的額度。

相比于GPT-5.2，價格是漲了的，但是還是比Claude Opus 4.6，便宜不少，Claude Opus 4.6的價格是$5/$25每百萬token（輸入/輸出），GPT-5.4只有他們一半。

目前ChatGPT已經上線了。

Codex也已經支持了，我自己在Codex里面粗淺體驗了一下。

首先撲面而來的，那自然是清新沁人的人話。。。

比如我讓它去把OpenAI官網的視頻給扒拉下來，你看看這個發言：“這種活最煩”，“省的跟Cloudflare互相折壽”。。。

還有這個。

真的，Codex的輸出，我真的能看得懂了。。。

做出來的東西，前端審美有了不錯的進步，但還是不如Opus 4.6和Gemini。

寫作粗略測了一下，還是一股子莫名其妙的愛用排比句的詭異的味道。

奇奇怪怪。

然后有點可惜的就是，我等到了凌晨6點多，OpenClaw目前使用Codex登錄的方式，還是沒有支持GPT-5.4。

這就導致，我還是沒有機會測GPT-5.4在小龍蝦上的效果。

不過估計我一覺睡醒，估計小龍蝦就支持了。

因為社區里已經看到很多用戶在催了，而且先行官們，都普遍反饋效果很好。

坐等支持，我真的已經迫不及待了。

又是開心的一晚。

如果你也在用OpenClaw，那記得OpenClaw支持了以后，把默認模型切換到GPT-5.4。

如果你還沒用過OpenClaw，那正好，現在是一個很好的開始時機。

畢竟，有了GPT-5.4這個天選模型，體驗只會更好。

2026年，真是瘋狂的一年啊。

睡了。

以上，既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉發三連吧，如果想第一時間收到推送，也可以給我個星標?～謝謝你看我的文章，我們，下次再見。

>/ 作者：卡茲克

>/ 投稿或爆料，請聯系郵箱：wzglyay@virxact.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

NEWTON:等物理涌現到請牛頓進工具箱，Agent 驅動視頻生成新范式

機器之心Pro 2026-06-11 20:50:32
0 跟貼 0
不用向量數據庫，Agent也能會搜索：給它一個grep就夠了？

機器之心Pro 2026-06-11 17:06:46
0 跟貼 0

谷歌開源26B文本擴散MoE，劈柴：生成速度像賽馬一樣快

機器之心Pro 2026-06-11 14:31:23
0 跟貼 0

微信AI不打算接管一切

華爾街見聞官方 2026-06-11 16:33:03
0 跟貼 0
實測小米最快1T模型：吞吐量每秒1k+Token，Vibe Coding七秒交付

量子位 2026-06-11 09:07:12
0 跟貼 0

每秒狂吐1000個token！谷歌開源擴散模型新作，4090單卡可跑

智東西 2026-06-11 16:01:51
0 跟貼 0

從爆火到平淡，OpenClaw改變了什么

鈦媒體APP 2026-05-08 08:53:10
13 跟貼 13
實測扣子3.0：把Claude Code、CodeX拉到一個項目群里干活，夯爆了

鈦媒體APP 2026-06-10 10:25:34
24 跟貼 24

GPT-5.6首批實測來了！精準狙擊Mythos

量子位 2026-06-10 14:45:24
1 跟貼 1
微信交出AI答卷：讓AI長在自己的地盤上

鈦媒體APP 2026-06-11 09:52:16
0 跟貼 0
媒體：29分大逆轉+補籃絕殺尼克斯隊的"劇本"太神奇

北青網-北京青年報 2026-06-11 13:19:02
1033 跟貼 1033
杜越華兼任上海外國語大學附屬徐匯實驗中學校長

澎湃新聞 2026-06-11 12:16:30
96 跟貼 96
谷歌干掉了「等你說完才翻譯」！70+語言邊聽邊譯

新智元 2026-06-11 12:38:37
18 跟貼 18
一行代碼沒寫，她用谷歌AI工具給自己做了個靈感管理App

智東西 2026-06-11 22:01:56
0 跟貼 0
“初級班”近萬“督導班”28萬白領高管沉醉的心理課：痛哭、尖叫、下跪……療愈還是“洗腦”？丨紅星深潛

紅星新聞 2026-06-11 11:28:53
1726 跟貼 1726
全網爆火的 Claude Fable 5 神級案例，可能是純手搓

AppSo 2026-06-11 14:28:34
0 跟貼 0
12秒75！美國新星薩普打破塵封14年110米欄世界紀錄

北青網-北京青年報 2026-06-11 12:27:30
351 跟貼 351
小伙發視頻稱自家水果不打農藥，桃子上趴著蟲，網友留言求購蟲子

星視頻 2026-06-11 15:03:06
161 跟貼 161
“換血抗衰”，誰在豪賭？

中國新聞周刊 2026-06-11 07:22:08
647 跟貼 647
8億用戶的釘釘，只有1000人在扛

澎湃新聞 2026-06-11 08:00:27
475 跟貼 475
ChatGPT突然改版！奧特曼：IPO不著急

新智元 2026-06-11 19:39:12
0 跟貼 0
市委常委會舉行會議：堅決擁護黨中央決定，堅定不移推動全面從嚴治黨向縱深發展

上海發布 2026-06-11 14:10:30
1 跟貼 1
女生高考考一半發現填錯答案，僅剩25分鐘換答題卡，當事人回應

星視頻 2026-06-11 16:48:33
28 跟貼 28
柬埔寨旅游發展與國際合作局：希望2026年到訪的中國游客數量至少增加20%—30%

北京商報 2026-06-07 12:37:05
993 跟貼 993
上海道路停車收費優化方案公開征求意見：15分鐘內免費，每自然日享受2次

澎湃新聞 2026-06-11 11:52:30
264 跟貼 264
寶馬7系用車體驗在商場買到喜歡的機甲模型體驗后排的舒享功能

SuperStreet超級街 2026-06-09 09:15:13
0 跟貼 0
OpenAI推理之父掀桌：AI真·滿血的樣子，你沒錢見！

新智元 2026-06-11 19:38:29
0 跟貼 0
明天上午10點，查成績！

阜陽發布 2026-06-11 19:37:09
1 跟貼 1
爆火Codex封神！4個零基礎職場技巧，讓你工作效率直接翻倍

秋葉大叔 2026-06-09 07:40:15
4 跟貼 4
浙江楊梅紅了！800元一斤，水晶楊梅為啥這么貴？

極目新聞 2026-06-11 18:42:13
48 跟貼 48
“AI領域最被濫用的術語”李飛飛終于把世界模型講明白了

量子位 2026-06-07 04:37:43
0 跟貼 0
曾經落地近90萬的神車！路虎攬勝極光L跌至17.98萬

中國能源網 2026-06-11 10:58:56
351 跟貼 351
OpenAI被曝本月將發GPT-5.6，奧爾特曼預估一年內完成IPO

智東西 2026-06-11 19:01:36
0 跟貼 0
樂高蝙蝠俠彩蛋封神！C64代碼讓網友直呼開發組太懂

有態度網友ytd3049 2026-06-09 00:58:43
0 跟貼 0
AI編程代理斗武俠：這個網頁游戲讓代碼替你出招

算力游俠 2026-06-11 14:08:02
0 跟貼 0
涉1200畝土地權屬，前副縣長簽字蓋印稱“屬實”的《決定》，鎮政府“查無存檔”｜紅星調查

紅星新聞 2026-06-11 17:54:21
23 跟貼 23
張雪空降阿里總部，稱沒少找馬云借錢，最高一筆超22萬元！張雪談上市計劃

大風新聞 2026-06-11 22:03:06
3 跟貼 3
豐巢回應“取件得先看廣告”

南方都市報 2026-06-11 09:35:31
151 跟貼 151
這3DGS插件更到5.0，動畫終于能動了，但幀數嘛

渡川5 2026-06-11 22:59:27
0 跟貼 0
鄔賀銓談志愿填報Agent：AI更應承擔彌合鴻溝的社會責任

新浪財經 2026-06-11 18:26:21
4 跟貼 4

中方深切哀悼！河野洋平彌留之際，曾流淚表達希望訪問中國

中方深切哀悼！河野洋平彌留之際，曾流淚表達希望訪問中國

澎湃新聞

2026-06-11 16:56:44

美軍開始空襲伊朗

財聯社

2026-06-11 05:42:11

“沒有她，SpaceX早倒閉了”：全世界最有權力的女性工程師是如何煉成的

“沒有她，SpaceX早倒閉了”：全世界最有權力的女性工程師是如何煉成的

鈦媒體APP

2026-06-11 13:43:26

世界杯懸念不大，冠軍大概率將在以下5隊中產生，阿根廷力爭衛冕

世界杯懸念不大，冠軍大概率將在以下5隊中產生，阿根廷力爭衛冕

小火箭愛體育

2026-06-11 16:11:26

養路費改革：油價降0.8元/升，新能源車0.12元/公里，誰受益？

養路費改革：油價降0.8元/升，新能源車0.12元/公里，誰受益？

周哥一影視

2026-06-11 14:15:11

美國宣布查封13個互聯網域名，稱這些域名被中國情報部門用來獲取信息，中方：在全球范圍大肆公然搞間諜活動和情報搜集的，恰恰是美國自己

美國宣布查封13個互聯網域名，稱這些域名被中國情報部門用來獲取信息，中方：在全球范圍大肆公然搞間諜活動和情報搜集的，恰恰是美國自己

極目新聞

2026-06-11 16:05:09

2-5！董路怒斥：巴西人故意使壞永遠不要相信歐洲南美+韓國人

2-5！董路怒斥：巴西人故意使壞永遠不要相信歐洲南美+韓國人

念洲

2026-06-11 09:56:39

俄羅斯領導人普京簽署法律，允許沒收離開俄羅斯的俄羅斯公民財產

俄羅斯領導人普京簽署法律，允許沒收離開俄羅斯的俄羅斯公民財產

山河路口

2026-06-11 13:35:44

謝娜跨界圈錢越演越烈！官媒點名怒批，句句說到心坎，過審也得涼

謝娜跨界圈錢越演越烈！官媒點名怒批，句句說到心坎，過審也得涼

娛說瑜悅

2026-06-10 20:29:46

馬寧：現在體脂率控制在11%左右，40歲以后紅肉一口不吃

馬寧：現在體脂率控制在11%左右，40歲以后紅肉一口不吃

懂球帝

2026-06-11 20:36:25

深度? 特朗普“用炸彈談判”，伊朗再“關”霍爾木茲：美伊爭的究竟是什么？

深度? 特朗普“用炸彈談判”，伊朗再“關”霍爾木茲：美伊爭的究竟是什么？

上觀新聞

2026-06-11 21:08:54

6月11日俄烏：通往克里米亞的橋梁被悉數摧毀，烏國防預算暴增55%

6月11日俄烏：通往克里米亞的橋梁被悉數摧毀，烏國防預算暴增55%

山河路口

2026-06-11 18:48:13

戰略金屬，爆出重大利好！

君臨財富

2026-06-11 16:02:45

炸機庫，炸第五艦隊，炸戰機！伊朗打瘋了，特朗普求和37次沒用

炸機庫，炸第五艦隊，炸戰機！伊朗打瘋了，特朗普求和37次沒用

策前論

2026-06-11 16:16:40

美國五角大樓被封鎖

新華社

2026-06-11 23:08:02

兩年前專家都說他會毀掉阿根廷，如今數據打臉

兩年前專家都說他會毀掉阿根廷，如今數據打臉

斌聞天下

2026-06-11 07:00:07

慘敗之后！馬刺主帥賽后講話內容曝光，指出史詩級崩盤的真因

慘敗之后！馬刺主帥賽后講話內容曝光，指出史詩級崩盤的真因

夜白侃球

2026-06-11 12:46:26

哈蘭德：我和謝爾基平時經常開玩笑，和他交手肯定會很好玩

哈蘭德：我和謝爾基平時經常開玩笑，和他交手肯定會很好玩

懂球帝

2026-06-11 19:42:18

伊朗稱美軍炸毀250萬升儲水箱，45℃高溫中2萬人斷水！美方尚未回應

伊朗稱美軍炸毀250萬升儲水箱，45℃高溫中2萬人斷水！美方尚未回應

紅星新聞

2026-06-11 14:30:18

淚崩了！廣東發布停產通知，稱面臨嚴重虧損，依法補償并推薦就業

淚崩了！廣東發布停產通知，稱面臨嚴重虧損，依法補償并推薦就業

火山詩話

2026-06-11 20:41:11

數字生命卡茲克

反復橫跳于不同的AI領域，努力分享一些很酷的AI干貨

534文章數 665關注度

往期回顧全部

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

頭條要聞

中方對菲國防部長特奧多羅及其親屬實施制裁

頭條要聞

中方對菲國防部長特奧多羅及其親屬實施制裁

體育要聞

比起總冠軍，更大的懸念成了FMVP？

娛樂要聞

《花少8》陣容大揭秘！秒殺前一季

財經要聞

干細胞生意：17萬一針的希望

汽車要聞

傳祺向往M8 PHEV L/E8 PHEV上市限時落地價16.84萬起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

親子

手機

時尚

公開課

本地新聞

世界杯還沒開始，蘇超已經火到爆梗

親子要聞

歷經兩年治療，無精子癥患者家庭在滬迎健康寶寶

手機要聞

三星Galaxy S27現身數據庫，產品細節再曝光

薄荷綠色的單品打造夏日清透感，視覺上清爽又治愈，溫柔減齡

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<option id="cpejk"><pre id="cpejk"><pre id="cpejk"></pre></pre></option>

<blockquote id="cpejk"></blockquote>

<ruby id="cpejk"><table id="cpejk"><optgroup id="cpejk"></optgroup></table></ruby>