无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5.5 Instant 來了,更聰明、更簡潔,也更懂你

0
分享至

剛剛,OpenAI 把 ChatGPT 默認(rèn)模型悄悄換了——GPT-5.5 Instant 上線,全量替換 GPT-5.3 Instant

為什么這事比新發(fā)個旗艦還重要?因為 Instant 是幾億用戶每天默認(rèn)在用的那一個——在它身上動一刀,是真有幾億人能直接體感到的事


簡單測試:閱讀理解+SVG代碼生成+審美,一流水平


三個關(guān)鍵改動

OpenAI 自己只用了一句話概括:smarter, clearer, more personalized

更聰明、更簡潔、更懂你

1. 幻覺砍了一刀,準(zhǔn)頭可見提升

內(nèi)部高風(fēng)險評測(醫(yī)療、法律、金融):

  • **幻覺斷言減少 52.5%**(vs GPT-5.3 Instant)

  • 在用戶標(biāo)記過「事實有問題」的對話上,錯誤率再降37.3%

這一刀砍得算到了刀刃上——日常用 ChatGPT 最怕的就是它一本正經(jīng)地胡說八道

下面這個例子很典型,用戶問「look okay?」上傳了一張代數(shù)草稿:


user 提交的代數(shù)題


  • GPT-5.3 Instant的回答:發(fā)現(xiàn) x=3 代回去不成立 → 直接得出「無解」

  • GPT-5.5 Instant的回答:發(fā)現(xiàn) x=3 不成立后繼續(xù)往回查,定位到原始展開式有錯(應(yīng)該是 x2-3x-6 而非 x2-x-6),用求根公式給出正解 (3+√33)/2

差別就一句話:5.3 走到一半就停,5.5 會自己回溯找根因

這種「自我糾錯」是默認(rèn)模型最該具備的素質(zhì)

2. 話變短了,廢話變少了

官方原話:「reduce verbosity and overformatting」——降低啰嗦,少甩格式

舉一個對照:用戶問「how do I tell my coworker to quit yapping all the time」(怎么讓同事別再叨叨)

  • GPT-5.3 Instant:4 段建議 + 「what not to do」清單 + emoji,結(jié)構(gòu)感很強但有點啰嗦

  • GPT-5.5 Instant:5 個分級建議 + 一句關(guān)鍵收尾,用詞少 30.2%、行數(shù)少 29.2%

老章吐槽過很多次:之前 ChatGPT 回個簡單問題動不動甩五個二級標(biāo)題加項目符號,看著累

這次能管住手挺好——少了點 emoji 和熱情,多了點專業(yè)感

3. 個性化變深了,還能看得見

新版 Instant 會自動用你過去的聊天記錄、上傳過的文件、連接過的 Gmail來個性化回答

舉例:用戶問「What new tea place should I try?」

  • 5.3 Instant:基于「在舊金山」給出泛泛推薦

  • 5.5 Instant:知道你常去 Asha Tea House、偏臺灣高山茶風(fēng)格,直接推「下一站」給你

更重要的是新功能Memory sources

? 在每個被個性化的回復(fù)里,你能看到 ChatGPT 用了哪些上下文(保存的記憶、過去的對話)。可以刪除、修正、或開啟 temporary chat 完全不用記憶

這點老章給個高分——AI 越懂你,透明度越要跟上,不然就是失控


ChatGPT 個性化餐飲推薦界面 可用性


  • 今天起開始 rollout,全量替換默認(rèn)模型

  • API 中作為chat-latest調(diào)用

  • 付費用戶的 GPT-5.3 Instant 還會保留 3 個月(在模型選擇里手動切回)

  • 個性化(past chats / files / Gmail):先 Plus / Pro 網(wǎng)頁版,后續(xù)到 Free / Go / Business / Enterprise

  • Memory sources 全檔位逐步開放

順便重新捋一遍 GPT-5.5 主線

Instant 是小弟,要看主線劇情,得回到 4 月 23 日那次重磅發(fā)布


一句話定位

? OpenAI 迄今最智能、交互體驗最直觀的模型,專為「實際工作」打造

關(guān)鍵詞不是寫詩、畫圖,是實際工作——編程、調(diào)研、跑表格、做文檔、跨軟件操作

跑分一覽(節(jié)選最有看點的)

評測

GPT-5.5

GPT-5.4

Claude Opus 4.7

Gemini 3.1 Pro

Terminal-Bench 2.0(命令行 Agent)

82.7%

75.1%

69.4%

68.5%

GDPval(44 種職業(yè))

84.9%

83.0%

80.3%

67.3%

OSWorld-Verified(操作真實電腦)

78.7%

75.0%

78.0%

FrontierMath Tier 4(高階數(shù)學(xué))

35.4%

27.1%

22.9%

16.7%

ARC-AGI-2 (Verified)

85.0%

73.3%

75.8%

77.1%

τ2-bench Telecom(客服流)

98.0%

92.8%

CyberGym(網(wǎng)絡(luò)安全)

81.8%

79.0%

73.1%

Graphwalks BFS 1mil f1(百萬長上下文)

45.4%

9.4%

41.2%*

主線 SOTA 集中在Agent 編程 + 長上下文 + 計算機操作 + 網(wǎng)絡(luò)安全 + 高階數(shù)學(xué)——而且不少項目是用更少 Token 干出來的

智能體編程是真的猛

  • **Terminal-Bench 2.0:82.7%**——命令行多步規(guī)劃、工具協(xié)作這種最像「真人工程師」的活,干下來了

  • **SWE-Bench Pro:58.6%**——單次嘗試就能端到端解決更多 GitHub 真實 issue

  • 內(nèi)部 Expert-SWE(人類工程師中位完成時間約 20 小時的長周期任務(wù)):進一步超越 5.4

OpenAI 內(nèi)部數(shù)據(jù)更扎心——公司內(nèi)85% 員工每周用 Codex

  • 財務(wù)團隊用 Codex 處理 24,771 份 K-1 稅表、共 71,637 頁,比去年提前兩周收工

  • 公關(guān)團隊建了一套自動 Slack 智能體,過濾低風(fēng)險演講請求

  • 市場拓展團隊周報自動化,每人每周省 5-10 小時

NVIDIA 工程師那句話挺戳:

? 「失去對 GPT-5.5 的訪問權(quán)限,感覺就像被截肢了一樣」
價格策略

API 這次漲價了,但 OpenAI 說 Token 利用效率提升能抵掉一部分:

檔位

輸入價格

輸出價格

上下文

GPT-5.5

$5/M$30/M

1M

GPT-5.5 Pro

$30/M

$180/M

1M

Codex(訂閱)

含在 Plus/Pro/Business/Enterprise/Edu/Go

400K

輔助玩法:

  • Batch / Flex 半價——不急的任務(wù)往這里塞

  • Priority 優(yōu)先 2.5 倍價——要快的客戶付錢

  • Codex 快速模式 1.5×速度、2.5×費用——和 Priority 一個套路

老章的看法

OpenAI 這次發(fā)布節(jié)奏其實挺清晰:

4月23日 → 主線 GPT-5.5(Pro/付費用戶優(yōu)先)
5月05日 → Instant 升級(默認(rèn)模型,全量鋪開)

潛臺詞是:先用旗艦?zāi)芰κ崭罡顿M用戶,再把紅利下放給所有人

對普通用戶來說,最直接的兩個感受:

  1. 回答更準(zhǔn)、廢話更少——少了點「ChatGPT 味」,多了點專業(yè)感

  2. 個性化看得見——能查能刪能改,不再是黑箱

可能讓人不爽的點:

  • 模型在變得更「冷靜」,emoji 和熱情少了

  • 網(wǎng)絡(luò)安全場景的攔截更嚴(yán),部分專業(yè)用戶初期可能覺得受限(OpenAI 自己也承認(rèn)了,但說這是必要代價)

總結(jié)

GPT-5.5 這一代的關(guān)鍵詞不是「更大」,是更準(zhǔn)、更省、更能干活

Instant 升級則是把這種紅利下放給所有人——你哪怕是免費用戶,也能感受到一點

制作不易,如果這篇文章覺得對你有用,可否點個關(guān)注。給我個三連擊:點贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
摩根:梅西亮鞋釘犯規(guī)本該被罰下,結(jié)果他甚至連黃牌都沒吃到

摩根:梅西亮鞋釘犯規(guī)本該被罰下,結(jié)果他甚至連黃牌都沒吃到

懂球帝
2026-06-17 18:37:27
中國腦梗發(fā)病率世界第一!醫(yī)生苦勸:罪魁禍?zhǔn)滓丫境觯@4物少吃

中國腦梗發(fā)病率世界第一!醫(yī)生苦勸:罪魁禍?zhǔn)滓丫境觯@4物少吃

醫(yī)學(xué)科普匯
2026-06-17 18:55:13
錢再多有什么用?65歲乒乓教父蔡振華現(xiàn)狀,給所有老年人提了個醒

錢再多有什么用?65歲乒乓教父蔡振華現(xiàn)狀,給所有老年人提了個醒

阿郎娛樂
2026-06-17 06:13:28
"越擦越癢,越癢越擦"!有人崩潰:果斷停用!

"越擦越癢,越癢越擦"!有人崩潰:果斷停用!

深圳晚報
2026-06-17 12:10:46
沉默45年,中國第二輪"嚴(yán)打"終于來了!目標(biāo)改變總體戰(zhàn)正式打響

沉默45年,中國第二輪"嚴(yán)打"終于來了!目標(biāo)改變總體戰(zhàn)正式打響

職場資深秘書
2026-06-15 16:41:48
引體向上拉不起一個?恭喜你,這才是中國成年男人的正常水平

引體向上拉不起一個?恭喜你,這才是中國成年男人的正常水平

劉哥談體育
2026-06-16 18:58:22
拒絕續(xù)約想去執(zhí)教尼克斯,結(jié)果現(xiàn)在找不到下家,高估自己的下場!

拒絕續(xù)約想去執(zhí)教尼克斯,結(jié)果現(xiàn)在找不到下家,高估自己的下場!

你的籃球頻道
2026-06-17 08:41:15
G7就制俄助烏達成一致,烏克蘭推出多款大殺器

G7就制俄助烏達成一致,烏克蘭推出多款大殺器

史政先鋒
2026-06-17 22:32:28
梅西解釋進球后落淚:和足球無關(guān),我經(jīng)歷了一段艱難復(fù)雜的日子,現(xiàn)在狀態(tài)很好

梅西解釋進球后落淚:和足球無關(guān),我經(jīng)歷了一段艱難復(fù)雜的日子,現(xiàn)在狀態(tài)很好

紅星新聞
2026-06-17 12:48:47
完爆努涅斯!利物浦砸 1 億搶世界杯天才!再也不用看吐餅了

完爆努涅斯!利物浦砸 1 億搶世界杯天才!再也不用看吐餅了

瀾歸序
2026-06-17 06:17:02
證監(jiān)會主席吳清:中國資本市場經(jīng)受了重大風(fēng)險考驗 韌性和抗風(fēng)險能力不斷提升

證監(jiān)會主席吳清:中國資本市場經(jīng)受了重大風(fēng)險考驗 韌性和抗風(fēng)險能力不斷提升

財聯(lián)社
2026-06-17 11:36:53
《南方周末》深夜刪稿,廣州的新聞媒體,誰還能做深度報道?

《南方周末》深夜刪稿,廣州的新聞媒體,誰還能做深度報道?

苗苗情感說
2026-06-17 18:36:23
寶媽誤發(fā)私密視頻風(fēng)波未停:最該譴責(zé)的,從來不是失手的當(dāng)事人

寶媽誤發(fā)私密視頻風(fēng)波未停:最該譴責(zé)的,從來不是失手的當(dāng)事人

千言娛樂記
2026-06-15 16:54:12
拉瑪五世娶了四位親妹妹,一百年后,代價落在了帕公主身上

拉瑪五世娶了四位親妹妹,一百年后,代價落在了帕公主身上

孔孔說體育
2026-06-17 15:32:37
一票定江山!菲律賓參議院變天:卡耶塔諾臨陣放棄,13 票鎖定勝局

一票定江山!菲律賓參議院變天:卡耶塔諾臨陣放棄,13 票鎖定勝局

阿離家居
2026-06-17 20:55:06
C羅回應(yīng)進球壓力!梅西戴帽搶走眾星風(fēng)頭,踩人沒被罰下引發(fā)猜測

C羅回應(yīng)進球壓力!梅西戴帽搶走眾星風(fēng)頭,踩人沒被罰下引發(fā)猜測

三十年萊斯特城球迷
2026-06-17 20:09:27
因宗教原因,世界杯賽前儀式的沙特國旗以志愿者手持懸空的方式展示

因宗教原因,世界杯賽前儀式的沙特國旗以志愿者手持懸空的方式展示

懂球帝
2026-06-17 05:02:05
尼克斯奪冠幕后:太太團曬照,老板禁欲梗走紅

尼克斯奪冠幕后:太太團曬照,老板禁欲梗走紅

甜度百分百21
2026-06-18 01:26:53
梅西妻子攜三子觀賽,大兒子身高160CM,二兒子酷似梅西

梅西妻子攜三子觀賽,大兒子身高160CM,二兒子酷似梅西

青杉依舊啊啊
2026-06-17 21:28:48
千萬級安保、53年等待:紐約尼克斯奪冠游行背后的瘋狂與傷痕

千萬級安保、53年等待:紐約尼克斯奪冠游行背后的瘋狂與傷痕

體壇觀察猿
2026-06-18 01:10:11
2026-06-18 01:48:49
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3435文章數(shù) 11165關(guān)注度
往期回顧 全部

科技要聞

馬斯克好友長文:他最可怕的,是這套方法論

頭條要聞

美媒:馬克龍想借中國在G7制衡美國 跟特朗普討價還價

頭條要聞

美媒:馬克龍想借中國在G7制衡美國 跟特朗普討價還價

體育要聞

梅西帽子戲法:紀(jì)錄厚重,球王輕盈

娛樂要聞

陳紅一反常態(tài)保持沉默

財經(jīng)要聞

拉加德警告:AI可能引爆下一場金融危機

汽車要聞

23.99萬起 比亞迪大唐帶2+2+3大七座掀桌子 這才是中國大家庭夢中情車!

態(tài)度原創(chuàng)

本地
健康
游戲
房產(chǎn)
公開課

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當(dāng)老板

營養(yǎng)師:粽子怎么吃美味又健康?

《黑神話》狂賣3000萬份!還有國產(chǎn)3A能超越它嗎?

房產(chǎn)要聞

最新房價:海口、三亞;新房、二手房全線下跌!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版