无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

實錘!GPT-5.5「降智」被抓,OpenAI官方文檔認了

0
分享至


新智元報道


【新智元導讀】GPT-5.5被扒出「假思考」,用兩小時就被偷偷換成mini,200美元月費買了個「薛定諤的腦子」。Trace命令實錘,官方文檔親自認領。往后有紛紛吐槽:OpenAI,你糊弄誰呢?

ChatGPT又被爆「降智」了!

就在這兩天,上率先炸鍋。

網友Lisan al Gaib發現,GPT-5.5用了一兩個小時后突然變傻,每個請求都是秒回,質量斷崖式下跌。

但界面上顯示的,依然還是「GPT-5.5 Extended Thinking」。

也就是說,思考的標簽還掛著,但思考本身已經消失了。



200美元/月,買了個「薛定諤的模型」

OpenAI開發者論壇上,一篇投訴帖同步爆了。

Agentify.sh表示,GPT-5.5用著用著會突然喪失遵循指令的能力。

眼瞧著它興沖沖地宣布「修好了」,結果代碼質量差到引發大面積回退。

之前5.5-med就能輕松搞定的UI任務,現在連最簡單的改動都搞不定。

升到5.5-high,沒用。再升到xhigh,還是不行。

而且xhigh以前能跑好幾個小時,現在明顯縮短了。


帖子一出,回復區瞬間炸了。

有人直接退回了5.4。

有人用的是xhigh最高檔,但「跟上周比明顯拉胯,長任務頻繁出錯,完全不遵循工作流」。

有人反映更離譜的情況,「簡單查詢也要轉很久,你打斷它糾正方向,它直接無視你,繼續按之前錯誤的計劃走」。

沒錯,所有人都在描述同一個現象——GPT的腦子,不知道什么時候被偷偷換掉了。

GPT-5.5目前的表現跟5.3差不多,毫不夸張。頭幾天還驚艷得不行,現在完全找不到當初那個模型的影子了。


不是錯覺,OpenAI自己白紙黑字寫著

為了驗證,Lisan al Gaib專門做了一個對比測試。

同一個賬號,ChatGPT端用Extended Thinking跑出來的全是垃圾,轉頭到Codex端用xhigh,立刻恢復正常。

用他的原話說就是,Codex「簡直比這玩意兒聰明40億倍」。


開發者Andrew Curran則想了個妙招——直接問模型「你的訓練數據截止日期是什么?」

模型回答,August 2025。

問題是,GPT-5.5 Thinking的截止日期是12月。8月,是Instant版本的截止日期!

也就是說,他選的是Thinking,系統實際給他跑的是Instant

界面上模型標簽一個字都沒變,但背后的模型已經被偷偷換掉了……


搞笑的是,這次OpenAI竟然在自己的幫助文檔里替用戶做了實錘。

根據OpenAI Help Center的官方說明,Plus用戶每3小時最多發送160條GPT-5.5消息。

用完之后,系統會靜默切換到mini模型,直到額度重置


注意「靜默」兩個字。

沒有彈窗提示,沒有模型標簽變化,沒有任何視覺反饋。

你還以為自己在用旗艦模型,對面已經悄悄換成了mini。

Pro用戶也別高興太早。

Heavy思考模式,那個Pro獨享的最高推理檔位,在服務器負載高的時候,同樣會被容量限流。同樣沒有預警。

換句話說,200美元/月的Pro訂閱,買到的是一個隨時可能被「偷梁換柱」的服務。


而這種「標簽沒變,腦子換了」的操作,在Codex端更早就被人抓包了。

今年2月,GitHub上出現了一個issue,一個Pro用戶用trace命令抓到,自己請求的是GPT-5.3 Codex,實際返回的模型是GPT-5.2。

連5.2 Codex都不是,是更低的基礎版5.2。


他貼出了復現命令:

RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1

預期:gpt-5.3-codex

多個Pro用戶在同一個issue下確認了同樣的降級。

而且這種降級是「粘性的」,不會自己恢復,也沒有任何解釋。


甚至,在4月GPT-5.5發布當天,還有用戶報告Fast模式的速度跟Standard差不多,但計費還是按Fast來的。

簡單任務跑了7分49秒,正常應該5-6分鐘。



OpenAI承認了,然后就沒有然后了

5月15日,OpenAI的status頁面出現了一條記錄。

GPT5.5 Performance Degradation,我們正在調查部分用戶反映的GPT-5.5性能下降問題。

5月17日,狀態更新為「已解決」。

但從論壇帖子的時間線來看,5月24-26日的降智投訴比5月15日那波更猛。

要么「解決」了的問題又回來了,要么壓根就沒真正解決。


每次升級都是一次「降智爭議」

雖然各家都會遇到「模型變蠢」的吐槽,但OpenAI從GPT-5到GPT-5.5的每個更新,一次都沒缺席。

每一次OpenAI都說在調查,每一次都說已解決,然后下一個版本繼續。

2025年8月,GPT-5首發Reddit的熱帖標題直接就是「GPT-5太爛了」。用戶投訴短回復、更多拒絕、更少人格感。

OpenAI被迫緊急恢復GPT-4o選項。奧特曼在Reddit AMA上親自承認「比我們預期的顛簸」。


2025年12月,GPT-5.2翻譯質量倒退,編造不存在的API,拒絕執行5.1能輕松完成的風格指令。

2026年2月,GPT-5.3-CodexPro用戶被靜默降級到5.2,trace命令實錘。

2026年3月,GPT-5.4OpenAI社區論壇出現「GPT-5.4在Codex里明顯退化了」帖子,網友回復全部確認。

2026年5月初,GPT-5.5 Instant上線回復長度縮短30%,emoji幾乎消失。網友總結:精度提升了,但溫度消失了。


2026年5月下旬,也就是現在。Thinking模式的降智投訴再次爆發。

Lisan al Gaib透露,自從GPT-5發布時他帶頭打了那場ChatGPT Plus額度爭奪戰之后,「每周都會收到這樣的私信」。

最新一條是有人求他幫忙把xhigh/heavy thinking要回來。


跑分最強的那天,是發布日

chatgptdisaster.com整理了1087條經過驗證的用戶投訴,其中一類被反復提到的場景叫「路由層失靈」,UI顯示GPT-5.5 Pro,輸出完全是另一個檔次的東西。

用戶描述了一個可復現的模式,長會話后模型開始「完全無視你說的話」,但模型選擇器上還掛著頂配標簽。


最荒誕的注腳是,Plus用戶160條/3小時用完后自動切換mini的機制,在OpenAI官方文檔里被描述為一項「功能」

為什么會這樣?Lisan al Gaib分析認為,答案就兩個字,省錢。

算力與盈利能力的緊縮正影響著每一個人。處處精打細算,不放過任何省錢的機會。


然而,就在GPT-5.5用戶集體投訴的同一周,GPT-5.6的身影已經出現在了Codex后臺日志里。

內部代號iris-alpha,150萬Token上下文,Polymarket給出的6月發布概率超過85%。

一邊是5.5用戶連基礎體驗都保不住,一邊是5.6已經在后臺悄悄跑真實流量。

這就是2026年的ASI競賽。

造新模型的速度越來越快,但讓舊模型好好跑完一個會話卻越來越難。

跑分最強的那一天永遠是發布日,之后每一天都是薛定諤的GPT。


參考資料:

https://x.com/scaling01/status/2058643470357590058?s=20

編輯:摩西


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
甘孜州委書記沈陽,出任國家民委副主任!陳英,已任重慶市委組織部副部長!

甘孜州委書記沈陽,出任國家民委副主任!陳英,已任重慶市委組織部副部長!

叮當當科技
2026-05-27 11:51:15
林志玲戲份被全刪,網友發現背后的原因了

林志玲戲份被全刪,網友發現背后的原因了

大張的自留地
2026-05-27 16:35:02
“我爸是李剛”的李啟銘:十年后重返社會,父親拒見面企業不敢要

“我爸是李剛”的李啟銘:十年后重返社會,父親拒見面企業不敢要

莫地方
2026-05-27 00:45:03
突發!松島輝空官宣離隊!橋本帆乃香回應退出亞錦賽選拔賽!

突發!松島輝空官宣離隊!橋本帆乃香回應退出亞錦賽選拔賽!

乒乓網國球匯
2026-05-27 02:20:32
女子白拿外賣引討論,播放破2000萬單位處置

女子白拿外賣引討論,播放破2000萬單位處置

書寫傳奇
2026-05-27 12:47:24
北京:西站地區出租車調度站車輛飽和后,將暫停車輛排隊入場

北京:西站地區出租車調度站車輛飽和后,將暫停車輛排隊入場

北青網-北京青年報
2026-05-27 10:48:28
徹底社死!北京女白領白嫖外賣,海外播放量超2000萬,公司都要完

徹底社死!北京女白領白嫖外賣,海外播放量超2000萬,公司都要完

瀲滟晴方DAY
2026-05-27 11:03:13
央視緊急預警!將有大事發生?應急儲備別亂囤,這4類才是剛需

央視緊急預警!將有大事發生?應急儲備別亂囤,這4類才是剛需

閱微札記
2026-05-26 19:46:54
中國工程院撤銷張堯學院士稱號

中國工程院撤銷張堯學院士稱號

界面新聞
2026-05-25 21:36:51
長期分房睡的夫妻,逃不過這5個結局!第3個太扎心

長期分房睡的夫妻,逃不過這5個結局!第3個太扎心

聰明小石頭
2026-03-25 19:12:30
宇樹機器人被批只是“遙控大玩具”,一代人有一代人的皮影戲

宇樹機器人被批只是“遙控大玩具”,一代人有一代人的皮影戲

可達鴨面面觀
2026-05-27 16:35:44
陪武契奇夫人試旗袍的人是她,服裝設計學博士,如今在大學當教授

陪武契奇夫人試旗袍的人是她,服裝設計學博士,如今在大學當教授

凡知
2026-05-27 12:31:07
抽煙又火了?醫生研究發現:高血壓患者在抽煙時,需要多注意3點

抽煙又火了?醫生研究發現:高血壓患者在抽煙時,需要多注意3點

觀星賞月
2026-05-27 14:11:20
毛遠新透露,毛主席最后的遺囑應該只有9個字

毛遠新透露,毛主席最后的遺囑應該只有9個字

歷史偉人錄
2024-09-27 13:44:11
最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
申花外援米內羅發文道歉!如年初留的是路易斯+阿馬杜就完美

申花外援米內羅發文道歉!如年初留的是路易斯+阿馬杜就完美

80后體育大蜀黍
2026-05-27 16:23:10
五大聯賽落幕!金球獎10位熱門候選出爐:登貝萊第2,亞馬爾第5

五大聯賽落幕!金球獎10位熱門候選出爐:登貝萊第2,亞馬爾第5

球場沒跑道
2026-05-26 18:21:45
就在今天!一個前無古人的NBA紀錄,被卡魯索達成了

就在今天!一個前無古人的NBA紀錄,被卡魯索達成了

劉哥談體育
2026-05-27 15:41:28
連戰方面確認不和解后,多名藍營大佬表態,王金平喊話馬英九一事

連戰方面確認不和解后,多名藍營大佬表態,王金平喊話馬英九一事

一口娛樂
2026-05-26 16:49:37
美印日澳就東海及南海局勢表達關切,外交部回應

美印日澳就東海及南海局勢表達關切,外交部回應

澎湃新聞
2026-05-27 16:12:50
2026-05-27 17:11:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15319文章數 66892關注度
往期回顧 全部

科技要聞

韜定律:全球在卷納米數 華為換了一把尺子

頭條要聞

受害者多為中國女性 震驚全球的迷奸案細節披露

頭條要聞

受害者多為中國女性 震驚全球的迷奸案細節披露

體育要聞

這群老阿姨,是最硬核的馬刺球迷

娛樂要聞

王鶴棣風波連累父親炸串店遭差評?

財經要聞

ST巖石退市背后:A股“炒殼”時代終結

汽車要聞

6激光雷達 全主動懸架 全新一代問界M9上市47.98萬元起

態度原創

游戲
藝術
房產
數碼
公開課

細節拉滿!《黑旗RE》海量概念圖曝光 經典艦船全復刻

藝術要聞

這個夏天去蘇州過幾天清閑安逸的日子

房產要聞

地產投資又跌30%!連跌15月!海南房子將越來越少?

數碼要聞

TCL把618電視榜單包圓了!從入門到旗艦,四臺爆款一次說清

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版