網易首頁 > 網易號 > 正文 申請入駐

OpenAI甩出GPT-5.5 Instant!幻覺暴降52%,話少三成,全員免費

0
分享至


智東西
作者 王涵
編輯 冰倩

智東西5月6日報道,今天,OpenAI正式推出GPT?5.5 Instant版,將從今天開始向所有ChatGPT用戶逐步推出,取代GPT?5.3 Instant成為默認模型。

此次更新主要體現在日常交互上,GPT?5.5 Instant的對話語氣更加自然,回答準確率更高且更緊湊,并且當用戶使用個性化功能時,模型還能夠調取過往的對話記錄,補充背景信息。

Sam Altman第一時間轉發官宣推文“強推”這一模型,并稱:“速度、智能、個性,再加上強大的記憶與個性化能力,這幾方面的改進組合在一起,當它們同時發揮作用時,給人的感覺已經遠不止是各部分簡單的相加,而是一種整體大于部分之和的體驗。”


在內部評估中,在醫學、法律和金融等領域,GPT?5.5 Instant的幻覺率比GPT?5.3 Instant減少了52.5%。

基準測試方面,在衡量科學圖表推理準確度的CharXiv-reasoning中,GPT-5.5 Instant比GPT-5.3 Instant提升了6.6%。多模態專家推理測試MMMU-Pro中,GPT-5.5 Instant的準確率提升了6.8%

在文檔解析任務中,GPT-5.5 Instant的錯誤率降低了2.1%,相對降幅約14.4%。在博士級科學問答測試中,GPT-5.5 Instant的準確率提升了7.1%。在數學競賽AIME 2025中,其準確率漲了15.8%




在API中,GPT?5.5 Instant的名稱為“chat?latest”。對于付費用戶,GPT?5.3 Instant在退役前還將保留三個月,可通過模型配置設置進行訪問。

基于過往對話、上傳文件及已連接Gmail的增強個性化功能,正在向網頁端的Plus和Pro用戶推出,即將登陸移動端,并計劃在未來幾周內擴展至Free、Go、Business和Enterprise用戶。

記憶來源功能正在向網頁端所有ChatGPT個人版套餐用戶推出,并將很快登陸移動端。特定個性化來源的可用性可能因地區而異。

在OpenAI官宣推文下方有,網友注意到了該模型的AIME成績的提升,認為“這表面上是產品更新,實則是純粹的推理能力升級,絕不僅僅是聊天的微調。這是一種“偷偷”發布思考模型的方式?!?/p>


還有網友發現:“‘更溫暖、更簡潔’這兩點恰恰是用戶真正抱怨過的地方。有意思的是,今年最大的一次模型升級,本質上卻更像是一次‘性格補丁’?!?/p>


但也有不少網友對這次升級并不買賬,他們想要的是更實用的功能更新。甚至還有網友在懷念GPT-4o。



一、圖像解析能力提高,虛假信息減少52.5%

在內部評估中,對于涵蓋醫學、法律和金融等領域的高風險提示,GPT?5.5 Instant生成的虛假信息比GPT?5.3 Instant減少了52.5%。在用戶曾標記存在事實錯誤的特別具有挑戰性的對話中,它也減少了37.3%的不準確說法。

GPT-5.5 Instant提升了圖像解析、STEM學科(科學、技術、工程和數學)問答水平,還可智能判斷是否調用網絡搜索,從而給出更優質的回復。

從案例中可以看出,GPT?5.5 Instant一開始認可了錯誤的解法,但隨后發現將x=3代回原方程時不成立。它識別出了實際的代數錯誤(用戶移項有誤),然后使用求根公式得出了正確的解。


而GPT?5.3 Instant雖然也發現了x=3不成立,但就此止步,錯誤地得出沒有實數解的結論,而不是重新檢查代數步驟并求解修正后的二次方程。


二、回答更緊湊,字數減少30.2%

此外,GPT?5.5 Instant的回答更加緊湊、切中要點,同時在保持溫暖感和個性化。

該模型能夠在傳達相同信息且更具實用性的同時,減少冗長和過度格式化導致的回答過長問題。其還會減少不必要的追問,并避免如隨意添加表情符號等讓回答顯得雜亂。



GPT?5.5 Instant使用的字數減少了30.2%,行數減少了29.2%。其回答語氣把握得當:非正式、實用且適合工作場合,同時避免了過度解釋。該模型針對不同情況提供了可實際使用的腳本,始終圍繞“界限”來闡述問題。

GPT?5.3的回答則更完整,尤其是“不要做什么”的部分,但對于一個非正式的日常建議類提示來說,略顯過于復雜,其結構和推敲程度可能超出了用戶的實際需求。

三、自動檢索歷史對話,記憶來源功能全系上線

GPT?5.5 Instant還能利用過往聊天記錄、上傳的文件以及Gmail中的上下文信息,從而使回答更具個性化。

該模型可智能判斷何時融入個性化元素以優化回復,同時其檢索歷史對話、匹配上下文的速度大幅提升,無需用戶反復重復表述。



可以看到,GPT?5.5 Instant的回答能夠更好地引用過往對話和相關的已連接數據,從而提供更細致、高度個性化的建議。而GPT?5.3 Instant的回答雖然考慮到了用戶位于舊金山這一因素,但對于推薦嘗試的地方,給出的建議仍較為籠統。

ChatGPT全系模型現已上線記憶來源功能。用戶可查看個性化回答所引用的上下文依據,并獲得自主管控權限。

當模型生成個性化回復時,用戶能夠追溯答案所依托的具體上下文,包括已保存記憶及歷史對話記錄;對于過時、失效或無關的信息,可隨時進行刪除與更正。

此外,用戶分享對話內容時,記憶來源信息不會對外展示。同時該功能支持多種隱私管控方式:可單獨刪除不愿被引用的歷史對話,在設置界面編輯或清空已保存記憶,也可使用臨時對話模式,全程不調用、不更新個人記憶。


結語:交互質量與用戶可控性提升

在基礎能力趨于收斂的背景下,“怎么讓模型回答地更讓用戶舒服?”成為大模型廠商思考的問題。

GPT?5.5 Instant的更新給出了OpenAI的答案::其一,其減少了在專業知識問答方面的幻覺率;其二,回答的簡潔度與語氣調控被納入優化目標;其三,記憶來源功能建立信任基礎。

客觀而言,這類“體驗型更新”難以通過傳統基準測試完全量化其價值,其真實效果還將取決于用戶在長期使用中的主觀感受。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
五一假期突傳噩耗!4位名人相繼離世,平均年齡未滿60令人惋惜

五一假期突傳噩耗!4位名人相繼離世,平均年齡未滿60令人惋惜

李橑在北漂
2026-05-06 02:48:47
《暗黑4》真有奶牛關!過程復雜到喪心病狂!

《暗黑4》真有奶牛關!過程復雜到喪心病狂!

游民星空
2026-05-06 10:06:27
楊紫連續10年為張一山慶生,22年神仙友誼,一句“主食”看哭全網

楊紫連續10年為張一山慶生,22年神仙友誼,一句“主食”看哭全網

橙星文娛
2026-05-06 09:34:14
墨菲警告英政府:中國人15年里給斯諾克砸了太多錢 趕緊抄作業吧

墨菲警告英政府:中國人15年里給斯諾克砸了太多錢 趕緊抄作業吧

風過鄉
2026-05-06 07:19:53
“你是30歲,不是3歲!”寶媽穿幼態褲子開家長會,被網友群嘲

“你是30歲,不是3歲!”寶媽穿幼態褲子開家長會,被網友群嘲

蝴蝶花雨話教育
2026-05-06 00:05:05
5月5日俄烏:“火烈鳥”導彈又發威了

5月5日俄烏:“火烈鳥”導彈又發威了

山河路口
2026-05-05 19:14:35
美衛生部長夫人吐槽老公早餐:每天牛排酸菜,熏死人!卻意外把法國酸菜廠整脫銷?

美衛生部長夫人吐槽老公早餐:每天牛排酸菜,熏死人!卻意外把法國酸菜廠整脫銷?

新歐洲
2026-05-05 18:47:19
一女游客體驗景區懸崖秋千項目高空墜落,景區公告臨時閉園,當地回應

一女游客體驗景區懸崖秋千項目高空墜落,景區公告臨時閉園,當地回應

極目新聞
2026-05-05 18:58:13
1987年法國影星阿蘭德龍訪華時,與中國演員們的珍貴合影。

1987年法國影星阿蘭德龍訪華時,與中國演員們的珍貴合影。

草莓解說體育
2026-05-06 08:37:32
小松挖掘機,是怎么把中國市場“拱手相讓”的?

小松挖掘機,是怎么把中國市場“拱手相讓”的?

奔流財經社
2026-05-05 08:13:15
貝弗利:韋德希望看到哈登輸掉搶七,騎士輸了他肯定要發推的

貝弗利:韋德希望看到哈登輸掉搶七,騎士輸了他肯定要發推的

懂球帝
2026-05-06 10:53:11
陳皮加它一起煮,倒頭就睡還疏肝寧神,我靠這招睡飽覺氣色好

陳皮加它一起煮,倒頭就睡還疏肝寧神,我靠這招睡飽覺氣色好

江江食研社
2026-03-10 14:13:03
公安部提醒:換身份證后別急著走!這3個關鍵步驟多數人忽略

公安部提醒:換身份證后別急著走!這3個關鍵步驟多數人忽略

老特有話說
2026-05-04 16:04:22
連續3場3-0橫掃!國乒男團完勝澳大利亞,強勢躋身世乒賽16強

連續3場3-0橫掃!國乒男團完勝澳大利亞,強勢躋身世乒賽16強

全景體育V
2026-05-05 18:28:04
73年人生謝幕,她于2026年4月28日安詳離去

73年人生謝幕,她于2026年4月28日安詳離去

阿廢冷眼觀察所
2026-05-05 11:57:43
哈登帶不動!騎士不敵活塞,揪出頭號罪魁禍首,賽后三大壞消息

哈登帶不動!騎士不敵活塞,揪出頭號罪魁禍首,賽后三大壞消息

越嶺尋蹤
2026-05-06 09:52:27
四川廣安華鎣市瑪琉巖探險公園,女游客蕩秋千墜崖:景區閉園

四川廣安華鎣市瑪琉巖探險公園,女游客蕩秋千墜崖:景區閉園

阿昌走遍中國
2026-05-06 00:27:22
1958年毛澤東視察濟南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

1958年毛澤東視察濟南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

史海孤雁
2026-05-05 17:07:19
上海人去崇明再也不怕堵路上!直達地鐵今年年內將通車,這些景點終于藏不住了

上海人去崇明再也不怕堵路上!直達地鐵今年年內將通車,這些景點終于藏不住了

新民晚報
2026-05-05 16:35:04
塞爾:老佛爺不會現場觀戰國家德比;穆里尼奧將成為皇馬主帥

塞爾:老佛爺不會現場觀戰國家德比;穆里尼奧將成為皇馬主帥

懂球帝
2026-05-06 11:03:21
2026-05-06 12:12:49
智東西 incentive-icons
智東西
智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
11743文章數 117061關注度
往期回顧 全部

科技要聞

告別廢話文學與幻覺!GPT-5.5 Instant發布

頭條要聞

牛彈琴:高市終于下跪了 中韓等亞洲人內心感到氣憤

頭條要聞

牛彈琴:高市終于下跪了 中韓等亞洲人內心感到氣憤

體育要聞

全世界都等著看他笑話,他帶國米拿下冠軍

娛樂要聞

神仙友誼!楊紫連續10年為張一山慶生

財經要聞

人形機器人七小龍:誰真能賣 誰在講故事?

汽車要聞

吉利原生新能源越野架構亮相 AI如何帶來極致越野

態度原創

旅游
親子
本地
游戲
軍事航空

旅游要聞

營收同比增長78.64%!東平縣五一文旅市場活力迸發

親子要聞

四個半月大的寶寶過隧道,下一秒表情亮了…… #睡個好覺

本地新聞

用青花瓷的方式,打開西溪濕地

大爆料!PS6掌機內存規格曝光!幾乎不拖累主機性能

軍事要聞

特朗普威脅伊朗不要向美國船開火

無障礙瀏覽 進入關懷版