无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

GPT-5.5 深夜發布!它不是最好用的,但就是現在最強的 AI

0
分享至

昨晚我就有個預感,覺得 OpenAI 可能要放點大招了。

結果,我半夜起來上廁所時看了一眼手機,GPT-5.5 發布了,頓時睡意全無。

光看過去一周時間,全世界這些頂級 AI 公司都是模型連發,根本應接不暇,或許留給人類的智力空間真的在縮小。


目前,GPT-5.5 已經可以在 ChatGPT 和 Codex 里用了,但需要 Plus 以上的會員。

也就是說,你至少需要花 20 美金一個月的價格才能體驗到這個可能是目前最強的 AI 模型。

我第一時間用了下,感受就是它的確很強,但并不是我自己覺得目前最好用的。

我先說下它到底哪里強,然后再給你們看幾個我自己用 GPT-5.5 做的案例。

在 OpenAI 介紹 GPT-5.5 的官網上,他們在模型底下寫上了這么一句話「A new class of intelligence for real work」。


意思很明顯了,這是專為解決真實工作問題而生的新一代智能模型。

怎么理解呢?

用大白話說,就是 GPT-5.5 在完成工作任務上的效率比其他模型更高,而成本反而會更低。

先看官方發布的一個多領域測試榜單,不理解那些英文沒關系,你只要知道這里面基本涵蓋了日常工作、科研、工具使用的方方面面。

重點看 GPT-5.5 和 Claude Opus 4.7 的對比,因為這就是巔峰比拼。


可以看到,GPT 基本是完勝 Claude 的。

我就挑幾個跟我們普通打工人有關的測試來跟你們說下,看看 GPT-5.5 到底有多強。

下面這個是一個叫 GDPval 的測試,它模擬的是讓 AI 在 44 個職業領域中完成知識型工作,GPT-5.5 的得分是 84.9%。


還原到現實工作場景中,意思就是使用這個模型來完成各領域的知識型工作的能力會更強。

比如,產品經理分析需求、做競品報告、做原型設計、分析數據,創作者做內容,財務分析以及文檔寫作、PPT設計等。

再就是 GPT-5.5 的編碼能力。

你們可能會好奇,為什么每家 AI 大廠發新模型是都喜歡強調自己的編碼能力?

其實很簡單,因為編程往往是解決復雜問題,這能很好考察模型的問題分析、路徑規劃、方案執行能力,還有就是解決問題的成功率。

過去有些模型是很強,也能編程,但是需要人和它互動調教很多次才能搞定。

現在的新 AI 模型,講究的是自我分析、自我規劃、自我執行,人為的干預越少越好。

GPT-5.5 現在主打的 Agentic Coding 就是這個意思,說白了就是讓 AI 自己干。

在官網給出的測試基準里,5.5 是全面超過之前的 5.4 版本的。


當然,還有一個原因,就是編碼工作是為 AI 付費的一大主流場景。

GPT-5.5 里還有一個重要信息,就是在完成特定任務的基礎上,消耗 Token 和 5.4 持平,但是效率和成功率更高。

這么一來,實際消耗的 Token 是減少的,因為過去你可能需要多輪會話才能搞定一件事,現在一次就可以搞定了。

還有,GPT-5.5 的工具調用和對電腦的視覺化操作能力也是目前最強的。


尤其是對電腦的視覺化操作,這是未來 Agent 來替我們完成實際工作的很重要的標準。

也就是說,如果給 OpenClaw 或者 Hermes 配上 GPT-5.5 的模型,他們替你干活的能力又提升了。


說了這些榜單和能力,接下來我們看幾個案例。

這是 OpenAI 自己做的一個案例,上傳了一張參考圖,然后讓 GPT 自己做一個基于真實數據的太空軌跡應用,里面展示了地球、月球、獵戶座的動效軌跡。


提示詞:Implement this as a new app using webgl and vite using real data from the artemis II mission. Make sure to test the app thoroughly until it is fully functional and looks like the app in the picture. Pay close attention to the rendering of the planets and fly paths. I want to be able to interact with the 3D rendering. Ensure it has realistic orbital mechanics.

我覺得,這個做出來的效果還是挺強的。

然后再給你們看一下我自己用 GPT-5.5 做的一套高保真原型圖,而且是帶頁面交互效果的。

原始需求就是我的一句話。

提示詞:設計一套關于健康管理App的高保真原型頁面,帶交互,產品名字是EasyLife,核心功能包括注冊、登錄、主頁、個人身體數據顯示,包括一些圖表等。設計風格帶圓角,整體簡潔風。

注意,在這段需求里,我既沒有說詳細業務邏輯,也沒有描述功能模塊,甚至單一模塊的邏輯都沒說。

丟給它自己分析、設計、執行,然后把前端代碼也寫好了。


這里面還有一個細節,我的原始需求里其實沒有「活動」和「報告」兩個模塊,但它開發出來的版本里默認帶了,只不過頁面是空的。

我點擊的時候會提示該頁面暫未開發,于是我就跟它說了這句話。


大概一兩分鐘后,它就給了我一版完整的,就是上面你們看到的那樣。

如果看過我之前文章的讀者,或許對這個案例有點印象,就是我去年減脂期間用其他 AI 產品手搓過的一個 App。

只不過當時折騰了很久,而且出來的效果不太好,現在 GPT-5.5 這個效果我覺得可以直接用了。

關鍵是,沒有多輪會話,基本是一兩步就完成了。

回到我一開始說的,GPT-5.5 確實很強,或者說就是目前最強的 AI 模型,但對我來說它不是最好用的。

原因很簡單,取決于你在什么場景下用它來干嘛?

也就是說,你的工作流是什么。

對我來說,內容創作、產品設計、咨詢業務,這些是我已經形成工作流的,所以我也用 5 個正職 AI 員工實現了自動化。

這一點,我在昨天的文章里講了。


但是,在這些工作流里并沒有一個全能模型可以勝任所有工作。

所以,我是在不同場景和需求任務下讓不同的 Agent 配不同的模型使用,就像雇有不同腦子和能力的人一樣。

比如,在內容輔助創作這一塊,我覺得目前最強的還是 Claude Opus 4.6,在 Agent 事務處理和本地化操作上,GPT-5.4 是我主要用的。

當然,接下來我有可能切換為 GPT-5.5,但考慮性價比的話,5.4 還是更合適。

在產品類工作上,我覺得 Claude 和 GPT 的表現其實差不太多,但 Claude 性價比就不是很高了。

我也用國產模型,一些事務型的工作或者 AI 團隊調度管理類的,我現在用 Kimi 和 MiniMax 比較多,還有就是 GLM。

其實不管你用什么模型,核心還是我前面說的,有沒有自己的工作流可以讓 AI 接入。

如果只是用 AI 來查查信息,聊聊天,其實用什么區別都不大。

我知道現在 AI 發展很快,很多人也會焦慮,但這種情緒并沒有什么用,關鍵是要想清楚你可以用 AI 來干嘛?

每次打開那個對話框,發現自己無所適從時,我覺得這才是真正值得深思的。

這個時代發展的速度只會越來越快,讓很多人焦慮的不是技術的進展,而是自己跟不上的那個節奏。

核心問題,在于傳統思維和認知的受限,以及信息差的存在,再加上行動能力的匱乏。

或許你們也發現了,我最近更新文章的頻率很高,有時候甚至是一天寫兩篇。

不是我時間變多了,而是我把自己放在這一輪的發展進程中,而且有了一個 AI 團隊。

我不想錯過,所以投入。

正當我寫完這篇文章時,AI 圈又發生了一件大事。

DeepSeek V4,來了!

或許,我在這篇文章里剛剛才得出的一些結論,又要被推翻了。

················· 唐韌出品 ·················

安可時刻

現在如果你們想使用 GPT-5.5 的,可以在ChatGPT里直接用,也可以在 Codex 里用,最新模型已經默認是 5.5 了。


如果你們已經有了自己的常用 AI 對話類產品,比如 Youmind 這類的,他們也會很快接入。

如果是像我一樣主要用 OpenClaw 和 Hermes 這類智能體的,一些 API 中轉平臺也已經在接入了,估計這兩天就能用上。

我準備給其中一個 AI 員工從原來的 GPT-5.4 升級為 5.5,雖然貴一點,但我還是會深度體驗測試一下。

最后,如果你不知道怎么擁抱這一輪時代級的機會,可以看看我昨天的文章。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
烏克蘭邁出危險一步,拿中國核心利益去換援助,中方是時候反擊了

烏克蘭邁出危險一步,拿中國核心利益去換援助,中方是時候反擊了

古史青云啊
2026-07-01 17:08:28
固態電池神話徹底破滅,中科院曾連發"王炸",電池行業迎來變局

固態電池神話徹底破滅,中科院曾連發"王炸",電池行業迎來變局

黑翼天使
2026-06-24 13:56:28
全網喊話“韋神” 做高考數學卷,沒想到他的一句話,就讓千萬網友瞬間服氣

全網喊話“韋神” 做高考數學卷,沒想到他的一句話,就讓千萬網友瞬間服氣

不二大叔
2026-06-29 14:33:45
日本出錢出技術,印度高鐵終于要建成了,何時能追上中國高鐵?

日本出錢出技術,印度高鐵終于要建成了,何時能追上中國高鐵?

荷蘭豆愛健康
2026-07-01 10:39:09
人活多久,睡覺就知道?醫生:壽命短的人,睡覺一般有這4個特征

人活多久,睡覺就知道?醫生:壽命短的人,睡覺一般有這4個特征

白宸侃片
2026-07-01 16:17:27
會場爆發激烈交鋒,巴拿馬對中方窮追不舍,中國大使火力全開怒懟

會場爆發激烈交鋒,巴拿馬對中方窮追不舍,中國大使火力全開怒懟

史料布籍
2026-07-01 11:54:25
溫柔如你:那不是天賦,是穿過風雨后的選擇

溫柔如你:那不是天賦,是穿過風雨后的選擇

疾跑的小蝸牛
2026-07-01 18:32:49
他是上海社保局原局長,被富豪用美色拉下馬,獲刑18年后怎樣了

他是上海社保局原局長,被富豪用美色拉下馬,獲刑18年后怎樣了

名人家事情事
2026-07-01 07:10:34
45歲李小璐終于認錯了,自曝無戲可拍,后悔自己太“戀愛腦”

45歲李小璐終于認錯了,自曝無戲可拍,后悔自己太“戀愛腦”

南萬說娛26
2026-06-30 08:45:41
首輪淘汰賽才戰罷7場,已有2個小組全軍覆沒,含德國所在死亡E組

首輪淘汰賽才戰罷7場,已有2個小組全軍覆沒,含德國所在死亡E組

智道足球
2026-07-01 17:24:21
3場5球追平挪威隊史紀錄!哈蘭德絕殺后坦言:戰勝巴西隊機會非常小

3場5球追平挪威隊史紀錄!哈蘭德絕殺后坦言:戰勝巴西隊機會非常小

紅星新聞
2026-07-01 08:20:15
女特種兵休假被人販子拐賣,當人販子美美數錢時,竟不知她已在身后

女特種兵休假被人販子拐賣,當人販子美美數錢時,竟不知她已在身后

紅豆講堂
2025-03-24 10:44:33
央視罕見公開西太對峙細節!日艦模擬攻擊遼寧艦,結果沉默?

央視罕見公開西太對峙細節!日艦模擬攻擊遼寧艦,結果沉默?

青青衫書生
2026-06-30 13:24:21
養路費迎來歷史性大調整:脫離油價捆綁,改用按實際里程計費

養路費迎來歷史性大調整:脫離油價捆綁,改用按實際里程計費

生活魔術專家
2026-07-01 10:29:08
科技龍頭扎堆“對子頂”?下半年第一天,A股畫風突變

科技龍頭扎堆“對子頂”?下半年第一天,A股畫風突變

21世紀經濟報道
2026-07-01 18:46:06
中國國際金融股份有限公司黨委書記、董事長陳亮:金融報國踐行初心使命

中國國際金融股份有限公司黨委書記、董事長陳亮:金融報國踐行初心使命

經濟日報
2026-07-01 07:31:15
原來有錢人也會抑郁啊!網友扎心道出:財務是自由了人心也看透了

原來有錢人也會抑郁啊!網友扎心道出:財務是自由了人心也看透了

墜入二次元的海洋
2026-07-01 08:54:54
我國首位香港航天員黎家盈在空間站展示香港特別行政區區旗,感謝祖國、祝福香港

我國首位香港航天員黎家盈在空間站展示香港特別行政區區旗,感謝祖國、祝福香港

政知新媒體
2026-07-01 16:00:35
"三哥,你尾款我不要了!"中國外貿人反殺印度老賴,招招絕了!

"三哥,你尾款我不要了!"中國外貿人反殺印度老賴,招招絕了!

明天后天大后天
2026-06-04 00:22:08
馬克龍沒想到,歐洲迎超40度高溫后,中國竟成法國的“救命稻草”

馬克龍沒想到,歐洲迎超40度高溫后,中國竟成法國的“救命稻草”

瀲滟晴方DAY
2026-06-30 13:53:37
2026-07-01 19:27:00
唐韌 incentive-icons
唐韌
用產品思維解決難題
1499文章數 2043關注度
往期回顧 全部

科技要聞

Claude Code被曝“植入木馬”識別中國用戶

頭條要聞

副行長借朋友名義貸款470萬 400萬自用70萬給朋友用

頭條要聞

副行長借朋友名義貸款470萬 400萬自用70萬給朋友用

體育要聞

賣球衣救子的門將,把德國撲出了世界杯

娛樂要聞

張凌赫:我連心疼你都隔著時差

財經要聞

新氧貸款:宣傳年化15%,實際頂格24%

汽車要聞

半程收官 上汽集團銷量突破200萬輛

態度原創

教育
數碼
健康
本地
公開課

教育要聞

已知AB-A=58, 求A=?B=?

數碼要聞

零刻ME Pro四盤位H255新品NAS迷你主機發布,2739元起

年糕湯圓別油炸,水煮清蒸更健康

本地新聞

強烈建議,全國高校都向這所大學看齊!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版