編譯 | 鄭麗媛
出品 | CSDN(ID:CSDNnews)
OpenAI 又更新了,而且這次節奏快得讓整個行業有點來不及喘氣。
就在今天凌晨,OpenAI 正式發布 GPT-5.5,官方給它的定位相當直接:迄今最聰明、最直覺、最適合真實工作的模型。比起上個月才亮相的 GPT?5.4,這個新版本不僅僅是聰明了一點——它在編程、知識工作、科學研究甚至網絡安全上都跨了一大步。
![]()
更關鍵的是,OpenAI 聯合創始人兼總裁 Greg Brockman 在媒體電話會上放出一個信號:GPT?5.5 讓公司離他們心心念念的“超級應用(Super App)”又近了一步。
如果你還記得,Sam Altman 和 Greg Brockman 之前就多次提到過想把 ChatGPT、Codex 和 AI 瀏覽器揉成一個統一服務,專門給企業客戶當“萬能工具箱”。有趣的是,“超級應用”也是 Elon Musk 的執念——他早就想把 X(原 Twitter)搞成同樣的東西。
看來,這兩個老同事在“大一統 App”這個賽道上也要正面剛上了。
![]()
又快又省:GPT?5.5 的“腦力”升級
相比上個月發布的 GPT?5.4,GPT?5.5 在智能水平上再上一個臺階,但速度絲毫沒有妥協。OpenAI 首席科學家 Jakub Pachocki 直言:“短期來看,我們能觀察到相當顯著的改進;中期來看,改進會極其顯著。實際上,我認為過去兩年的進展反而出奇地慢。”
具體來說,GPT?5.5 在實際服務中保持了與 GPT?5.4 相同的單 token 延遲,但完成同樣任務所需的 token 數量大幅減少。這意味著它更聰明,也更經濟。例如,在 Artificial Analysis 的編程指數中,GPT?5.5 僅用競爭對手一半的成本就達到了最頂尖的智能水平。
![]()
Greg Brockman對此形象總結道:“它(GPT?5.5)是一個更快、更敏銳的思考者,消耗的 token 卻比 5.4 更少。這意味著,更多的前沿 AI 能力可以同時服務于企業和消費者——這正是我們的目標之一。”
![]()
“迄今最強的代理編程模型”
OpenAI將 GPT?5.5 定位為“迄今最強的代理編程模型”,一系列基準測試結果相當硬核:
● Terminal?Bench 2.0(復雜命令行工作流):準確率 82.7%,業內頂尖。
● SWE?Bench Pro(真實 GitHub 問題解決):58.6%,一次性端到端解決的問題數超過以往任何模型。
● Expert?SWE(OpenAI 內部評估長期編碼任務的基準,中位預估人類需要 20 小時):同樣超越 GPT?5.4。
![]()
![]()
更讓人印象深刻的是,GPT?5.5 在 Codex 環境中已經能承擔從實現、重構到調試、測試、驗證的全流程工程工作。有早期測試者反饋,它理解系統整體結構的能力明顯變強:能判斷為什么某功能失敗、修復該落在哪里、以及代碼庫中還有哪些地方會受影響。
Every 公司 CEO Dan Shipper 評價道:“這是我用過的第一個具備真正概念清晰度的編程模型。”他甚至做了一個實驗:給 GPT?5.5 一個已經出故障的應用狀態,看它能否復現公司頂級工程師后來采用的修復方案——結果GPT?5.4 做不到,但 GPT?5.5 做到了。
MagicPath 的 CEO Pietro Schirano 也分享了一個案例:GPT?5.5 只用了大約 20 分鐘,就一次性將一個包含數百個前端和重構變更的分支合并到另一個同樣變動巨大的主分支中。英偉達一位提前使用該模型的工程師甚至說:“沒了 GPT?5.5,感覺就像斷了一條手臂。”
![]()
知識工作與科研:不止于碼農
OpenAI 首席研究官 Mark Chen 強調,GPT?5.5 的進步遠不止于編程。在知識工作領域,如生成文檔、表格、幻燈片、運營研究、財務建模,它同樣比前代更強。當與 Codex 的“計算機使用”能力結合時,GPT?5.5 幾乎可以像人一樣“看到屏幕、點擊、輸入、導航”,在不同工具間精確切換。
據官方介紹,OpenAI 內部已經在真實工作流中大規模使用。目前公司超過 85% 的員工每周都會用 Codex,涵蓋財務、公關、市場、數據科學等職能。例如:
● 公關團隊用 GPT?5.5 分析了六個月的演講請求數據,搭建了一個自動化 Slack 代理,低風險請求全自動處理,高風險請求再轉人工。
● 財務團隊用它審核了 24771 份 K-1 稅務表格,總計 7 萬多頁,比前一年快了整整兩周。
● 市場團隊有人把每周業務報告生成自動化,每周省下 5 到 10 個小時。
在科學研究方面,GPT?5.5 的表現同樣令人眼前一亮。它在 GeneBench(遺傳學多階段數據分析)和 BixBench(生物信息學真實世界數據分析)上都取得了領先成績。
![]()
![]()
更驚人的是,一個內部版本的 GPT?5.5 甚至幫助發現了關于拉姆齊數的新證明,這是組合數學中一個極為艱深的領域——該證明后來在 Lean 中得到了驗證,成為 GPT?5.5 不僅能寫代碼、還能貢獻原創數學論證的里程碑案例。
除此之外,杰克遜基因組醫學實驗室的免疫學教授 Derya Unutmaz 用 GPT?5.5 Pro 分析了一個 62 樣本、近 28,000 個基因的數據集,生成了一份詳細的研究報告。他說:“這項工作原本需要我的團隊花費數月。”
![]()
推理效率的秘密:模型幫模型“打工”
一個有趣的細節是,GPT?5.5 在服務效率上的提升,居然也借用了模型自己的能力。
OpenAI 透露,為了讓 GPT?5.5 保持與 GPT?5.4 相同的延遲,他們重新設計了整個推理系統,并專門與 NVIDIA GB200/GB300 NVL72 系統進行了協同設計和訓練。
其中一項關鍵優化是負載均衡和分區算法。過去,系統會將請求拆成固定數量的塊來均衡負載,但這種方式不能適應所有流量模式。于是,他們讓 Codex 分析了數周的生產流量,并編寫了自定義啟發式算法來優化分區和負載分配——這一改進直接將 token 生成速度提高了 20% 以上。
用 OpenAI 自己的話說:“模型幫助改進了服務它的基礎設施。”
![]()
再次對標 Anthropic:網絡安全大戰升級
隨著模型能力增強,安全風險也在上升。為此 OpenAI 在 GPT?5.5 上部署了迄今為止最嚴格的防護措施,包括針對高級生物學和網絡安全能力的專項測試。在公司的“準備框架”中,GPT?5.5 的生物/化學和網絡安全能力都被評定為“高風險”級別,但尚未達到“關鍵風險”。
![]()
針對網絡安全,OpenAI 采取了“信任訪問”模式。從 Codex 開始,經過驗證、滿足特定信任信號的用戶可以獲得更少限制的 GPT?5.5 網絡安全能力訪問。負責保護關鍵基礎設施的組織也可以申請使用類似 GPT?5.4?Cyber 的模型來加固內部系統。
此次 OpenAI 發布 GPT?5.5 自然也繞不開老對手 Anthropic。在媒體會上有記者提問:GPT?5.5 會不會有類似 Anthropic 最近發布的網絡安全工具 Mythos 的能力(Mythos 最近因未經授權訪問事件引發爭議)?
對此,OpenAI 技術人員 Mia Glaese 回應說:“GPT-5.5 將顯著提升 OpenAI 在數字防御方向的模型部署能力,OpenAI 在網絡安全領域也有強大且長期的策略,并且已經完善了一種穩健的方法來安全地推出模型。”
![]()
定價與可用性:更貴,但更省 token
GPT?5.5 從 4 月 24 日起逐步開放。在 ChatGPT 中,Plus、Pro、Business、Enterprise 用戶均可使用;GPT?5.5 Pro 則面向 Pro、Business、Enterprise 用戶。
在 Codex 中,GPT?5.5 對 Plus、Pro、Business、Enterprise、Edu 和 Go 套餐用戶開放,上下文窗口 400K,還有快速模式(速度快 1.5 倍,成本 2.5 倍)。
API 也即將上線:
● GPT?5.5:每百萬輸入 token5 美元,每百萬輸出 token30 美元,上下文窗口 1M。
● GPT?5.5-Pro:每百萬輸入30 美元,每百萬輸出180 美元。
雖然 GPT?5.5 單價比 GPT?5.4 高,但OpenAI強調,由于 token 效率大幅提升,大多數用戶的實際開銷反而可能更低。
最后,如果只把 GPT-5.5 看成是一次模型升級,可能低估了這次發布。此次發布最重要的信息可能不是參數提升,也不是 benchmark 分數,它真正透露的趨勢是:過去 AI 公司賣的是模型能力;未來 AI 公司賣的,可能是完整工作結果。
正如Greg Brockman 所說:“這個模型代表著我們所期待未來計算方式的一次實質性進展,當然這只是其中一步,未來還會有很多步。”通過 GPT-5.5 的發布,OpenAI 正越來越明確地展示自己的終局路線:
不只是提供一個最強模型,而是打造一個整合聊天、編程、瀏覽器、辦公、企業服務的 AI 超級平臺。
原文鏈接:https://openai.com/index/introducing-gpt-5-5/
「粉絲專屬回饋:60+ 頂級大廠 AI 實戰 PPT 限時領!」
2026 奇點智能技術大會·上海站圓滿落幕!整整兩天,CSDN 與奇點智能研究院攜手,把“AI 正在如何重塑軟件開發”徹底攤開講透了。
這不僅僅是一場會議,更是一份關于未來的答案。從 NVIDIA、微軟、Google 的全球視野,到華為、阿里、騰訊、京東、網易、快手、昆侖萬維的本土實踐;從月之暗面、階躍星辰、MiniMax 的獨角獸洞察,再到北大、智源、奇點智能研究院的前沿探索。
Agent 正在成為新入口,軟件形態正在被重寫。
錯過了現場?沒關系!為回饋粉絲,我們特將本次大會的高質量演講 PPT 完整打包。
領取方式: 在公眾號后臺私信發送 「奇點」 二字,即可一鍵獲取全套干貨。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.