網易首頁 > 網易號 > 正文 申請入駐

ChatGPT Images 2.0發布!碾壓谷歌Nano Banana,設計真要完了

0
分享至



編輯:Panda、Youli

北京時間凌晨 3 點,直播準時開始,OpenAI 發布了 ChatGPT Images 2.0。



  • 直播鏈接:https://openai.com/zh-Hans-CN/live/

據介紹,「ChatGPT Images 2.0 是下一步進化:一個最先進的模型,能夠處理復雜的視覺任務,并生成精確、可直接使用的視覺內容。」

似乎也正因為此,OpenAI 發布的官方博客內容還提供了兩個版本(圖像模式與經典模式),其中圖像模式下的內容完全是由該模型生成的!



  • 博客地址:https://openai.com/index/introducing-chatgpt-images-2-0/

在博客中,OpenAI 表示:「圖像是一種語言,而不是裝飾。好的圖像,就像好的句子一樣,會進行選擇、組織與呈現。它可以解釋機制,營造氛圍,驗證想法,或構建論證。」

ChatGPT Images 2.0 模型在細致遵循指令方面實現了質的躍遷,能夠準確放置與關聯對象,并渲染高密度文本,同時支持多種寬高比生成。它在構圖與視覺審美上的能力,使輸出不再像「AI 生成」,而更像「有意設計」。

并且其在多語言環境下同樣表現準確,并能利用擴展的視覺與世界知識為你補全細節,從而以更少提示詞獲得更智能的圖像。

為應對最復雜的任務,Images 2.0 首次引入「思考能力」。在 ChatGPT 中選擇 thinking 或 pro 模型時,Images 2.0 可以聯網獲取實時信息,從一個提示生成多張不同圖像,并對自身輸出進行復核。借助「思考」,模型能夠承擔從想法到圖像之間更多的工作,尤其在準確性、時效性、一致性與視覺統一性至關重要時。

結合 OpenAI 推理模型的智能與對視覺世界的深刻理解,這一模型將圖像生成從「渲染」提升為「策略性設計」,從工具進化為視覺系統,幫助人們將想法轉化為可理解、可分享、可教學、可構建的成果。

該能力已從今日起向 ChatGPT、Codex 與 API 的所有用戶開放。

更高的精度與控制力

Images 2.0 為圖像創作帶來了前所未有的具體性與還原度。它不僅能構思更復雜的圖像,還能有效將其實現,能夠嚴格遵循指令,保留關鍵細節,并渲染以往模型容易失真的精細元素:小文本、圖標、UI 元素、高密度構圖以及細微風格約束。在 API 中最高支持 2K 分辨率。結果不再是「差不多」,而是「可以直接使用」。

注意看,下面這張截圖整體上其實是 Images 2.0 生成的!



更強的多語言能力

以往圖像生成模型在英語及拉丁字母語言中表現更穩定,但在其他語言,尤其是復雜或密集文本時精度較低。

Images 2.0 突破了這一限制,在多語言理解上顯著增強,尤其是在日語、韓語、中文、印地語與孟加拉語的文本渲染方面有明顯提升。它不僅能正確生成非英語文本,還能保證語言表達自然流暢。



這不僅意味著翻譯標簽,而是讓語言本身成為設計的一部分,從海報、說明圖,到圖解與漫畫,都能實現視覺與語言的統一。這使模型具備更強的全球適用性,讓用戶能夠在真實使用的語言環境中創作視覺內容。

在直播中,OpenAI 圖像研究團隊的成員陳博遠展示了一個案例,他給出提示詞:「Make a artisitic marketing poster for a fictional OpenAI bakery.The poster should be inJapanese language.」



結果生成的海報完全符合提示詞,且在細節上也能夠做到精準。



「它非常擅長遵循非常詳細的指令,所以如果你有非常具體的品牌語言、設計美學 —— 所有那些對創意工作至關重要的東西 —— 你都可以使用 ChatGPT 來創建和完善你的想法,從而得到你想要的結果。」陳博遠說道。

更成熟的風格表達與真實感

Images 2.0 在多種視覺風格上的還原度顯著提升。它更擅長捕捉照片的關鍵特征,包括那些增強真實感的微小瑕疵,同時也能穩定呈現電影感畫面、像素藝術、漫畫等多種視覺語言,在紋理、光影、構圖與細節上更一致。



因此,模型輸出更貼近指定風格,而非近似模仿。這對于游戲原型設計、分鏡制作、營銷創意,以及特定媒介或類型的資產創作尤為有價值。

靈活的寬高比

新模型在輸出形式上更靈活,支持從 3:1 到 1:3 的多種寬高比,可直接適配橫幅、演示文稿、海報、手機界面、書簽及社交媒體圖形等不同場景。你可以在提示中指定寬高比,或通過預設選項將已有圖像重新生成至新的尺寸。

下面展示了兩個非常規寬高比的示例:





更強的現實世界理解

Images 2.0 引入了截至 2025 年 12 月的知識,使生成結果在相關性與語境準確性上更進一步。這對于說明圖、教育圖形與可視化總結尤為關鍵,因為在這些場景中,正確性與清晰度與美觀同樣重要。

其智能能力還體現在端到端任務處理上:整合信息、撰寫內容,并以清晰結構、合理留白與良好視覺流進行排版。



視覺思考伙伴

在 ChatGPT 中啟用 thinking 模型后,系統會在后臺進行更深入的理解與執行。它可以聯網檢索信息,將上傳材料轉化為清晰的視覺說明,并在生成前對圖像結構進行推理。

在這種模式下,Images 2.0 更像一個視覺思考伙伴,幫助你將初步概念推進為完整成品,大幅降低工作量。



它還支持一次生成多張不同圖像,這在 ChatGPT 圖像生成中尚屬首次。這使得諸如多頁漫畫、整屋設計方案、系列海報或多語言多尺寸社交素材等工作流變得高效可行。

你無需逐張生成再手動拼接,只需一次請求,即可獲得最多八張在角色與元素上保持一致、且具有連續性的輸出。



在 Codex 中使用圖像生成

Images 能力被整合進 Codex,使視覺創作、迭代與交付在同一工作空間內完成,拓展了其在設計、營銷、產品、銷售及學習等領域的應用。

例如,你可以快速生成多種 UI 方向與原型,比較方案,并將最佳設計直接轉化為產品或網頁體驗,無需離開 Codex。通過 ChatGPT 訂閱即可使用,無需額外 API 密鑰。

通過 API 將圖像能力嵌入產品

開發者與企業可通過 gpt-image-2 API 將這些能力集成進自身產品,在現有工作流中加入高質量圖像生成與編輯能力。

憑借更強的文本渲染、多語言生成、指令遵循能力,以及更多輸出格式與寬高比支持,API 更易于構建真實業務場景中的圖像工作流,例如本地化廣告、信息圖、說明圖、教育內容、設計工具、創意平臺及網頁生成產品。

局限性

OpenAI 也在博客中提到了該模型的局限性:盡管 Images 2.0 是重要進步,但仍不完美。對于需要完整物理世界建模的任務(如折紙教程、魔方等復雜結構),以及隱藏面、傾斜面或反向表面的精確細節,模型仍可能表現不足。

極高密度或重復性細節(如細沙)也可能帶來挑戰。標簽與圖示在涉及精確箭頭或部件標注時,仍建議人工校對。

這些都是未來改進的重要方向。



在 API 中,超過 2K 的輸出目前仍處于測試階段,可能出現不穩定情況。

定價與可用性

ChatGPT Images 2.0 今日起已向所有 ChatGPT 與 Codex 用戶開放。具備「思考」能力的高級輸出對 ChatGPT Plus、Pro 與 Business 用戶提供。

gpt-image-2 模型已在 API 中提供,價格根據圖像質量與分辨率有所不同。



OpenAI 也在官網上線了大量案例,感興趣的讀者可自行前往查看。

我們也進行了一些簡單測試,比如讓其生成了一張中國高考數學試卷第 2 頁,看著還行:



實測中,我們可以在頁面上看到 ChatGPT Images 2.0 生成一張圖片通常會經歷多個步驟:創建→打個草稿→生成初稿→搭建場景→打磨細節→收尾→最后潤色→最后微調。

接下來我們繼續,「生成一張《將敬酒》繁體中文草書書法作品,寬高比 3:1,內容是李白的《將敬酒》全文。落款是 ChatGPT Images 2.0」:



不過很顯然該模型并沒有生成完整,且也明顯不是草書。

最后來一頁閃電五連鞭的功夫招式圖解說明:



還挺有趣。

整體體驗下來,我們感覺 ChatGPT Images 2.0 確實比目前的 Nano Banana 2 強大不少;看看接下來谷歌如何接招。

你試過 ChatGPT Images 2.0 了嗎?感覺如何?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
豆芽立大功!浙科大實證:豆芽可通過菌群代謝,減少84%腹部脂肪!

豆芽立大功!浙科大實證:豆芽可通過菌群代謝,減少84%腹部脂肪!

科學認識論
2026-04-20 14:45:02
樁長竟比設計短了9米多!浙江交工被中山市交通運輸局罰款

樁長竟比設計短了9米多!浙江交工被中山市交通運輸局罰款

南方都市報
2026-04-21 15:20:13
寧德時代CTO:25萬元以上電動車用磷酸鐵鋰電池,就是變向減配

寧德時代CTO:25萬元以上電動車用磷酸鐵鋰電池,就是變向減配

觀察者網
2026-04-21 20:09:04
馬筱梅重溫生產日,繼續拆婆婆張蘭的臺,網友:好賴話都聽不明白

馬筱梅重溫生產日,繼續拆婆婆張蘭的臺,網友:好賴話都聽不明白

悅君兮君不知
2026-04-20 10:30:17
唯品會蹲到半價薩洛蒙,才發現了這個世界的信息差

唯品會蹲到半價薩洛蒙,才發現了這個世界的信息差

接近真理玩數碼
2026-04-21 20:37:01
1990年,德國為了統一不得不放棄19萬平方千米的土地,并寫進憲法

1990年,德國為了統一不得不放棄19萬平方千米的土地,并寫進憲法

顧史
2026-04-20 08:46:08
蒙古國新總理大權到手,對華態度不簡單,剛上臺就提4年前的約定

蒙古國新總理大權到手,對華態度不簡單,剛上臺就提4年前的約定

樂天閑聊
2026-04-22 12:34:54
美國提三大要求全被中國拒絕!特朗普放狠話:中國有牌,美國也有

美國提三大要求全被中國拒絕!特朗普放狠話:中國有牌,美國也有

娛樂的宅急便
2026-04-22 11:23:38
被豆包害慘了的大學生們!網友:豆包就是愚蠢且勤勞的老實人

被豆包害慘了的大學生們!網友:豆包就是愚蠢且勤勞的老實人

夜深愛雜談
2025-12-02 20:51:10
她虐待男友3歲兒子致死被判死緩!孩子的生父、爺爺奶奶也該獲刑

她虐待男友3歲兒子致死被判死緩!孩子的生父、爺爺奶奶也該獲刑

音樂時光的娛樂
2026-04-21 19:08:13
李湘瘦成第二個賈玲!半年狂甩五十斤,用狠勁把自己拉回上場門檻

李湘瘦成第二個賈玲!半年狂甩五十斤,用狠勁把自己拉回上場門檻

阿訊說天下
2026-04-22 12:28:23
票數斷層碾壓!亞歷山大獲獎了!!

票數斷層碾壓!亞歷山大獲獎了!!

柚子說球
2026-04-22 09:11:30
據美高官透露,伊朗在過去48小時內,應是發生了一場“內部政變”

據美高官透露,伊朗在過去48小時內,應是發生了一場“內部政變”

阿七說史
2026-04-20 15:13:06
5200萬鎊+球員互換!曼聯這次玩真的?紅魔為皇馬真核豁出去了

5200萬鎊+球員互換!曼聯這次玩真的?紅魔為皇馬真核豁出去了

奶蓋熊本熊
2026-04-22 01:02:35
砸下1.2萬億,爆改3個三峽!西藏奪命公路墨脫公路為何一定要修?

砸下1.2萬億,爆改3個三峽!西藏奪命公路墨脫公路為何一定要修?

樂天閑聊
2026-04-19 19:00:11
肝脂降低20%!復旦研究:這樣吃,僅需三個月,超8成人脂肪肝好轉

肝脂降低20%!復旦研究:這樣吃,僅需三個月,超8成人脂肪肝好轉

思思夜話
2026-04-21 11:18:45
重磅 | 2024年中國惡性腫瘤流行情況發布

重磅 | 2024年中國惡性腫瘤流行情況發布

腫瘤醫學論壇
2026-04-21 20:13:03
他是孫中山的副官,36歲成中共首任軍委主席,被槍決時大喊7個字

他是孫中山的副官,36歲成中共首任軍委主席,被槍決時大喊7個字

簡史檔案館
2026-03-16 11:05:03
大廠程序員失業一年,離婚率高達90%?

大廠程序員失業一年,離婚率高達90%?

燈錦年
2026-04-20 16:52:48
連續三個一字跌停!8天暴跌近40%,18萬散戶被悶殺,想跑都跑不掉!

連續三個一字跌停!8天暴跌近40%,18萬散戶被悶殺,想跑都跑不掉!

股市皆大事
2026-04-22 12:42:27
2026-04-22 13:47:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12829文章數 142633關注度
往期回顧 全部

科技要聞

凌晨突發!ChatGPT Images 2.0發布

頭條要聞

KTV服務員被指強奸14歲女生 官方通報

頭條要聞

KTV服務員被指強奸14歲女生 官方通報

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

復婚無望!baby黃曉明陪小海綿零交流

財經要聞

伊朗拒絕出席 特朗普宣布延長停火期限

汽車要聞

純電續航301km+激光雷達 宋Pro DM-i飛馳版9.99萬起

態度原創

藝術
旅游
家居
教育
健康

藝術要聞

無花不風景

旅游要聞

春和景明 來賞讀高平版的春天

家居要聞

極簡繪夢 克制和諧

教育要聞

2026 成都新初高中大爆發!七中 、 樹德、 西川、北二外領銜,9 月集體亮相!

干細胞抗衰4大誤區,90%的人都中招

無障礙瀏覽 進入關懷版