7月1日消息,谷歌DeepMind推出新的圖像生成模型Nano Banana 2 Lite,主打更快、更便宜:默認(rèn)模式下,從文字提示生成一張圖大約需要4秒。
據(jù)Ars Technica報(bào)道,Nano Banana 2 Lite的技術(shù)名稱是Gemini 3.1 Flash Lite Image,屬于Gemini 3.1系列。相比之下,標(biāo)準(zhǔn)版Nano Banana 2生成同類圖片大約需要20秒。谷歌稱,這是它迄今最快、成本最低的圖像模型。
![]()
便宜和快速,是拿精細(xì)度換來的
Nano Banana 2 Lite的API定價(jià)為:輸入每百萬tokens 0.25美元,文本和推理輸出每百萬tokens 1.50美元;圖片輸出按每百萬tokens 30美元計(jì)費(fèi),生成一張1K圖像約0.0336美元(約合0.23元)。相比之下,標(biāo)準(zhǔn)版Nano Banana 2的1K圖像約0.067美元,約為Lite版兩倍;Nano Banana Pro的1K/2K圖像約0.134美元,約為Lite版四倍。
這個(gè)定位很清楚:它不是給人慢慢打磨一張成片,而是給快速出圖、批量出候選方案、做原型和跑創(chuàng)意測試用的。對設(shè)計(jì)師、營銷團(tuán)隊(duì)和需要大量配圖的產(chǎn)品來說,4秒和20秒的差別,可能決定一次試錯(cuò)會(huì)不會(huì)繼續(xù)做下去。
但便宜和快速也有邊界。Ars Technica提醒,Lite版更適合快速草圖和批量試錯(cuò);如果圖片里有小號(hào)文字、價(jià)格、數(shù)據(jù)說明,或者需要同一角色在多張圖里高度一致,仍應(yīng)使用更高端模型或人工復(fù)核。所有生成圖片都會(huì)帶有SynthID隱形水印。
它更適合草圖,不適合最終物料
如果只是想快速看看一個(gè)廣告畫面、活動(dòng)海報(bào)或產(chǎn)品頁面配圖大概長什么樣,Nano Banana 2 Lite的優(yōu)勢很明顯。它把 “多試幾版” 的成本降到很低,也讓電商頁面、聊天應(yīng)用等場景中的動(dòng)態(tài)配圖更容易落地。
但如果圖片里有價(jià)格、數(shù)據(jù)、說明文字,或者品牌方需要同一個(gè)人物、同一套產(chǎn)品視覺在多張圖里保持一致,Lite版就不該被當(dāng)成最終交付工具。
視頻生成也進(jìn)入API和AI Studio
同一篇公告還提到,谷歌把Gemini Omni Flash視頻生成與編輯能力開放到Gemini API和Google AI Studio。這個(gè)模型曾在今年5月的Google I/O大會(huì)上亮相,此前已出現(xiàn)在Gemini App和Google Flow中。
這意味著,谷歌這次更新不是只加一個(gè)低價(jià)生圖模型,而是在把 “先快速生成圖片,再把圖片變成視頻” 的鏈路往開發(fā)者平臺(tái)里放。對普通用戶來說,變化會(huì)先體現(xiàn)在更快、更便宜的圖片和視頻應(yīng)用里;對創(chuàng)作者和營銷團(tuán)隊(duì)來說,真正要盯住的仍然是錯(cuò)誤文字、錯(cuò)誤數(shù)據(jù)和角色跑偏這些老問題。(易句)
(本文由AI翻譯,網(wǎng)易編輯負(fù)責(zé)校對)
