![]()
智東西
編譯 楊京麗
編輯 李水青
智東西7月1日消息,今天,谷歌宣布開放兩款新模型:圖像生成模型Nano Banana 2 Lite和視頻生成編輯模型Gemini Omni Flash。
![]()
▲谷歌推出Nano Banana 2 Lite和Gemini Omni Flash(圖源:X)
今年2月,谷歌推出Nano Banana 2,在保持較低延遲的同時提升圖像生成質量,支持更強的推理能力和搜索能力。今年5月,谷歌在I/O大會上首次展示Gemini Omni Flash,定位為原生多模態的視頻生成編輯模型,但當時并未向開發者開放。
此次更新的模型Nano Banana 2 Lite是初代Nano Banana的推薦替代模型,主打近實時、較高質量圖像生成,單張1K分辨率圖像生成延遲約4秒、價格0.034美元(約合人民幣0.23元)起;Gemini Omni Flash則首次面向開發者公開預覽,支持文本、圖像和視頻輸入,可用自然語言進行多輪視頻編輯,目前支持10秒視頻生成,視頻輸出價格為每秒0.10美元(約合人民幣0.68元)。
評測結果顯示,Nano Banana 2 Lite在圖像生成和圖像編輯Elo分數上略低于Nano Banana 2,但速度更快,成本更低;Gemini Omni Flash在視頻編輯模型對比中,整體偏好和指令遵循兩項Elo評分均位列第一,領先HappyHorse、Kling v3 Pro、Seedance 2.0等模型。
兩款模型現已登陸Google AI Studio、Gemini API和Gemini Enterprise Agent Platform,其中Gemini Omni Flash還可在Gemini app和Google Flow中使用。
此次更新后,用戶可以先用Nano Banana 2 Lite快速生成圖像,再通過Gemini Omni Flash將靜態圖像轉化為可繼續編輯的視頻內容。谷歌還推出了Anywhere、Space Lift、Omni Product Studio等演示應用,展示從自拍換地標、室內設計預覽到電商視頻生成等圖像到視頻工作流。
一、Nano Banana 2 Lite替代初代模型,速度快性價比高
谷歌稱,Nano Banana 2 Lite(gemini-3.1-flash-lite-image)是當前使用初代Nano Banana(gemini-2.5-flash-image)的推薦替代模型,在圖像質量、生成速度和成本等維度都有明顯提升。
雖然該模型優先強調速度,谷歌仍稱其保留了較穩定的提示詞遵循能力、角色一致性和圖中文字渲染能力。谷歌列出了Nano Banana 2、Nano Banana 2 Lite與多款競品AI圖像模型的性能對比,評估維度包括圖像生成和圖像編輯的Elo分數、單張1K分辨率圖像的生成延遲,以及對應價格。
![]()
▲Nano Banana 2 Lite與其他圖像生成模型評測對比(圖源:谷歌)
Nano Banana 2 Lite圖像生成Elo分數為1251,略低于Nano Banana 2的1270,高于Flux 2 Klein 9B、Grok Imagine Image和Seedream v5 Lite等對照模型;在圖像編輯上,Nano Banana 2 Lite得分為1308,在對照模型中位列中等水平。
速度和成本是Nano Banana 2 Lite最突出的優勢。生成一張1K分辨率圖像的延遲約為4.0秒,明顯快于Nano Banana、Nano Banana 2和Seedream v5 Lite等模型。價格方面,Nano Banana 2 Lite每張1K圖像約0.034美元(約合人民幣0.23元)起,成本低于谷歌其他圖像模型,價格與Seedream v5 Lite的0.035美元(約合人民幣0.24元)接近,高于Flux 2 Klein 9B、Grok Imagine Image。
為了便于消費者理解Nano Banana產品線,谷歌也列出表格在延遲、成本、視覺質量、推理能力四大方面對其模型進行對比。
![]()
▲Nano Banana系列三款模型對比(圖源:谷歌)
(1)Nano Banana 2 Lite(Gemini 3.1 Flash Lite Image)生成速度快,主打近實時、高流量工作流;
(2)Nano Banana 2(Gemini 3.1 Flash Image)為通用型模型,在性能與成本之間取得平衡,以較低延遲維持較高的生成質量;
(3)Nano Banana Pro(Gemini 3 Pro Image)則面向復雜專業場景,強調控制能力和高級推理;
(4)Nano Banana(Gemini 2.5 Flash Image)則被歸為舊款模型,建議開發者升級到Nano Banana 2 Lite,追求更高的質量、更低延遲和更低的成本。
除開發者平臺外,Nano Banana 2 Lite也會進入谷歌消費端產品,包括搜索中的AI Mode、Gemini應用、NotebookLM、Google Photos、Stitch、Google Flow和Google Ads。
X上部分網友測試了這一模型,稱Nano Banana 2 Lite生成質量與Nano Banana 2接近,但速度明顯更快。
![]()
▲海外網友測試Nano Banana 2 Lite(圖源:X)
二、Gemini Omni Flash開放公測,支持10秒視頻生成,每秒0.10美元
前段時間,視頻生成編輯模型Gemini Omni Flash曾在谷歌I/O大會上亮相,但尚未開放;此次谷歌正式開啟公開預覽,用戶現在可以通過Gemini API和Google AI Studio使用該模型。
![]()
▲Gemini Omni Flash根據原視頻生成魔術特效(圖源:谷歌)
該模型把Gemini的多模態推理能力與視頻生成、編輯能力結合起來,支持從文本、圖像和視頻輸入中生成或編輯視頻,并可通過自然語言進行多輪修改。每秒視頻輸出為0.10美元(約合人民幣0.68元),與Veo 3.1 Fast相同。
Gemini Omni Flash核心能力包括對話式視頻編輯、多模態參考輸入、調用Gemini知識構建視頻內容,以及通過提示詞讓文字、圖形和視頻動作實現同步。
谷歌列出了Gemini Omni Flash與多款競品視頻編輯模型的Elo評分對比。無論是整體表現還是指令遵循,Gemini Omni Flash都具備較高領先優勢。
![]()
▲Gemini Omni Flash與其他視頻模型評測對比(圖源:谷歌)
從整體偏好看,Gemini Omni Flash得分為1087,位列第一,高于HappyHorse的1044、Kling v3 Pro的1020、Seedance 2.0的946和Wan 2.7的902。在指令遵循能力上,Gemini Omni Flash同樣排名第一,得分為1082,領先HappyHorse的1036、Kling v3 Pro的1022、Seedance 2.0的960和Wan 2.7的900。
不過,該模型目前仍有限制。谷歌稱,Omni Flash當前支持10秒視頻生成,后續會推出更長時長;Gemini API暫不支持上傳音頻參考和場景擴展;API schema雖可接受最長3秒的視頻參考,但模型現階段還不能正確處理;在切換場景或平移動作時,角色一致性仍有局限。
三、兩款模型可串聯使用,先快速出圖再生成視頻
谷歌此次同步更新了圖像與視頻生成能力,因而用戶可以先用Nano Banana 2 Lite快速出圖,再通過Gemini Omni Flash將靜態圖像轉化為可繼續編輯的視頻內容。用戶可通過Interactions API保留會話歷史和上下文,最多可疊加三次連續編輯。
為展示這一路徑,谷歌推出了幾個演示應用,供用戶體驗。
Anywhere應用可以把用戶“帶到”世界各地。用戶上傳照片后,Nano Banana 2 Lite能將圖像背景換成世界知名地標,之后Gemini Omni Flash還能把生成的圖像變成該地點的動畫短片。
![]()
▲Anywhere根據用戶照片生成動態視頻(圖源:谷歌)
Space Lift面向室內設計,可根據房間照片,利用Nano Banana 2 Lite生成不同裝修風格,并利用Gemini Omni Flash生成動態展示視頻。
![]()
▲Space Lift根據照片生成房間動態展示視頻(圖源:谷歌)
Omni Product Studio則可把Nano Banana 2 Lite生成的靜態圖,用Gemini Omni Flash轉成電商風格視頻。
![]()
▲Omni Product Studio生成的電商視頻(圖源:谷歌)
結語:谷歌加速補齊可編輯視頻生成能力
此次更新后,谷歌的生成式媒體能力進一步延伸到視頻編輯工作流。用戶可以先用Nano Banana 2 Lite快速生成圖像素材,再通過Gemini Omni Flash把靜態圖像轉化為可繼續修改的視頻內容,多輪編輯、提示詞同步和多模態參考輸入成為這次更新的核心看點。
隨著Nano Banana系列圖像模型進一步分層,谷歌也在把類似思路延伸到視頻生成領域。谷歌此次推出視頻編輯模型Gemini Omni Flash,有助于盡快收集應用場景和反饋,并推動圖像、視頻、自然語言編輯在Gemini生態內形成更連貫的創作鏈路。
來源:谷歌
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.