Google Cloud 于 2026 年 5 月 29 日宣布,正式将图片生成与编辑模型「Nano Banana 2」和「Nano Banana Pro」推向一般可用(GA)。在产品形态上,Nano Banana 2 以「Gemini 3.1 Flash Image」提供,Nano Banana Pro 则以「Gemini 3 Pro Image」提供。
这两款模型均可在 Google Cloud 的 Gemini Enterprise Agent Platform 中使用,开发者也可以通过 Gemini API 进行调用。根据 Gemini API 的发布说明,这两款模型已自 2026 年 5 月 28 日起,作为原生图片模型的正式版本对外开放。
面向高速图片生成与编辑的 Nano Banana 2
Nano Banana 2 在 Gemini API 中对应的模型 ID 为「gemini-3.1-flash-image」,定位为图片生成模型。Google 将其视作 Gemini 3 Pro Image 的高效版本,更适合在需要兼顾速度、大规模调用、成本与延迟平衡的场景中使用。
官方给出的典型应用包括:广告与社交媒体视觉素材制作、商品图片编辑、分镜脚本(Storyboard)创作、教育插画、信息图表(Infographic)等多种图片生成与编辑工作流。所有由该模型生成的图片都会嵌入 Google 的电子水印技术「SynthID」,用于标记 AI 生成内容。
支持以视频为输入生成缩略图和海报
此次更新还为 Nano Banana 2 增加了以视频作为输入提示(Prompt)的能力。除了文本、PDF 和图片之外,用户现在可以将视频文件作为输入,让模型分析视频中的上下文、主体和动作,从而生成缩略图、信息图等静态图片。

根据 Gemini API 的发布说明,开发者既可以直接上传视频文件,也可以提供公开的 YouTube URL,并与文本提示一起作为多模态上下文输入。Google 预期的应用场景包括:高质量视频缩略图、电影或宣传海报、基于视频内容的概要信息图等。
需要注意的是,这一功能并不生成视频本身,而是将视频作为输入素材,用其内容来生成静态图片。此外,在 Google Cloud 的官方文档中,视频输入功能目前仍被标记为 Preview(预览)阶段。
1K/2K 分辨率正式开放,4K 仍为预览功能
在输出分辨率方面,Nano Banana 2 与 Nano Banana Pro 均已正式支持 1K 与 2K 分辨率输出;4K 分辨率输出则暂时仍处于 Preview 状态。
随着正式版模型上线,原先的预览版模型「gemini-3.1-flash-image-preview」与「gemini-3-pro-image-preview」已被标记为不再推荐使用。Google 计划在 2026 年 6 月 25 日正式停用这两款 Preview 模型。
如果开发者在现有应用或工作流中仍在调用预览版模型,需要尽快将模型 ID 迁移至正式版:Nano Banana 2 对应「gemini-3.1-flash-image」,Nano Banana Pro 对应「gemini-3-pro-image」。
