Google 正式上线图片生成 AI「Nano Banana 2」：接入 Gemini API，并支持从视频生成缩略图

AI 2026-06-03 Google Cloud, Gemini, 生成式AI, 图像生成, Nano Banana 21 次浏览

Google Cloud 于 2026 年 5 月 29 日宣布，正式将图片生成与编辑模型「Nano Banana 2」和「Nano Banana Pro」推向一般可用（GA）。在产品形态上，Nano Banana 2 以「Gemini 3.1 Flash Image」提供，Nano Banana Pro 则以「Gemini 3 Pro Image」提供。

这两款模型均可在 Google Cloud 的 Gemini Enterprise Agent Platform 中使用，开发者也可以通过 Gemini API 进行调用。根据 Gemini API 的发布说明，这两款模型已自 2026 年 5 月 28 日起，作为原生图片模型的正式版本对外开放。

面向高速图片生成与编辑的 Nano Banana 2

Nano Banana 2 在 Gemini API 中对应的模型 ID 为「gemini-3.1-flash-image」，定位为图片生成模型。Google 将其视作 Gemini 3 Pro Image 的高效版本，更适合在需要兼顾速度、大规模调用、成本与延迟平衡的场景中使用。

官方给出的典型应用包括：广告与社交媒体视觉素材制作、商品图片编辑、分镜脚本（Storyboard）创作、教育插画、信息图表（Infographic）等多种图片生成与编辑工作流。所有由该模型生成的图片都会嵌入 Google 的电子水印技术「SynthID」，用于标记 AI 生成内容。

支持以视频为输入生成缩略图和海报

此次更新还为 Nano Banana 2 增加了以视频作为输入提示（Prompt）的能力。除了文本、PDF 和图片之外，用户现在可以将视频文件作为输入，让模型分析视频中的上下文、主体和动作，从而生成缩略图、信息图等静态图片。

根据 Gemini API 的发布说明，开发者既可以直接上传视频文件，也可以提供公开的 YouTube URL，并与文本提示一起作为多模态上下文输入。Google 预期的应用场景包括：高质量视频缩略图、电影或宣传海报、基于视频内容的概要信息图等。

需要注意的是，这一功能并不生成视频本身，而是将视频作为输入素材，用其内容来生成静态图片。此外，在 Google Cloud 的官方文档中，视频输入功能目前仍被标记为 Preview（预览）阶段。

1K/2K 分辨率正式开放，4K 仍为预览功能

在输出分辨率方面，Nano Banana 2 与 Nano Banana Pro 均已正式支持 1K 与 2K 分辨率输出；4K 分辨率输出则暂时仍处于 Preview 状态。

随着正式版模型上线，原先的预览版模型「gemini-3.1-flash-image-preview」与「gemini-3-pro-image-preview」已被标记为不再推荐使用。Google 计划在 2026 年 6 月 25 日正式停用这两款 Preview 模型。

如果开发者在现有应用或工作流中仍在调用预览版模型，需要尽快将模型 ID 迁移至正式版：Nano Banana 2 对应「gemini-3.1-flash-image」，Nano Banana Pro 对应「gemini-3-pro-image」。

发表评论

登录后才可评论。去登录