Google 于美国时间 2026 年 2 月 26 日正式发布最新一代原生图像生成模型 「Nano Banana 2(Gemini 3.1 Flash Image)」。在 Gemini API 中,该模型以 「Gemini 3.1 Flash Image Preview(gemini-3.1-flash-image-preview)」 的形式提供预览使用。
根据官方介绍,Nano Banana 2 在设计上兼顾了两类模型的优势:一方面具备接近 「Nano Banana Pro」 的高级推理能力与丰富世界知识,另一方面又继承了 Gemini Flash 系列 的高速生成特性,实现“高质量 + 高速度”的折中方案。
以 Flash 级速度运行的“世界知识型”图像生成
Nano Banana 2 基于 Gemini Flash 的高速推理架构构建,重点面向需要频繁编辑与快速迭代(iteration)的使用场景,例如创意探索、方案比选、交互式内容生成等。
Google 特别强调了该模型在以下方面的能力:
- 深度利用 world knowledge(现实世界知识)
- 与 实时 Web 搜索结果 的整合
- 自动生成 信息图表与数据可视化
- 将 文字笔记转化为结构化图解
■ 信息图表生成示例(水循环示意图):可基于真实世界知识生成结构化说明图
■ 基于搜索信息生成的河豚“巢”结构图示示例:包含物种名称与结构标注,反映了与搜索结果联动的知识能力
更精准的图像文字绘制与多语言本地化
在图像中文字的生成方面,Nano Banana 2 也进行了重点升级。
官方表示,新模型在以下场景中表现更佳:
- 生成 营销物料、广告样机、贺卡 等需要清晰可读文字的图像
- 对图像中的文字进行 翻译与本地化处理,在保持设计风格一致的前提下替换为其他语言
■ 将同一设计的招牌转换为不同语言版本的示例
被摄体一致性与多目标管理能力提升
Google 表示,在 Nano Banana 2 中,模型在 生成速度 与 视觉忠实度 之间的差距被大幅缩小,尤其是在多角色、多物体场景下的控制能力有明显提升。

主要改进点包括:
- 最多可对 5 个角色 保持较高的外观一致性
- 最多可对 14 个对象 维持形态与细节的忠实度
- 更强的 复杂指令理解与执行能力
- 支持从 512px 到 4K 分辨率 的输出控制
- 提供更灵活的 纵横比(Aspect Ratio) 指定
这使得 Nano Banana 2 特别适合:
- 分镜头脚本(Storyboard)制作
- 多场景连续画面生成
- 需要在多张图中保持角色外观统一的创作场景
■ 被摄体一致性生成示例
■ 支持最高 4K 输出的示例
覆盖的产品与服务范围
Google 计划将 Nano Banana 2 部署到旗下多条产品线中,具体包括:
- Gemini 应用:整合进 Fast / Thinking / Pro 等模式
- Search:用于 AI Mode 与 Lens 中的图像生成与增强
- AI Studio 与 Gemini API(Preview):供开发者测试与集成
- Google Cloud(Vertex AI):作为云端图像生成能力提供给企业与开发者
- Flow:作为默认图像生成模型
- Google Ads:用于广告活动创意与素材生成辅助
同时,面向更专业、对质量要求更高的场景,Nano Banana Pro 仍将继续提供使用,Nano Banana 2 则作为兼顾速度与质量的通用选项,与 Pro 形成互补。
生成内容的来历标注与验证
在内容安全与透明度方面,Google 也同步强化了生成内容的来历标注技术,将 SynthID 与 C2PA Content Credentials 结合使用。
官方数据显示,自 2024 年 11 月以来,Gemini 应用内的 SynthID 验证功能已被使用超过 2,000 万次。未来,Google 还计划在应用中加入对 C2PA 标准 的验证支持。
在整体产品布局中,Nano Banana 2 被定位为 高精度模型与高速模型的融合方案。Google 为用户提供了根据具体用途在 Nano Banana Pro 与 Nano Banana 2 之间灵活选择的空间。
