用一句话走进虚拟世界：Google 在美推出世界生成 AI 原型「Project Genie」，搭载 DeepMind 世界模型 Genie 3

AI 2026-02-05 Google, 生成式AI, 虚拟世界, DeepMind, Genie 3 55 次浏览

Google 于 2026 年 1 月 29 日（当地时间）发布了一款实验性原型产品「Project Genie」，用户只需输入文本或图片，就能生成并探索一个可交互的虚拟世界。该服务率先向美国地区的「Google AI Ultra」用户开放。

从文本或图片生成可交互虚拟世界

Project Genie 的核心能力，是把用户输入的自然语言指令或图片，转化为一个可以“走进去”的虚拟空间。与传统的静态 3D 模型不同，Genie 生成的世界会根据用户的视角移动和操作行为，实时构建和更新周围环境。

在当前的原型中，体验主要由三大核心功能构成：

在正式生成前，用户可以先预览世界的大致外观，并可选择以第一人称或第三人称视角进行体验。

@YouTube

在技术层面，Project Genie 以 Google DeepMind 开发的世界模型 「Genie 3」 为核心。该模型会根据用户的操作和移动方向，动态生成前方环境，并模拟包含物理效果与交互行为在内的“动态世界”。

这一原型以 Web 应用形式提供，在 Genie 3 之上，还组合了图像生成模型 「Nano Banana Pro」 以及对话式 AI 「Gemini」，共同完成从世界生成到交互控制、对话引导等一整套体验。

目前，Project Genie 作为 Google Labs 的实验性研究原型提供使用。访问资格仅限：

用户在体验过程中生成的世界，以及在其中探索的过程，都可以导出为视频进行下载和分享。

Google 提醒，目前 Project Genie 仍处于早期实验阶段，存在若干限制：

未来，Google 计划基于用户反馈持续改进生成质量与交互体验，并在条件成熟后，逐步扩大 Project Genie 的开放地区与适用人群。

登录后才可评论。去登录