用一句话走进虚拟世界:Google 在美推出世界生成 AI 原型「Project Genie」,搭载 DeepMind 世界模型 Genie 3

richlovec 1500_400 (1)
 

Google 于 2026 年 1 月 29 日(当地时间)发布了一款实验性原型产品「Project Genie」,用户只需输入文本或图片,就能生成并探索一个可交互的虚拟世界。该服务率先向美国地区的「Google AI Ultra」用户开放。

从文本或图片生成可交互虚拟世界

Project Genie 的核心能力,是把用户输入的自然语言指令或图片,转化为一个可以“走进去”的虚拟空间。与传统的静态 3D 模型不同,Genie 生成的世界会根据用户的视角移动和操作行为,实时构建和更新周围环境。

在当前的原型中,体验主要由三大核心功能构成:

  • World sketching(世界勾勒): 通过输入文本描述,或使用生成/上传的图片,来创建世界的基础环境与风格。
  • World exploration(世界探索): 用户可以在生成的世界中行走、飞行,或通过各种载具移动,沉浸式地体验这个虚拟空间。
  • World remixing(世界再混合): 在已有世界的基础上加入新的设定或改动,对场景进行再创作和重新诠释。

在正式生成前,用户可以先预览世界的大致外观,并可选择以第一人称或第三人称视角进行体验。

@YouTube

以世界模型「Genie 3」为核心的技术架构

在技术层面,Project Genie 以 Google DeepMind 开发的世界模型 「Genie 3」 为核心。该模型会根据用户的操作和移动方向,动态生成前方环境,并模拟包含物理效果与交互行为在内的“动态世界”。

这一原型以 Web 应用形式提供,在 Genie 3 之上,还组合了图像生成模型 「Nano Banana Pro」 以及对话式 AI 「Gemini」,共同完成从世界生成到交互控制、对话引导等一整套体验。

仅向美国 Google AI Ultra 用户限量开放

目前,Project Genie 作为 Google Labs 的实验性研究原型提供使用。访问资格仅限:

  • 居住在美国
  • 年满 18 岁
  • 已订阅「Google AI Ultra」服务的用户

用户在体验过程中生成的世界,以及在其中探索的过程,都可以导出为视频进行下载和分享。

现阶段的限制与未来规划

Google 提醒,目前 Project Genie 仍处于早期实验阶段,存在若干限制:

  • 生成结果不一定完全符合现实世界的物理规律,也可能与用户输入的内容存在偏差;
  • 操作时可能出现延迟;
  • 单次生成时间被限制在最多 60 秒之内;
  • 部分 Genie 3 的功能尚未在该原型中开放。

未来,Google 计划基于用户反馈持续改进生成质量与交互体验,并在条件成熟后,逐步扩大 Project Genie 的开放地区与适用人群。


分享:


发表评论

登录后才可评论。 去登录