Google 于 2026 年 1 月 29 日(当地时间)发布了一款实验性原型产品「Project Genie」,用户只需输入文本或图片,就能生成并探索一个可交互的虚拟世界。该服务率先向美国地区的「Google AI Ultra」用户开放。
从文本或图片生成可交互虚拟世界
Project Genie 的核心能力,是把用户输入的自然语言指令或图片,转化为一个可以“走进去”的虚拟空间。与传统的静态 3D 模型不同,Genie 生成的世界会根据用户的视角移动和操作行为,实时构建和更新周围环境。
在当前的原型中,体验主要由三大核心功能构成:
- World sketching(世界勾勒): 通过输入文本描述,或使用生成/上传的图片,来创建世界的基础环境与风格。
- World exploration(世界探索): 用户可以在生成的世界中行走、飞行,或通过各种载具移动,沉浸式地体验这个虚拟空间。
- World remixing(世界再混合): 在已有世界的基础上加入新的设定或改动,对场景进行再创作和重新诠释。
在正式生成前,用户可以先预览世界的大致外观,并可选择以第一人称或第三人称视角进行体验。
@YouTube
以世界模型「Genie 3」为核心的技术架构
在技术层面,Project Genie 以 Google DeepMind 开发的世界模型 「Genie 3」 为核心。该模型会根据用户的操作和移动方向,动态生成前方环境,并模拟包含物理效果与交互行为在内的“动态世界”。

这一原型以 Web 应用形式提供,在 Genie 3 之上,还组合了图像生成模型 「Nano Banana Pro」 以及对话式 AI 「Gemini」,共同完成从世界生成到交互控制、对话引导等一整套体验。
仅向美国 Google AI Ultra 用户限量开放
目前,Project Genie 作为 Google Labs 的实验性研究原型提供使用。访问资格仅限:
- 居住在美国
- 年满 18 岁
- 已订阅「Google AI Ultra」服务的用户
用户在体验过程中生成的世界,以及在其中探索的过程,都可以导出为视频进行下载和分享。
现阶段的限制与未来规划
Google 提醒,目前 Project Genie 仍处于早期实验阶段,存在若干限制:
- 生成结果不一定完全符合现实世界的物理规律,也可能与用户输入的内容存在偏差;
- 操作时可能出现延迟;
- 单次生成时间被限制在最多 60 秒之内;
- 部分 Genie 3 的功能尚未在该原型中开放。
未来,Google 计划基于用户反馈持续改进生成质量与交互体验,并在条件成熟后,逐步扩大 Project Genie 的开放地区与适用人群。
发表评论
登录后才可评论。
去登录
