AI 研究与开发公司 Generalist 于 2026 年 4 月 2 日正式发布面向真实世界机器人的 AI 基座模型「GEN-1」。这一模型专注于优化机器人在物理世界中的动作规划与执行,基于约 50 万小时的真实机器人操作数据进行预训练。官方表示,GEN-1 在多种机器人任务上的平均成功率达到 99%,在执行速度上相较以往最先进方法最高可提升约 3 倍。
面向真实世界机器人的基座模型「GEN-1」
GEN-1 是一款能够在真实环境中为机器人实时生成动作的 AI 模型。它可以融合视觉等多种模态信息,直接输出机器人应当采取的行为,被设计为一种具备“身体性”的基座模型(embodied foundation model)。
Generalist 的目标是构建能够在物理世界中通用运行的 AI 系统,而 GEN-1 则是这一愿景下的最新成果,用于支撑各类实体机器人的通用操作能力。
成功率达 99%,任务执行最高提速约 3 倍
根据 Generalist 公布的数据,GEN-1 在多种机器人任务上的平均成功率达到 99%。相比之下,以往最先进方法的成功率约为 64%,GEN-1 在可靠性上实现了显著提升。
在任务执行速度方面,GEN-1 也展现出明显优势:在相同任务条件下,其执行效率最高可达到传统方法的约 3 倍。
此外,GEN-1 在数据利用效率上也表现突出。对于新的机器人任务,只需约 1 小时的机器人操作数据,就能够完成新任务的学习与适应,大幅降低了数据采集与标注的成本。
基于约 50 万小时实机机器人数据训练
GEN-1 通过约 50 万小时的真实世界机器人数据进行预训练。Generalist 认为,正是这种大规模、长时间的实机数据积累,使得模型能够在复杂、多变的物理环境中保持稳定表现。

在大规模语言模型(LLM)领域,扩大模型规模与训练数据量可以显著提升性能的“扩展规律(scaling law)”已经被广泛验证。Generalist 将类似的思路引入机器人 AI,通过放大数据与模型规模来推动机器人智能的整体跃升。
具备应对突发情况的“即兴”能力
Generalist 还指出,GEN-1 在面对未曾明确训练过的、出乎预料的场景时,展现出一定的“即兴行为(improvisation)”能力,能够对环境变化做出灵活反应。
这类能力被研究团队视为随模型规模扩大而出现的“涌现能力(emergent capability)」的一种体现。官方公开的视频中,展示了机器人在执行物体操作等任务时,如何根据环境变化调整动作策略的过程。
@YouTube
向机器人 AI 的“扩展”极限发起挑战
长期以来,由于在现实世界中采集机器人数据成本高、周期长,机器人 AI 一直难以像大规模语言模型那样,通过简单扩大数据与模型规模来获得线性甚至超线性的性能提升。
Generalist 试图通过大规模收集并训练真实世界机器人数据,正面突破这一瓶颈。公司表示,将持续推进面向物理世界的通用智能研究,希望借助类似 GEN-1 的基座模型,为未来各类机器人系统提供统一的智能底座。