基于意图的模仿学习:让不同形态机器人也能“互相传授技能”

机器人在制造业、农业和医疗保健等领域的应用持续扩展,但在实际部署中,一个长期存在的难题是:当一组机器人在执行各自任务时,如果它们的结构和能力差异很大,该如何让它们彼此学习、共享经验?

一支多机构研究团队提出了新的解决方案。团队成员之一、华盛顿大学麦凯尔维工程学院计算机科学与工程系副教授张崇杰参与开发了一种新方法,使机器人能够学习并实现同伴展示的“意图”,而不是简单照搬对方的具体动作。

意图对齐模仿学习:从人类文化学习中获得灵感

这项方法被称为“意图对齐模仿学习”(Intention-Aligned Imitation Learning,IAIL),灵感来自人类的文化学习方式。相关成果已发表在《科学机器人学》(Science Robotics)期刊上。

传统的机器人模仿学习通常要求示范者和学习者在物理结构、传感器和执行能力上尽可能相似,这样才能直接复用动作轨迹或控制信号。这种做法在现实中限制很大:一旦机器人形态不同、工作环境变化或需要跨平台协作,原有示范往往就难以直接使用。

IAIL的核心思路是:不再把重点放在低层次的动作复制上,而是利用用自然语言描述的高层“意图”或“目标”来对齐机器人行为。通过这种方式,机器人可以理解“做这件事是为了什么”,并在自身条件允许的前提下,用适合自己的方式去完成同样的目标,即便它的物理设计与示范机器人完全不同。

用自然语言构建“共享意图空间”

在这项研究中,“意图”指的是机器人通过某个动作希望达成的目标或结果。研究团队用人类语言来描述这些意图,从而将动作背后的目的,与具体的控制细节和物理执行方式区分开来。

具体做法是:团队将机器人执行任务时的运动表示(运动嵌入)与对应的语言注释进行对齐,构建了一个“共享的意图空间”。在这个空间中,不同形态、不同能力的机器人可以用统一的方式来衡量和比较“意图是否相似”。

当一个机器人需要学习时,它会先在这个共享意图空间中匹配目标意图,然后从自身预训练的行为库中检索出与该意图最接近的示范行为,再据此生成适合自己结构的动作序列。研究人员指出,这一机制不仅适用于单个机器人学习,也可以扩展到多机器人团队的协作场景。

跨机器人、跨任务的适应与协作

研究团队在30种不同场景中,对7种不同类型的机器人测试了IAIL方法。实验结果表明,该方法能够在不同机器人之间迁移行为,并在多种任务中实现适应,还支持多机器人之间的协同工作。

“我们的做法不是简单复制低层次的运动动作或特定形态特征,而是根据任务目标对行为进行对比和关联,这支持了个体间以及团队间的迁移。”张崇杰解释说。

与人类学习机制和认知科学研究相呼应

张崇杰表示,这一方法直接受到了人类文化学习机制的启发:人类在观察他人行为时,更关注对方“想达到什么目的”,然后用自己的方式去实现,而不是逐帧复刻对方的动作细节。

这一点也与认知科学和神经科学的研究结果相吻合:人类在学习时,更倾向于复制示范者被推断出的目标,而非精确的动作轨迹;同时,人类在解读他人行为时,也是以“意图”为核心,而不是机械地模仿动作本身。

“我们的语言方法提供了一种互补且稳健的视角,利用共享的高层意图编码,在直接视觉或动作对应不可靠时,弥合不同形态之间的差异。”张崇杰说。

他补充道,通过在与人类可理解描述相对齐的共享意图空间中组织机器人行为,IAIL不仅提升了机器人行为的可读性和可预测性,也为人机协作带来了优势:人类更容易理解机器人“在做什么、想干什么”,从而更安全、更高效地与机器人协同工作。


分享:


发表评论

登录后才可评论。 去登录