机器人可按指令寻找丢失物品
慕尼黑工业大学(TUM)最新开发出一款能够根据人类指令寻找丢失物品的机器人。它将来自互联网的知识与周围环境的空间地图结合起来,从而更高效地定位目标物品。这款由 Angela Schoellig 教授领导的 TUM 学习系统与机器人实验室研发的机器人,外形类似一把装有摄像头、可移动的“轮式扫帚”。
研究团队表示,这是首批不仅具备图像理解能力,还能将其直接用于执行明确任务的机器人之一。
利用三维地图理解环境
以寻找被随手乱放的厨房眼镜为例,机器人首先需要环顾四周,构建房间的三维模型。摄像头最初获取的是二维图像,但其中的像素同时包含深度信息,系统据此生成精度达到厘米级的空间地图,并持续更新。
连接在机器人上的笔记本电脑会分析图像中可见的物体,并评估这些物体对人类使用场景的重要性,为后续搜索提供参考。
“我们让机器人学会了理解它所处的环境。”Schoellig 教授介绍道。作为 TUM 安全、性能与学习系统可靠性教席下机器人实验室的负责人,她的目标是让机器人能够在各种环境中自主导航。无论是工厂中的类人机器人,还是家庭护理场景中的服务机器人,都需要这种基础环境理解能力。“对于所有在不断变化空间中移动的机器人来说,这一点都至关重要。”相关研究成果已发表在《IEEE Robotics and Automation Letters(IEEE 机器人与自动化快报)》上。
将互联网知识转化为“机器人语言”
通过引入互联网知识,机器人不仅能识别物体,还能理解它们之间的常识性关系。例如,它知道桌面或窗台适合暂时放置眼镜,而炉灶或水槽则通常不是放眼镜的地方。

“语言模型会捕捉物体之间的关系,我们再把这些信息转换成机器人可以理解和使用的形式。”Schoellig 教授解释说。
在机器人的三维环境地图上,每个区域会被标注为两位数的数字,这些数字代表目标物品可能出现在该处的概率,并会随着环境变化不断重新计算。实验结果显示,相比在房间内随机搜索,这种基于概率的搜索策略能将寻找效率提升近 30%。在这一过程中,人工智能既用于图像识别,也用于语言模型推理,发挥了双重作用。
记忆与对比:发现环境变化
这款机器人还有一项关键能力:它能够记住之前拍摄的图像,并与当前环境的图像进行对比。如果厨房中突然多出一个新物体,机器人可以以约 95% 的高置信度识别出这种变化,并将这些新出现或被移动的区域标记为“高度可能”的搜索位置,从而进一步缩小查找范围。
下一步:搜索柜门和抽屉内部
下一阶段,TUM 的科研团队以及慕尼黑机器人与机器智能研究所(TUM MIRMI)的相关负责人计划让机器人具备在封闭空间中搜索的能力,例如橱柜内部或抽屉里。
要实现这一点,机器人不仅要依赖互联网知识和环境建模,还必须主动与环境交互。它需要通过机械臂和手部打开橱柜或抽屉,判断柜门是向上开启还是向侧面开启,并选择合适的方式抓住把手。只有完成这些动作,机器人才能将搜索范围扩展到柜门和抽屉等封闭空间内部。
