TUM研发AI搜索机器人：结合3D地图与互联网知识寻找遗失物品

科学 2026-03-14 机器人, 人工智能, 计算机视觉, 三维重建, 人机交互 40 次浏览

机器人可按指令寻找丢失物品

慕尼黑工业大学（TUM）最新开发出一款能够根据人类指令寻找丢失物品的机器人。它将来自互联网的知识与周围环境的空间地图结合起来，从而更高效地定位目标物品。这款由 Angela Schoellig 教授领导的 TUM 学习系统与机器人实验室研发的机器人，外形类似一把装有摄像头、可移动的“轮式扫帚”。

研究团队表示，这是首批不仅具备图像理解能力，还能将其直接用于执行明确任务的机器人之一。

利用三维地图理解环境

以寻找被随手乱放的厨房眼镜为例，机器人首先需要环顾四周，构建房间的三维模型。摄像头最初获取的是二维图像，但其中的像素同时包含深度信息，系统据此生成精度达到厘米级的空间地图，并持续更新。

连接在机器人上的笔记本电脑会分析图像中可见的物体，并评估这些物体对人类使用场景的重要性，为后续搜索提供参考。

“我们让机器人学会了理解它所处的环境。”Schoellig 教授介绍道。作为 TUM 安全、性能与学习系统可靠性教席下机器人实验室的负责人，她的目标是让机器人能够在各种环境中自主导航。无论是工厂中的类人机器人，还是家庭护理场景中的服务机器人，都需要这种基础环境理解能力。“对于所有在不断变化空间中移动的机器人来说，这一点都至关重要。”相关研究成果已发表在《IEEE Robotics and Automation Letters（IEEE 机器人与自动化快报）》上。

将互联网知识转化为“机器人语言”

通过引入互联网知识，机器人不仅能识别物体，还能理解它们之间的常识性关系。例如，它知道桌面或窗台适合暂时放置眼镜，而炉灶或水槽则通常不是放眼镜的地方。

“语言模型会捕捉物体之间的关系，我们再把这些信息转换成机器人可以理解和使用的形式。”Schoellig 教授解释说。

在机器人的三维环境地图上，每个区域会被标注为两位数的数字，这些数字代表目标物品可能出现在该处的概率，并会随着环境变化不断重新计算。实验结果显示，相比在房间内随机搜索，这种基于概率的搜索策略能将寻找效率提升近 30%。在这一过程中，人工智能既用于图像识别，也用于语言模型推理，发挥了双重作用。

记忆与对比：发现环境变化

这款机器人还有一项关键能力：它能够记住之前拍摄的图像，并与当前环境的图像进行对比。如果厨房中突然多出一个新物体，机器人可以以约 95% 的高置信度识别出这种变化，并将这些新出现或被移动的区域标记为“高度可能”的搜索位置，从而进一步缩小查找范围。

下一步：搜索柜门和抽屉内部

下一阶段，TUM 的科研团队以及慕尼黑机器人与机器智能研究所（TUM MIRMI）的相关负责人计划让机器人具备在封闭空间中搜索的能力，例如橱柜内部或抽屉里。

要实现这一点，机器人不仅要依赖互联网知识和环境建模，还必须主动与环境交互。它需要通过机械臂和手部打开橱柜或抽屉，判断柜门是向上开启还是向侧面开启，并选择合适的方式抓住把手。只有完成这些动作，机器人才能将搜索范围扩展到柜门和抽屉等封闭空间内部。

发表评论

登录后才可评论。去登录