“机器人,帮我做把椅子”——基于AI的多组件物体设计与制造系统

richlovec 1500_400 (1)
 

计算机辅助设计(CAD)系统是设计日常物品的重要工具,但其操作复杂,且细节繁多,不利于快速构思和原型制作。为此,MIT及其他机构的研究人员开发了一种基于AI的机器人装配系统,使非专业用户仅通过语言描述即可设计并制造物理对象。

该系统首先利用生成式AI模型,根据用户的文字提示构建物体的三维几何模型。随后,第二个生成式AI模型基于物体的功能和几何形状,推理各组件的合理位置。

系统能够自动使用预制零件通过机器人装配完成物体制造,并可根据用户反馈迭代设计。研究团队利用该系统制造了包括椅子和书架在内的家具,所用组件可自由拆卸和重新组装,有效减少制造过程中的浪费。

通过用户研究,超过90%的参与者更倾向于该AI驱动系统制造的设计,优于其他方法。虽然目前仍处于初步阶段,该框架在快速原型制作复杂物体(如航空航天部件和建筑构件)方面具有潜力。未来,该技术或可实现家庭本地化制造家具,无需依赖中心工厂运输。

MIT电气工程与计算机科学系及建筑系研究生Alex Kyaw表示:“我们希望未来能像人与人交流一样,与机器人和AI系统沟通,共同创造物品。我们的系统是迈向这一未来的第一步。”

论文作者还包括MIT建筑系研究生Richa Gupta、机械工程副教授Faez Ahmed、建筑系计算组主任Lawrence Sass、EECS教授兼CSAIL成员Randall Davis,以及谷歌Deepmind和Autodesk Research的研究人员。该论文近期在神经信息处理系统会议(NeurIPS)上发表。

多组件设计生成

尽管生成式AI模型能根据文本提示生成三维网格,但大多数无法生成具备组件级细节、适合机器人装配的统一几何表示。将网格拆分为组件困难重重,因为组件划分依赖于物体及其部件的几何和功能。

研究人员采用视觉语言模型(VLM),这是一种预训练理解图像与文本的强大生成式AI模型,来解决这一问题。VLM负责推断两类预制零件——结构组件和面板组件——如何组合形成物体。

Kyaw解释:“面板可以以多种方式安装在物体上,但机器人需要‘看见’几何形状并基于此做出决策。VLM既是机器人的‘眼睛’,也是‘大脑’,使其能完成这一任务。”

用户通过输入“帮我做把椅子”等文本提示,并提供AI生成的椅子图像作为起点。VLM基于大量示例,推断面板应安装在结构组件的哪些位置,如座椅和靠背,以满足坐和靠的功能需求。

系统将这些信息以文本形式输出,如“座椅”或“靠背”,并对椅子表面编号,反馈给VLM。随后,VLM选择对应几何部分的标签,在三维网格上添加面板,完成设计。

人机协同设计

整个过程中,用户始终参与设计,可通过新提示调整设计,例如“只在靠背使用面板,不用在座椅上”。

Kyaw说:“设计空间庞大,用户反馈帮助缩小范围。每个人偏好不同,构建一个理想化的通用模型几乎不可能。”

Gupta补充:“人机协同让用户能引导AI设计,增强对最终作品的归属感。”

设计确定后,机器人装配系统使用可拆卸的预制零件完成制造。研究团队将该方法与将面板随机放置或仅放置于水平向上的算法对比,用户研究显示超过90%的人更喜欢他们的设计。

他们还让VLM解释为何选择特定区域安装面板。Kyaw指出:“VLM理解椅子的功能需求,如坐和靠,因此面板放置并非随机。”

未来,团队计划让系统支持更复杂的用户指令,如“用玻璃和金属做张桌子”,并引入齿轮、铰链等更多预制组件,提升物体功能性。

Davis总结:“我们希望大幅降低设计工具的门槛,证明生成式AI与机器人能快速、便捷且可持续地将创意转化为实物。”


分享:


发表评论

登录后才可评论。 去登录