当AI接入肌肉:情境感知电刺激教你完成从未学过的动作

想象你在异国旅行,面对一扇从未见过的窗户。你伸出手,不再摸索,而是感觉肌肉被轻柔地带动,顺势完成正确的开窗动作,仿佛有位看不见的老师在身旁示范。同样的体验,也可以用在旋开儿童安全药瓶、操作一次性相机,或完成任何你从未练习过的动作。

这不是科幻设想,而是芝加哥大学计算机科学系副教授 Pedro Lopes 指导下,博士生 Yun Ho 和 Romain Nith 正在实现的系统。他们的研究获得了 ACM CHI 2026 会议最佳论文奖,在人机交互领域引发了广泛讨论,并已发布在 arXiv 预印本平台。

从特定任务工具到通用物理辅助

电肌肉刺激(EMS)技术本身并不新颖。多年来,研究者通过在皮肤上贴电极、施加可控电流,来帮助人们学习弹钢琴、演示手语,或辅助中风患者康复。但这些系统往往只适用于预先设定的少数任务,更像是“辅助轮”:一旦离开预设场景,就难以应对真实世界的复杂变化。

研究团队指出,以往的 EMS 辅助“高度专业化……固定且缺乏情境感知”。也就是说,肌肉收到的“指令”只在设计者预想的情境中有效。比如,系统可以立刻帮你摇晃喷漆罐,但当你拿起一罐食用油喷雾时,它就不知道该如何反应——因为它既不了解当前物体,也不理解你为什么不需要摇晃。

这一次,团队提出的“具身人工智能”(Embodied AI)系统试图改变这一点。借助现代多模态 AI(例如 CLIP 视觉模型,以及具备 GPT-4 级别推理能力的计算机视觉系统),它能够综合你所看到的物体、所处环境以及身体姿态,实时生成与当前情境匹配的动作引导。EMS 不再只是执行预设脚本,而是与用户在当下进行协同。

“我很好奇,人们会如何理解、并与一种通过身体动作(而不是视听信息)与他们交流的设备建立关系。”Ho 表示,“在‘具身人工智能’这个框架下,我可以在物理辅助领域探索这个问题。让参与者在使用系统时一边体验一边思考,观察他们如何解读机器引导的动作,这一点非常有启发性。”

从“知道事实”到“会怎么做”的 AI

这项工作的关键在于程序性知识——那种难以用语言完整描述的身体经验:如何恰到好处地握住瓶盖并旋开,或者如何协调手腕和肩膀去打开一扇欧洲式窗户。过去几十年,很多系统主要是向人们传递事实性信息;而这里,研究者尝试把“操作诀窍”直接传给肌肉。

情境感知、可生成动作的 EMS 带来了什么变化?用户即使说不清自己需要什么帮助,也能在身体层面获得引导,从而完成陌生且复杂的物理任务。

论文中描述了一项用户研究:参与者在系统的动态肌肉提示下,成功打开带锁结构的药瓶、使用一次性相机拍照,或操作牛油果工具。即便研究者刻意让 AI 给出错误引导(用于测试),参与者仍能察觉异常,调整动作,通过重新提示系统或主动纠正来找到正确做法。

这种身体直觉与 AI 建议之间的来回博弈非常关键。一位参与者表示,“身体的直觉能立刻发现错误”,相比阅读步骤说明或观看教学视频,这种方式更直接、更容易察觉不对劲之处。

Lopes 认为:“这可能会改变游戏规则,不仅适用于高度依赖身体操作的任务(例如学习制造、材料加工相关技能,或学习乐器),也适用于用户在情境上受限的场景(比如需要同时处理多项任务,或在黑暗环境中看不清时)。”

谁会受益?具身 AI 的潜在日常场景

研究团队设想,这项技术的应用远不止实验室演示。尤其是在程序性操作至关重要、且出错代价高的领域,具身 AI 可能发挥作用:

  • 医疗与康复: 物理治疗患者在家练习不熟悉的动作,或老年人使用辅助器具时,肌肉本身就能获得安全的动作引导,而不必完全依赖文字说明或视频示范。
  • 工业与技术劳动: 工人接触新设备或新工艺时,可以通过肌肉引导快速掌握正确姿势和用力方式,降低受伤风险,缩短培训周期。
  • 无障碍辅助: 视障或低视力用户已经能通过 AI 获得场景描述,而情境感知 EMS 则可以进一步提供直接的身体引导,把普通环境转化为“可触达”的环境,手把手教会新的手势和操作流程。
  • 日常生活: 从旅行者面对陌生电器,到爱好者组装不熟悉的设备,这类系统都可以在现场提供灵活的动作辅助。

当然,Lopes 和团队也坦言目前仍有不少限制:电极需要精确校准,EMS 可能带来刺痛或不适,电刺激本身也难以完全替代精细动作控制和长期“肌肉记忆”。不过,他们认为 AI 算法和 EMS 硬件都在快速进步。趋势很清晰:未来,类似的体载 AI 引导设备有望像今天的可穿戴健康追踪器一样普及。

“虽然我们对这个系统抱有很高期待,但这显然只是第一步,后续还有大量工作要做。”Lopes 说。

“这包括进一步提升 AI 的推理能力,让多模态模型不仅能‘看’,还能‘感受’用户的体验(例如理解触觉和运动感知),以及持续解决 EMS 的舒适度、可穿戴性和校准难题——目前它还称不上日常穿戴设备,更像是研究人员在实验室里试验的‘超级英雄装备’。”

研究团队也强调,这套系统并不是为了取代传统的视听指导,而是作为补充,通过“身体”这一媒介,丰富人类学习和与技术互动的方式。相关代码已经开源,团队欢迎外界在此基础上扩展、批评和迭代模型。

在伦理层面,例如谁来控制引导、错误指令可能带来怎样的风险等问题上,研究者特别强调用户控制与安全性:AI 只有在被用户主动“邀请”时才会介入,参与者可以随时中断或调整系统行为。


分享:


发表评论

登录后才可评论。 去登录