“Moltbook”警示：医疗场景中AI对AI交互的潜在风险

科学 2026-04-09 人工智能, 医疗健康, 数字安全, AI安全, 临床技术 24 次浏览

一份最新报告聚焦临床环境中自主AI系统彼此交互所带来的新兴风险。相关论文《医疗保健中AI对AI交互的新兴风险：来自Moltbook的教训》已发表在《医学互联网研究杂志》（Journal of Medical Internet Research）上。研究指出，随着用于分诊、排班等高风险任务的AI代理开始直接通信，它们正在构建一个可能超出人类主动监管范围的“数字生态系统”。

该报告由 Tejas S. Athni 撰写，以 2026 年的“Moltbook”实验为核心案例。Moltbook 是一个专门为AI对AI交互设计的社交网络，被用作医疗保健领域的概念验证示例。分析认为，这类互联系统在提升效率的同时，也带来了三方面严重隐患：错误的快速连锁传播、数据泄露的加速放大，以及意外形成的等级结构。

互联医疗AI的潜在风险

报告指出，当多个自主AI代理在缺乏充分人类干预的情况下共享数据和决策时，会出现多重关键问题，包括：

错误传播：在网络化系统中，诊断AI的一次误判（例如将骨折错误标记为正常）可能被负责床位管理和分诊的下游代理直接采信并放大，进而演变为系统性医疗错误。
数据泄露加速：互联代理之间可能以开发者未预料的方式交换或隐藏信息。攻击者可以利用这些“代理通路”实施模型反演或成员推断攻击，以更快速度获取并泄露受保护的健康信息（PHI）。
新兴等级体系：Moltbook 的观察结果显示，AI代理之间可能自发形成主导与从属关系。在医院场景中，负责 ICU 床位分配的AI，可能逐渐在决策上压过诊断AI，形成与既定伦理规范和临床流程不一致的事实优先级结构。

推进预防性数字健康设计

文章提出，医疗AI的设计理念应从事后修补转向“预防性设计”，在系统架构阶段就将安全与透明度作为核心原则。随着自主系统更深地嵌入医疗流程，必须同步强化可解释性和防护机制。

为此，报告建议从以下几个方面着手：

以人为本的安全机制：加强人类复核环节，例如要求放射科医生对AI给出的影像分类结果进行审查，确保任何关键自主决策在最终执行前都经过人类确认。
主动压力测试：通过红队演练等方式，系统性挖掘AI对AI通信协议中的薄弱点和潜在攻击面，在临床部署前完成充分的安全验证。
可追踪的决策审计：为每一次代理交互和关键决策保留清晰、可回溯的记录，以便在出现问题时厘清责任并改进系统。

报告最后强调：“随着自主系统持续融入医疗保健领域，必须严肃看待AI对AI交互带来的风险。Moltbook 实验为我们提供了一个重要视角，以防这些数字层面的隐患最终演变为现实世界中的患者伤害。”

发表评论

登录后才可评论。去登录