总部位于纽约的初创公司 Mantis Biotech 正在尝试用“数字孪生”技术缓解生物医学研究中的数据可用性瓶颈,尤其是罕见疾病和边缘病例数据稀缺的问题。
大型语言模型近年来被广泛用于加速基因组学研究、简化临床文档、提升实时诊断和临床决策支持,并在药物研发和合成数据生成等方面发挥作用。但在罕见疾病、异常状况等场景,由于缺乏可靠且具代表性的数据,这类模型的表现仍然受限。
Mantis Biotech 表示,其正在开发的平台通过整合多种来源的数据,生成可用于构建人体“数字孪生”的合成数据集。这些数字孪生被描述为基于物理的、可预测的人体解剖学、生理学和行为模型,可用于数据聚合和分析。
据公司介绍,这些数字孪生可被用于研究和测试新的医疗程序、训练手术机器人,以及模拟和预测潜在的医疗问题和行为模式。Mantis 创始人兼首席执行官 Georgia Witchel 在接受 TechCrunch 采访时举例称,一支体育团队可以基于某位 NFL 球员的近期表现、训练负荷、饮食以及活动时长等信息,预测其发生跟腱损伤的可能性。
在数据获取方面,Mantis 平台从教科书、动作捕捉摄像头、生物识别传感器、训练日志和医学影像等多种渠道收集信息。随后,平台利用基于大型语言模型的系统对不同数据流进行路由、验证和合成,并通过物理引擎对所有信息进行处理,生成高保真度的数据渲染,用于训练预测模型。
Witchel 表示,平台的核心在于物理引擎层,因为这一层通过基于物理学的解剖模型增强可用信息,更真实地模拟人体物理特性,从而提升合成数据的质量。她提到,如果需要对一名缺失手指的患者进行手部姿态估计,公开标注数据集中几乎不存在相关样本,而平台可以通过物理模型“移除”指定手指并重新生成模型,从而快速构建相应数据集。

Witchel 认为,由于该平台能够在数据源存在空白的情况下生成合成数据,其在生物医学行业具有较广泛的应用潜力,尤其适用于程序或患者信息难以获取、数据非结构化或分散存储的场景。她特别提到,边缘案例和罕见疾病的数据往往受到伦理和监管限制,患者数据难以纳入公共数据集或用于训练模型,这也是公司重点关注的方向之一。
在谈及隐私和伦理问题时,Witchel 将数字孪生比作儿童玩具,称希望人们能像对待玩具那样“大胆”地对数字孪生进行测试和实验,而不是直接在真实个体身上进行尝试。她表示,出于对个人隐私的尊重,真实人类数据不应被滥用,而数字孪生的存在为相关研究提供了另一种路径。
目前,Mantis 已在职业体育领域取得一定进展。Witchel 透露,公司主要客户之一是一支 NBA 球队。该公司为运动员构建数字化表现模型,不仅展示运动员当日的跳跃表现,还追踪过去一年中每日跳跃情况,并分析这些数据随时间的变化如何与睡眠时长或举臂次数等因素相关联。
在业务发展方面,Mantis 近期完成了 740 万美元种子轮融资,由 Decibel VC 领投,Y Combinator、数位天使投资人及 Liquid 2 参投。公司表示,这笔资金将主要用于招聘、广告、市场营销及市场推广。
展望下一步,Witchel 称,Mantis 将继续打磨技术,并计划最终向公众开放平台,目标方向为预防性医疗。同时,公司也希望为制药实验室和参与 FDA 试验的研究人员提供服务,以帮助他们更好地理解患者对治疗的反应。