医疗人工智能热度升温 业内呼吁以临床效果检验真实价值

richlovec 1500_400 (1)
 

人工智能在医疗健康领域的应用正受到资本和科技公司的高度关注,多家企业围绕药物研发和诊断场景作出强烈宣称,并加大投入布局。

Alphabet旗下的 Isomorphic 表示,“前沿人工智能能够解锁更深层次的科学洞见、更快的突破以及改变生命的药物”。另一家公司 Lila 将其人工智能产品定位为“加速所有突破性科学领域发现的工具”。与此同时,资金流向也显示出市场对相关前景的押注:Anthropic 近期以 4 亿美元收购了隐秘创业公司 Coefficient Bio。

不过,来自行业内部的声音指出,对于任何医疗人工智能而言,关键考验仍在于其在人类身上的实际效果,包括能否真正促成挽救生命的药物或改善诊疗结果的工具。目前,多数企业距离这一目标仍有差距。

从已进入市场的治疗方案数量来看,Isomorphic 尚未有相关疗法落地,Lila 亦然。业内人士认为,人工智能在医疗领域的营销表述,与其在真实临床环境中的验证结果之间存在明显落差。

有观点指出,这一现象与医疗创新本身的高门槛密切相关。新疗法通常需要经历三期临床试验,整个过程往往耗时约 10 年、投入约 20 亿美元。新的诊断工具则必须证明其临床效益,通过严格的第三方测试,并建立完整的质量管理体系,方可获准进入临床使用。至于发现并验证全新的人体生物学机制,往往需要数十年的科学研究。

在此背景下,部分企业开始尝试缩小人工智能模型训练环境与实际医学应用场景之间的差距。Insilico Medicine 和 Recursion 等公司正推动人工智能发现的候选资产进入临床试验阶段。

Owkin 表示,其已将肿瘤药物 OKN4395 推进至一期 a 临床试验 INVOKE,并在多年实践中使用真实患者数据训练人工智能模型。该公司称,其开发的诊断工具 MSIntuit CRC 已获得欧洲 CE 认证并应用于病理实践。

相关企业认为,将人工智能直接引入临床场景虽难度较大,但有助于暴露并解决模型在真实环境中的问题,从而推动技术迭代。Owkin 方面举例称,在首次将诊断类人工智能用于临床时,发现模型对不同人群特征及扫描设备参数变化的适应性不足,随后不得不开发简洁而稳健的调整方法,以应对不同地区和技术条件的差异。

在临床试验设计方面,Owkin 将所谓“现实检验”纳入 INVOKE 试验结构中。该公司介绍,传统试验通常围绕预先设定的关键指标展开,中期结果主要用于判断试验是否继续。而在 INVOKE 试验中,研究方利用参与患者的持续数据对人工智能模型进行更新:当模型对患者反应的预测与实际结果出现偏差时,研究团队会用真实数据重新训练模型,以提升其表现。

Owkin 将这一过程描述为“正反馈循环”:随着真实试验数据的积累,模型性能得到改进,患者获益有望增加,进而可以测试更多模型。该公司认为,这类做法代表了医疗人工智能发展的一个方向。

业内也有观点指出,部分机构会在临床试验前增加额外环节,例如在体外模型系统中验证人工智能生成的结果。但相关意见强调,无论是药物发现、试验设计、诊断工具还是临床决策支持系统,最终仍需在人类身上证明有效性,方可被视为成功。

除临床试验外,多元化的数据训练被视为提升模型贴近现实表现的另一途径。有从业者认为,使用更丰富的患者数据训练人工智能模型,有助于使初始预测更接近真实情况。数据描述越细致、模态类型越多,模型捕捉到的信号被认为越可能反映真实生物学特征。

当人工智能生成的新假设无法直接通过现有患者数据验证时,一些研究团队选择在尽可能接近人体生理状态的体外系统中进行测试。例如,患者来源的类器官被用于保留人体生物学的复杂性,同时结合丰富的临床信息,而传统实验室细胞系和动物模型在这方面被认为存在不足。

此外,有机构在严格监管框架之外的真实世界环境中,观察模型对患者反应预测的表现。相关方称,当模型被嵌入常规临床流程、例如作为诊断工具使用时,研究人员可以更全面地了解其优势、局限以及能够实际解决的临床需求。

Owkin 表示,其正在同时推进上述多种路径,并称这一过程难度较高,也暴露出将新疗法真正带给患者所面临的结构性障碍。

文章作者、Owkin 联合创始人兼首席执行官托马斯·克洛泽尔在文末表示,相较于对人工智能前景的兴奋,更重要的是让各种设想在现实中接受检验,并观察哪些成果最终得以保留。


分享:


发表评论

登录后才可评论。 去登录