在所有可能的化学化合物中,估计有介于10的20次方到10的60次方之间的化合物可能具备作为小分子药物的潜力。实验性地评估每一种化合物对于化学家来说耗时过长。因此,近年来,研究人员开始利用人工智能辅助识别可能成为优秀药物候选的化合物。
麻省理工学院(MIT)副教授康纳·科利(Connor Coley)正是这方面的先驱之一。他是1957级职业发展副教授,兼任化学工程系、电气工程与计算机科学系以及MIT施瓦茨曼计算学院的职位。他的研究跨越化学工程与计算机科学领域,致力于开发和应用计算模型,分析海量潜在化合物,设计新化合物,并预测可能生成这些化合物的反应路径。
“这是一种非常通用的方法,可以应用于有机分子的任何领域,但我们主要关注的是小分子药物的发现。”科利说。
人工智能与科学的交汇
科利的科学兴趣源自家庭。他的家族中科学家多于非科学家,包括他的父亲(放射科医生)、母亲(分子生物物理与生物化学学位获得者,后进入MIT斯隆管理学院)以及祖母(一位数学教授)。
高中时,科利在俄亥俄州都柏林参加科学奥林匹克竞赛,16岁高中毕业后进入加州理工学院,选择化学工程专业,因其结合了他对科学和数学的兴趣。在本科期间,他还涉猎计算机科学,曾在结构生物学实验室使用Fortran语言帮助解决蛋白质晶体结构问题。毕业后,他继续攻读化学工程博士,2014年进入MIT。
在导师Klavs Jensen和William Green的指导下,科利研究如何优化自动化化学反应,结合机器学习与化学信息学(利用计算方法分析化学数据)规划合成新药分子的反应路径,并设计可自动执行这些反应的硬件。
部分研究得到了国防高级研究计划局(DARPA)资助的“Make-It”项目支持,旨在利用机器学习和数据科学提升从简单构件合成药物及其他有用化合物的效率。
“这成为我真正进入化学信息学、机器学习领域的起点,思考如何用模型理解不同化学品的合成方式及可能的反应。”科利说。
博士期间,他开始申请教职,25岁时接受MIT的聘请。尽管有人建议他不要留在母校任教,但MIT丰富的资源、跨学科的流动性以及支持AI与科学交叉的氛围让他难以拒绝。

“MIT拥有极高的学生素质和热情,以及强大的合作网络,这些优势远远超过了留校可能带来的顾虑。”他说。
化学直觉的培养
科利推迟了一年教职,先在Broad研究所做博士后,积累化学生物学和药物发现经验。在那里,他研究如何从数十亿DNA编码库中筛选可能与疾病相关突变蛋白结合的小分子。
2020年回到MIT后,他组建实验室,致力于利用AI不仅合成现有具有治疗潜力的化合物,还设计具备理想性质的新分子及其合成路径。近年来,实验室开发了多种计算方法以实现这些目标。
“我们努力将化学挑战与计算解决方案最佳匹配,这种结合往往激发新方法的诞生。”科利说。实验室开发的ShEPhERD模型,基于药物分子的三维结构,评估其与目标蛋白的相互作用,目前已被制药公司用于新药发现。
“我们希望赋予生成模型更多药物化学的直觉,让模型了解正确的标准和考虑因素。”他说。
另一个项目中,实验室开发了生成式AI模型FlowER,用于预测不同化学物质反应后的产物。设计该模型时,研究人员融入了质量守恒等基本物理原理,并强制模型考虑从反应物到产物路径中各中间步骤的可行性。这些约束显著提升了预测准确性。
“考虑中间步骤和反应机制是化学家自然而然的思维方式,也是化学教学的核心,但模型本身并不具备这种能力。我们花了大量时间确保机器学习模型能像专家化学家一样,基于反应机制进行推理。”科利说。
实验室学生还涉猎化学反应优化的多个领域,包括计算辅助结构解析、实验室自动化和最优实验设计。
“通过这些多样的研究方向,我们希望推动AI在化学领域的前沿发展。”科利总结道。
