在罕见病治疗领域,尽管现代生物技术已具备基因编辑和药物设计能力,但仍有数千种疾病缺乏有效疗法。多家生物科技初创企业在本周举行的卡塔尔网络峰会上表示,研发进展长期受制于高端科研人才供给不足,而人工智能正被视为提升生产力、突破研发瓶颈的关键工具。
Insilico Medicine总裁Alex Aliper在会上介绍,该公司正致力于打造所谓的“制药超级智能”,通过多模态、多任务模型提升药物发现效率。Insilico近期推出“MMAI Gym”平台,用于训练通用大型语言模型(如ChatGPT和Gemini),使其在特定制药任务上的表现接近甚至达到专业模型水平。
Aliper表示,公司目标是构建一个能够同时处理多种药物发现任务、并以“超人精度”完成相关工作的系统。他在接受TechCrunch采访时称,制药行业面临显著的劳动力和人才短缺,而仍有数千种疾病尚无治愈方法或任何治疗方案,其中包括大量被忽视的罕见病,因此“需要更智能的系统”来应对这一挑战。
据介绍,Insilico的平台整合生物、化学及临床数据,用于生成疾病靶点和候选分子的假设。通过自动化原本需要大量化学家和生物学家参与的步骤,公司称能够在庞大的设计空间中进行筛选,提名高质量的候选药物,并探索现有药物的再利用,从而在成本和时间上实现显著节约。该公司近期已利用其人工智能模型,识别现有药物是否可被重新用于治疗肌萎缩侧索硬化症(ALS)这一罕见神经系统疾病。
劳动力瓶颈并不止于药物发现环节。在一些疾病领域,即便人工智能能够识别出有前景的靶点或疗法,仍需在更基础的生物学层面进行干预。基因编辑公司GenEditBio则聚焦于这一环节,试图通过改进体内递送技术,推动罕见病治疗方式的转变。
GenEditBio被归类为CRISPR基因编辑的“第二波”企业,即从体外(ex vivo)细胞编辑转向体内(in vivo)精准递送。公司目标是实现“一次性注射”的基因编辑疗法,直接作用于受影响组织。联合创始人兼首席执行官朱天(Tian Zhu)在接受TechCrunch采访时表示,公司开发了一种专有的工程蛋白递送载体(ePDV),这是一类类病毒颗粒。团队通过人工智能和机器学习方法,从自然界中筛选哪些病毒对特定组织类型具有亲和力,并据此设计递送系统。
朱天所称的“自然资源”,指的是GenEditBio构建的大型库,包含数千种独特的非病毒、非脂质聚合物纳米颗粒。这些纳米颗粒被设计为递送载体,用于将基因编辑工具安全输送至特定细胞。公司介绍,其NanoGalaxy平台利用人工智能分析实验数据,识别化学结构与特定组织靶点(如眼睛、肝脏或神经系统)之间的关联,并据此预测如何调整递送载体的化学性质,以便在不触发免疫反应的前提下携带有效载荷。

在实验层面,GenEditBio通过湿实验室体内测试验证不同纳米颗粒的表现,并将结果回输至人工智能系统,以迭代提升模型预测的准确性。朱天表示,高效且组织特异性的递送是体内基因编辑的前提条件,公司方法有助于降低生产成本,并使这一传统上难以规模化的过程更加标准化。
她将这一模式比作“现成药物”,即同一疗法可用于多名患者,从而在公司看来有望提升药物可及性并降低价格。GenEditBio近期已获得美国食品药品监督管理局(FDA)批准,启动一项针对角膜营养不良的CRISPR疗法临床试验。
在探讨人工智能应用前景的同时,与会企业也提到数据质量与来源仍是关键制约因素之一。与其他人工智能系统类似,生物医药领域的模型训练依赖大量高质量数据,而要在模拟人类生物学的边缘情形方面取得进展,现有数据被认为远远不足。
Aliper指出,目前可用数据集在地域上高度集中于“生成地”——主要是西方国家。他认为,需要在本地加大投入,获取更加均衡的原始或真实世界数据,以提升模型在不同人群中的适用性。Insilico方面称,其自动化实验室正在大规模生成来自疾病样本的多层次生物数据,并在无需人工干预的情况下将这些数据输入人工智能驱动的发现平台。
朱天则表示,人工智能所需的许多信息实际上“已经存在于人体内”,是数千年进化的结果。她指出,只有一小部分DNA直接编码蛋白质,其余部分更类似于调控基因行为的“说明书”。过去人类难以系统性解读这些序列,但包括谷歌DeepMind的AlphaGenome在内的新一代模型,正在逐步提升对这些信息的可访问性。
在公司内部,GenEditBio采用平行测试策略,同时评估数千种递送纳米颗粒,而非逐一测试。朱天将由此产生的数据集称为“人工智能系统的黄金”,用于训练内部模型,并逐步支持与外部合作伙伴的协作。
展望后续研发方向,Aliper表示,构建人体“数字孪生”并开展虚拟临床试验是下一阶段的重要工作之一,但目前仍处于早期阶段。他提到,目前每年获FDA批准的新药数量约为50种,行业面临“瓶颈期”,而全球人口老龄化和慢性疾病增加的趋势,正在推动对更多个性化治疗选择的需求。
