新一代人工智能模型正以更高的复杂度解读人类基因组:不再局限于逐一识别DNA中的单个突变,而是尝试推断基因序列如何影响细胞与器官功能,并进一步关联到疾病表现。相关报道指出,若早期研究结果获得验证,基因检测与药物研发有望从以往较为缓慢、以假设为主的路径,转向更接近实时的生物学模拟与验证。
这一变化并非单一技术突破所致。多篇报道提到,模型能力提升与大规模参考数据集的积累、新实验室技术的发展,以及制药研发流程围绕人工智能的调整同步发生。综合趋势指向一个方向:DNA所承载的生物学信息将更可被检索、测试,并用于医学研究与开发。
从遗传变异分类走向疾病风险推断
报道显示,最显著的变化之一在于,人工智能开始被用于“读懂”DNA序列本身的规律,而不仅是对遗传变异进行标签化分类。谷歌DeepMind开发的系统被描述为能够读取较长的遗传代码片段,并推断其如何影响细胞生长与功能所需分子的生成,从而把原始序列转化为生物学层面的预测。相关报道强调,该模型通过学习基因组中的模式,将DNA的四字母序列视作一种可解析的结构化“语言”,并可推广到未见过的新序列。
在临床应用探索方面,其他团队也在推进将基因突变与潜在疾病结局相连接的模型,用于对变异的潜在危害性进行评分。报道提到,Broad研究所的系统popEVE可估计患者基因组中每个变异导致疾病的可能性,并被用于加速罕见病诊断项目。多项工具的共同目标,是推动基因检测从静态检测面板,转向能够在个人基因组整体背景下进行解读的动态模型。
“基础模型”设想:以单一系统整合基因检测能力
多篇报道还提出更具整合性的设想:将上述能力汇聚到一个基础模型中,作为基因医学的核心枢纽。报道中的AlphaGenome系统被描述为可摄取完整基因组,并推断变异组合对健康的影响,而非将每个突变孤立处理。相关报道指出,该系统的训练依据更贴近细胞内的指令信息,而不仅是整理后的变异清单。
报道同时称,AlphaGenome可协助专家定位与特定疾病相关的基因或识别罕见病病因,被形容为复杂病例的“分诊引擎”。在能力指标上,该系统据称可评估43种不同的遗传活性功能读数,体现其被用于跨多个生物学层面进行推理。另有后续报道提到,同一引擎还可标记潜在药物靶点,使检测与治疗设计之间的边界趋于模糊。

人工智能在药物研发中从辅助工具走向默认起点
在药物研发环节,相关分析认为,人工智能正从小众工具转向新项目的默认起点。一项分析提出,到2026年,疾病靶点识别可能更多以人工智能引导的模型为起点,模型将整合基因组学、影像学与临床数据,替代过去各数据集相对割裂的分析方式。同一分析还指出,基因组数据规模已达到前所未有的水平,研究方法需要从传统生物信息学代码,转向新的生物学方法体系。
行业人士也在公开表态中给出时间表与量化预期。Sapio Sciences创始人兼CTO兼CEO Kevin Cramer在专访中表示,到2025年,人工智能将改变早期药物研发,研究人员可通过自然语言与交互式对话查询复杂数据集。另据Paul Hudson的相关评论,他预计到2025年人工智能将驱动30%的新药发现,并在临床前阶段降低25%至50%的成本;该表述将相关收益直接归因于人工智能应用。
从预测到干预:药物组合与基因编辑的AI化
多篇报道强调,解读DNA只是第一步,关键在于能否提出可验证的干预方案。报道提到,一项被称为“疾病细胞中新人工智能工具”的工作,能够识别多种疾病驱动因素,并提出可逆转细胞疾病状态的药物组合。该系统通过同时搜索基因网络与化合物库,将以往难以处理的组合问题转化为可在计算机上探索的任务。
在基因编辑领域,报道指出REPROCELL推出StemEdit平台,提供临床基因编辑服务,并使用人工智能设计编辑系统与新型诱导多能干细胞系。REPROCELL在公告中表示,相关细胞系与编辑系统旨在支持临床与转化应用,显示算法驱动的编辑设计正从研究概念走向受监管的服务形态。
数据与基础设施:模型可靠性与实验闭环的关键支撑
为提升模型可靠性,报道普遍强调对大规模、精心策划数据集的依赖,尤其是能够反映基因在真实组织中表现的数据。Illumina推出的Billion Cell Atlas被描述为迄今最全面的人类疾病生物学单细胞视图之一,旨在让研究人员在更大规模的细胞数量与条件下验证人工智能预测。Illumina的相关说明称,该图谱将支持在迄今最大的人类疾病生物学地图上对人工智能模型进行验证。
与此同时,人工智能系统也被描述为从静态模型向更主动的形态演进。有关基础模型与代理在药物研发中的讨论提到,大型生物模型正与机器人及实验室自动化结合,使人工智能系统能够规划实验、执行实验并循环解读结果。另有关于2026年医学预测的评估称,医疗人工智能正从“炒作高峰”走向“启蒙初期”,并预计到2026年底,主动型人工智能与生成式人工智能将与临床专业知识协同工作。
