Google DeepMind推出一款名为AlphaGenome的人工智能模型,旨在将人类基因组中长期难以解读的非编码区域转化为可分析的信息,并评估单个碱基变化可能引发的调控效应。该模型把DNA序列视作“语言”进行建模,可在长序列范围内预测微小编辑对基因调控的连锁影响,从而在研究人员提出编辑方案时,标记可能带来风险的变更。
从蛋白质折叠转向基因调控
DeepMind此前因蛋白质结构预测而受到关注。AlphaGenome则将重点放在决定细胞何时、何地制造蛋白质的调控指令上。根据Ziga Avsec和Natasha Latysheva对系统的描述,AlphaGenome属于单一统一的DNA序列模型,在同一架构中整合多模态预测、长程上下文与碱基对分辨率:模型以原始DNA序列为输入,输出对调控效应的高分辨率预测,用于从序列层面学习基因组的“语法”。
《自然》杂志对相关研究的介绍指出,许多与疾病相关的遗传变异并不直接破坏蛋白质编码序列,而是通过改变基因在特定时间和组织中的激活方式产生影响。报道提到,AlphaGenome将长序列上下文与细粒度预测统一起来,用于推进对调控变异效应的预测,并被定位为解码基因组调控密码的工具。
一次处理百万碱基,覆盖非编码“暗物质”
AlphaGenome的关键特征之一是可在单次分析中处理多达一百万个DNA碱基,从而在更大范围内理解序列之间的关系,而非仅对短片段进行孤立判断。相关报道强调,这种长程视角有助于捕捉远距离增强子、沉默子等调控元件在广阔基因组邻域中的相互作用。
这一能力被用于指向所谓的“暗黑基因组”——不编码蛋白质但参与调控基因表达的非编码区域。围绕AlphaGenome的分析提到,该系统试图通过预测非编码变异受突变影响的方式,以及这些变化如何与复杂疾病相关,来应对DNA中的“暗物质”难题。
评估单碱基“错字”的功能后果
多篇报道将AlphaGenome的实用价值归结为:预测DNA中单个字母级别的变化如何改变细胞内的调控过程。一份遗传学相关报道称,该模型可模拟基因组中11种生物活动的变化,用于把单核苷酸变异与潜在功能结果联系起来。

另有报道指出,通过模拟单核苷酸变异对调控活性的影响,AlphaGenome能够区分哪些编辑可能扰乱基因表达、哪些可能相对良性。这类能力被认为对遗传变异解读、诊断研究以及基因编辑方案评估具有意义。
面向药物发现、肿瘤学与“定制”序列设想
关于应用方向,相关市场分析提到,DeepMind将AlphaGenome定位为加速药物发现与个性化肿瘤学的基础工具之一,核心在于通过预测调控变异如何塑造疾病路径来支持研究。
在更具前瞻性的设想中,DeepMind科学项目基因组学负责人Ziga Avsec表示,AlphaGenome可用于创建新的DNA序列,使其能够以更精确的方式响应香烟烟雾、压力或病原体等条件,即通过设计调控“电路”让基因在特定情境下被激活。相关讨论将其描述为:模型不仅用于读取基因组,也可用于预测合成序列的行为,以支持更安全的疗法设计。
开放非商业代码并推动研究者使用
DeepMind同时推进模型的可用性。报道显示,AlphaGenome代码将向研究人员开放用于非商业用途,使其从专有系统转向可被全球实验室测试、验证与扩展的共享工具。
此外,DeepMind及其合作伙伴也通过网络研讨会等形式介绍模型使用方式。相关活动以“解码调控暗物质”为主题,面向研究人员说明AlphaGenome如何帮助发现驱动复杂疾病的非编码变异,以及如何与计算生物学工具结合使用。
