计算模型可基于常规活检切片图像推断端粒长度

研究人员报告称,一款名为TLPath的计算模型可利用常规医疗活检形成的组织病理切片扫描图像,依据细胞与组织结构特征推断端粒长度。相关研究成果已发表在《Cell Reports Methods》。

该研究由圣福恩·伯纳姆·普雷比斯医学发现研究所团队完成。研究人员基于“细胞与组织形态结构变化可反映端粒长度差异”的假设构建模型。该所癌症代谢与微环境项目助理教授Sanju Sinha表示,细胞在生长和分裂过程中进行DNA复制时,末端部分无法被完整复制;端粒作为染色体末端的重复序列区域,可在复制过程中逐步消耗,从而避免更重要遗传信息的损失。

研究团队同时指出,端粒并非仅是“缓冲区”。在相关研究中,端粒长度与个体生命周期中的实际年龄存在关联;在对大规模人群健康结局的追踪中,端粒长度也被发现可用于预测与衰老相关的慢性疾病风险。Sinha称,端粒在细胞衰老中可能发挥重要作用,仍需要更多研究手段以进一步探究。

在模型训练方面,研究人员使用了基因型-组织表达计划(GTEx)的数据。GTEx是美国国立卫生研究院(NIH)于2010年启动的公共基金项目,旨在建立研究遗传变异如何导致常见疾病的资源。研究团队将来自919名个体捐赠的18种组织类型的常规活检样本,制成并扫描得到5,263张组织病理切片图像,用于训练TLPath。研究人员表示,该数据集将高分辨率切片图像与端粒长度的实验室检测结果配对,为模型学习可用于预测的组织结构特征提供了基础。

研究人员介绍,TLPath的处理流程包括将每张切片平均分割为1,387个方形图像片段(patch),并从每个patch中提取最多1,024个结构特征;模型随后为各特征计算统计权重,并将切片整体评分与对应端粒长度进行比较,从而学习预测关系。在分别针对不同组织类型训练后,研究人员称,该模型能够预测未纳入训练集的GTEx样本端粒长度。

在测试中,研究团队表示,TLPath在端粒长度预测上的准确性优于仅依据捐赠者年龄进行的预测,并可识别同龄个体之间的端粒长度差异。研究人员认为,直接测量端粒长度通常需要更复杂且成本更高的检测手段,而基于切片图像的计算方法在可扩展性上具备潜力,其主要限制在于组织病理切片的扫描图像是否可获得。

研究人员指出,组织病理切片通常由活检制备并用于临床病理审阅,但并不总是被数字化并以类似GTEx的方式向研究人员开放。Sinha表示,无论是新制备切片还是生物样本库保存切片,只要能够被妥善扫描、存储并共享,均可支持更大规模的相关研究。


分享:


发表评论

登录后才可评论。 去登录