四十多年来,“加州黄金州杀手”一直是美国警方未能侦破的悬案。该嫌疑人被指在20世纪70年代和80年代实施连环强奸与杀人,并长期逃避追查。案件在2018年出现转机:一名出于祖源好奇而向家谱公司提交唾液样本的女性,其DNA数据成为调查突破口。
调查人员随后利用公开的GEDmatch数据库比对信息,确认该女性与嫌疑人存在远亲关系,并据此构建家谱网络,最终将线索指向居住在萨克拉门托的前警察约瑟夫·詹姆斯·德安杰洛(Joseph James DeAngelo Jr.)。警方通过其丢弃纸巾中的DNA进行确认。2020年,德安杰洛承认13起谋杀和13起绑架罪行。
该案被认为是首批通过消费者基因检测数据实现重大突破的高调案件之一。此后,越来越多的人向23andMe、AncestryDNA等机构提交样本,用于追溯祖源、了解健康风险或寻找失散亲属。随着基因数据规模快速增长,相关应用扩展的同时,也引发了对隐私、合规与科学边界的讨论。
基因数据扩张带来的执法便利与隐私争议
南加州大学Dornsife学院遗传学家迈克尔·“Doc”·埃奇(Michael "Doc" Edge)指出,尽管美国社会长期对建立国家DNA数据库持谨慎态度,但消费者基因检测在客观上形成了可被检索的庞大数据集合。
埃奇表示,虽然约7%的美国人做过家庭DNA检测,但基于亲缘共享DNA的统计特征,个体可能因亲属上传数据而被间接追踪。他称,“只需约1%的人口将DNA上传至执法可搜索的数据库,几乎所有人都能被找到”,这使得少数参与者在事实上构成了类似“国家DNA数据库”的效果。

在执法层面,这类数据被视为重要线索来源;但在隐私层面,争议随之扩大。埃奇强调,个人上传DNA往往意味着替整个家族作出决定。他的研究还提示,恶意行为者可能操纵相关数据库,使用户及其亲属面临网络钓鱼或其他恶意行为风险。
合规问题同样受到关注。报道提及,2023年一名举报者披露,一些法医家谱学家在调查中常规检索了明确选择不允许执法使用的数据,涉嫌规避数据库规则。
此外,文中还提到寿险公司在理论上可能利用DNA数据评估医疗风险。尽管目前没有证据显示此类情况已经发生,但也缺乏明确法律禁止。埃奇表示,社会对风险格局的理解仍不充分,“我们绝对准备不足”。
研究者提醒:DNA并非“水晶球”
在健康与性状预测方面,研究人员强调基因信息的解释空间有限。研究基因如何影响健康、行为和社会结果的经济学副教授帕特里克·特利(Patrick Turley)表示,外界对基因作用的想象往往被高估。
特利指出,过去人们曾认为可能存在对糖尿病或智商产生重大影响的单个基因,但目前的认识是,多数性状由大量基因共同作用形成,数百万遗传标记以细微方式影响个体,结果体现为概率而非确定性。

在疾病层面,亨廷顿病等少数疾病与单一基因缺陷相关,但更多遗传病涉及复杂的基因网络,每个基因影响微弱,使个体风险预测更为困难。特利同时表示,基因检测仍可作为家族史的补充,帮助提示更早筛查或更频繁监测的必要性。
他强调,遗传风险并不等同于结果。例如将糖尿病风险从20%提高到25%,差异可能很小,却容易被误解为“命中注定”。
即便在常被视为基因预测“成功案例”的身高领域,局限也依然存在。特利提到,研究人员分析了550万个基因组与身高的关联后,最佳模型仍只能解释不到一半的身高差异。
此外,数据代表性问题也影响预测准确性。文中指出,多数基因数据集来自欧洲血统人群,应用于其他族群时准确性下降;在智力或教育成就等复杂性状上差距更明显。特利表示,用基因预测某人是否能高中毕业,“往往对预测个人结果没什么用”。
胚胎选择服务兴起,收益与限制并存
特利还关注胚胎选择这一新兴且具争议的应用。文中提到,旧金山的Orchid Health等公司提供根据遗传风险因素对胚胎进行测试和排序的服务。

特利认为其潜在益处有限:在最佳情况下,从10个胚胎中选择“最佳”一个,糖尿病风险可能从35%降至30%。他同时指出,相关公司很少向客户充分说明这些限制,容易造成误解与过度自信。
DNA检测可能改写家庭叙事与身份认知
除健康之外,DNA检测的影响还延伸至身份、祖源与家庭关系。特利提到,一些从小被告知拥有美洲原住民血统的人,可能在检测中发现基因组中并无相关痕迹;也有人因此得知亲子关系与既有认知不一致。
文中称,基因检测公司对此有所准备,遗传家谱学界将此类情况称为“非亲生事件”,部分公司会在结果可能引发家庭冲击时提供支持服务推荐。
埃奇在其遗传学课程中提出,DNA并非定义家庭的唯一标准。他表示,在课堂语境中提及“父母或堂兄弟”更多是对配子来源的简写,而现实中家庭的定义可以多元,且往往更有意义。他指出,共同经历、选择的承诺与共同生活等纽带,DNA本身无法说明。
埃奇还提到,尽管基因检测常被视为揭示“真正身份”的工具,但个体从遥远祖先继承的DNA比例有限,“你与十代祖先共享的DNA并不比与陌生人多”。在基因数据库持续扩张的同时,围绕隐私边界、合规使用与科学解释的讨论仍在延续。
