在生物学中,缺陷通常是不利的,但在材料科学领域,缺陷却可以被有意调控,从而赋予材料新的有用特性。如今,在钢铁、半导体和太阳能电池等产品的制造过程中,原子级别的缺陷被精确引入,以增强材料强度、调控电导率并优化性能等。
然而,尽管缺陷已成为强大的工具,准确测量成品中不同类型及浓度的缺陷仍然具有挑战性,尤其是在不破坏材料的情况下。工程师若不了解材料中的缺陷情况,可能会导致产品性能不佳或出现意外特性。
麻省理工学院的研究团队开发了一种基于人工智能的模型,能够利用非侵入性的中子散射技术数据,对材料中的缺陷进行分类和定量分析。该模型在2000种不同半导体材料数据上训练,能够同时检测材料中多达六种点缺陷,这在传统技术中是难以实现的。
材料科学与工程系博士生、论文第一作者程谋阳表示:“现有技术无法在不破坏材料的情况下,普遍且定量地准确表征缺陷。没有机器学习,检测六种不同缺陷几乎是不可能的,这种方法是独一无二的。”
研究人员认为,该模型为更精准地利用缺陷优化半导体、微电子、太阳能电池及电池材料等产品迈出了重要一步。
核科学与工程副教授、论文资深作者李明达说:“目前检测缺陷就像看大象一样:每种技术只能看到部分,比如鼻子、象耳或象腿,但很难看到完整的大象。我们需要更好的方法全面了解缺陷,才能更好地利用材料。”
参与本研究的还有博士后傅楚亮、本科生余博文、硕士生罗恩碧、博士生阿比贾特梅迪·乔特拉塔纳皮图克(Abhijatmedhi Chotrattanapituk)以及橡树岭国家实验室的道格拉斯·阿伯纳西博士和程永强。相关论文已发表于《Matter》期刊。
缺陷检测的挑战
制造商已能较好地调控材料中的缺陷,但对成品中缺陷的精确测量仍多依赖估算。
傅楚亮指出:“工程师通过掺杂等方法引入缺陷,但仍难以准确知道缺陷类型和浓度,有时还会产生氧化等不想要的缺陷,合成过程中是否引入杂质也难以确认,这一直是难题。”
材料中往往存在多种缺陷,而现有检测方法各有局限。X射线衍射和正电子湮灭技术只能检测部分缺陷类型;拉曼光谱能区分缺陷类型但无法直接测量浓度;透射电子显微镜则需要切割样品制备薄片,具有破坏性。
李明达及其团队此前已将机器学习应用于晶体材料的光谱数据分析,这次他们尝试将该技术用于缺陷检测。
研究团队构建了包含2000种半导体材料的计算数据库,每种材料制备一对样品,一种掺杂引入缺陷,另一种保持无缺陷状态,利用中子散射技术测量材料中原子的振动频率差异,并以此训练机器学习模型。

程谋阳介绍:“该模型涵盖周期表中56种元素,采用类似ChatGPT的多头注意力机制,提取有无缺陷材料数据的差异,预测掺杂元素及其浓度。”
经过微调和实验验证,模型成功测量了电子工业常用合金及超导材料中的缺陷浓度。
研究人员还通过多次掺杂引入多种点缺陷,测试模型极限,发现其能同时预测多达六种缺陷,且最低检测浓度可达0.2%。
程谋阳表示:“模型表现超出预期,解码两种缺陷的混合信号已很难,更别说六种了。”
模型的应用前景
目前半导体制造商通常对少量产品进行侵入式检测,过程缓慢且难以全面发现缺陷。
余博文说:“目前对缺陷数量多靠估算,使用单一技术检测既费时又只能获得局部信息,容易导致对材料缺陷的误判。”
尽管研究成果令人振奋,但测量振动频率的中子散射技术难以快速应用于工业质控。
罗恩碧指出:“振动光谱概念简单,但实验装置复杂。相比之下,基于拉曼光谱的简易实验设备更易推广。”
李明达表示,已有企业对该方法表现出兴趣,并询问何时能应用于拉曼光谱。团队下一步计划训练基于拉曼光谱数据的类似模型,并扩展检测范围至晶粒和位错等更大尺度缺陷。
目前,研究人员认为他们的工作展示了人工智能在解析缺陷数据方面的独特优势。
李明达总结:“对人眼来说,这些缺陷信号几乎无异,但AI的模式识别能力足以区分不同信号,揭示真实情况。缺陷是一把双刃剑,适量有益,过多则损害性能。我们的研究为缺陷科学开辟了新范式。”
本研究部分由美国能源部和国家科学基金会资助。