每个晶体的外形通常对应其内部的分子排列方式。研究人员指出,在一类被称为“光开关晶体”的材料中,分子可在光照触发下改变构型,使晶体发生形变、扭曲并伴随性质变化,涉及颜色与电子导电性等特征,因此在制药、数据服务器等应用场景中受到关注。不过,相关晶体形态与性质的可控性仍然有限。
布法罗大学文理学院化学系教授Jason Benedict带领团队以二噻吩乙烯(dithienylethene)为代表的光活性分子开展结晶研究,尝试获得19种不同晶体结构,但其中仅有两种对光照表现出响应。Benedict表示,这一结果促使团队进一步追问:哪些晶体结构更有利于光活性表现,以及为何大量光活性分子最终会以非光活性形态被“锁定”。
为此,团队提出一种新的晶体观察与比较框架:不再将单个晶体结构视为孤立对象,而是把它们纳入更大规模的定量分析体系,作为可比较的数据点。该方法被称为D–D分析,旨在测量光活性分子在数万个可能晶体结构(晶格)中的排列方式,并将几何排列转化为数值数据,以用于识别哪些结构更可能具备光活性,同时解释大量结构缺乏光活性的原因。

Benedict指出,剑桥结构数据库(Cambridge Structural Database)作为全球整理规模最大的晶体结构数据库,已收录超过100万个晶体结构。他表示,研究应从“单一结构”扩展到“结构集合”,并考察几何形状与光活性及其他性质之间的关系。Benedict同时担任UB Hauptman-Woodward研究所临时主任。
在研究路径上,团队还提出对晶体研究实践的调整建议,包括扩展“晶体景观”的定义,将晶体几何形状纳入分析维度,并鼓励研究人员像报告成功结果一样,公开发表未能获得光活性等“失败”结晶结果。Benedict称,许多光活性晶体的成功生长在很大程度上带有偶然性,团队希望通过数据化方法提升过程的可解释性。
传统上,“晶体景观”多以能量为核心指标,用能量高低描述分子可能形成的晶体结构范围:低能量结构更稳定,高能量结构相对不稳定。这一框架在药物研究中应用广泛,制药企业通常关注药物分子的最低能量晶体结构。Benedict团队则尝试用D–D分析从几何角度构建晶体景观:当晶体结构被数值化后,可在“地图”上形成数据点并聚类为几何相近的结构簇,研究人员可据此比较不同簇之间的共性与差异,进而寻找影响结晶结果的条件线索。

团队同时注意到,数据库中光活性晶体结构的公开记录可能相对偏多,而非光活性结构的披露不足,可能导致数据分布失衡。Benedict表示,这种偏差会影响后续基于数据的分析,尤其在机器学习工具日益用于化学研究的背景下,训练数据的偏倚可能使算法将某些“常见特征”误判为光活性的原因。
在公开“失败结果”方面,Benedict团队已将其获得的非光活性晶体结构发表于国际晶体学联合会期刊《IUCrJ》。他表示,理解为何会得到非光活性晶体,是提高获得光活性晶体概率的必要前提。
此外,团队近期利用D–D分析得到一项与传统预期不完全一致的观察:二噻吩乙烯这类光活性分子并不总是结晶为其低能量结构。研究显示,紧密堆积作用可能将分子推向高能量结构并使其稳定,从而维持一种按常规判断应更不稳定的形态。相关结果发表于2024年《晶体生长与设计》(Crystal Growth & Design)。Benedict表示,这一发现对晶体工程,尤其是晶体结构预测提出更高挑战,而如何应对仍有待进一步研究;团队希望其方法至少能帮助研究者更清晰地识别晶体形成的规律。
