高熵合金因可在苛刻环境中提供强度、稳定性与耐久性,被视为先进材料研究的重要方向之一。但由于元素以近等比例组合带来极其庞大的成分空间,筛选出具备应用价值的配方往往成本高、周期长。
在此背景下,日本先进科学技术研究院(JAIST)Dam Hieu-Chi教授团队开发了一种面向高熵合金发现的人工智能驱动框架,旨在把实验数据、计算建模结果与从科学文献中提取的跨学科专家知识整合到同一体系中,以提升对研究较少合金成分的预测能力。相关研究于2025年12月19日发表在《Digital Discovery》。论文合著者包括日本学术振兴会(JSPS)研究员Ha Minh-Quyet博士、JAIST博士生Le Dinh-Khiet、日本高性能计算系统公司(HPC Systems)的Nguyen Viet-Cuong博士、日本统计数学研究所Kino Hiori教授,以及美国杜克大学Stefano Curtarolo教授。
研究团队指出,现有材料领域的机器学习方法多擅长对与训练数据相近的样本进行预测,但在探索全新成分时准确性容易下降。同时,关于元素在高熵合金中相互作用与可替代关系的经验知识长期分散在不同学科文献中,缺少有效机制将其系统纳入数据驱动模型。

该框架以合金设计中的“元素替代”理念为核心:在条件合适时,化学性质相近的元素可相互替换而不显著改变材料性能与稳定性。研究人员首先从大型材料数据集中,通过比较仅相差一个元素的合金来识别替代模式;随后使用包括GPT-4o、GPT-.5、Claude Opus 4和Grok3在内的大型语言模型,从冶金学、固态物理学、材料力学、材料科学与腐蚀科学五个学科的文献中提取专家判断。
团队强调,各信息来源提供的是“证据片段”而非单一结论,这些证据通过Dempster-Shafer理论进行融合,以在输出预测的同时量化不确定性。Dam Hieu-Chi表示,传统分类器在信息不足时仍会给出二元判断,而该方法允许“无法判断”作为一种可被接受的科学结果,从而避免在未知区域作出过度确定的推断。
在多个合金数据集的测试中,研究人员称该框架整体表现优于传统机器学习模型,尤其在信息匮乏场景下更为明显。研究显示,该方法能够对训练数据中完全未出现元素的合金行为进行预测,准确率在86%至92%之间。

研究团队还利用文献中55种经实验确认的四元合金对方法进行验证,结果显示其性能优于计算成本更高的自由能模型。除单点预测外,该框架还能生成成分图,标示预测可靠区域与不确定性较高区域,以帮助研究人员将实验资源集中于更具潜力或信息增量更大的成分空间。
研究人员同时表示,这一“文献知识提取+证据融合+不确定性量化”的思路可扩展至其他跨学科研发任务,包括药物发现、电池开发与催化剂优化等场景,用于在实验成本较高、数据分布不均的情况下提升筛选效率并降低试错成本。
