Py学习  »  机器学习算法

《Nature Commun》:机器学习的材料开发领域取得新进展!

材料科学与工程 • 2 年前 • 275 次点击  
















































































































































































































































































































































































































































































































































































材料发现的机器学习,主要集中在预测单个标量,而不是多个相关属性,其中光谱属性是一个重要的例子。基本光谱特性,包括声子态密度(phDOS)和电子态密度(eDOS),它们分别或共同是材料可见性和功能的起源。

在此,来自美国加州大学伯克利分校的Jeffrey B. Neaton& 康乃尔大学的Carla P. Gomes & 加州理工学院的John M. Gregoire等研究者,在晶体材料图形网络编码成功的基础上,引入了一种专门用于预测光谱特性的概率嵌入发生器。相关论文以题为“Density of states prediction for materials discovery via contrastive learning from probabilistic embeddings”发表在NatureCommunications上。

论文链接:
https://www.nature.com/articles/s41467-022-28543-x


光谱特性,在材料科学中无处不在,用于表征晶体结构(如X射线吸收和拉曼光谱)、材料与外部刺激的相互作用(如介电函数和光谱吸收)以及其准粒子的基本特征(如:声子与电子态密度与光谱特性的宽度相匹配的是表征它们的方法的宽度,传统的实验和从头计算技术是材料发现和基础研究的中心。材料发现工作在很大程度上,是通过寻找具有特定性能的材料来定义的,而加速材料发现已经通过实验和计算工作流的自动化实现了。这些高通量技术已被有效地应用于分层筛选策略中,其中高速方法可能牺牲一些准确性和/或精度,可以有效地从资源密集型方法中选择值得详细关注的材料。最近出现的材料性能机器学习预测,由于使用已经训练过的模型预测候选材料的成本极小,因此,引入了更高通量的初步筛选的可能性。为此,研究者将材料引入光谱(Mat2Spec)框架,用于预测晶体材料的光谱特性,在此,演示了预测从头算声子和电子态密度的方法。

材料性能预测机器学习模型的成功开发,取决于结构-性能关系的编码,以提供作为主要筛选工具的预测模型和/或通过训练模型的检查提供科学见解。当材料的稀组分显示出所需的性质时,加速筛选候选材料是特别重要的,这在寻找模范材料时是固有的情况。初步筛选为机器学习(ML)加速材料发现提供了一个很好的机会,但对模型的一般化需求提出了挑战,无论是在预测从未见过的材料的属性,还是在预测训练实例很少的属性值。

CGCNN是最早提出的用于材料性能预测的图神经网络之一。CGCNN将晶体结构编码为图形,其中晶体材料的单元格表示为图形,节点表示原子,连接边表示原子间共享的键。MEGNet通过引入包括温度、压力和熵在内的全局状态输入,扩展了这个概念。该方法首先利用局部注意层捕获局部原子环境的特性,然后利用全局注意层对所有原子环境向量进行加权聚合。该模型的表现力使其在单属性预测方面优于以往的模型。最后,AMDNet证明了另一种不同的方法,它使用结构模体和它们的连接作为GNN的输入来预测金属氧化物的电子性质。

据目前所知,基于GNN的方法尚未被报道用于任何晶体材料的phDOS或eDOS的预测。为了在本工作中建立一个基线GNN模型,研究者将GATGNN应用于频谱预测。

在此,研究者引入了Mat2Spec,它建立在H-CLMP的概念上,通过耦合概率嵌入生成和对比学习的GNN材料编码器,来解决光谱特性预测的开放挑战。在此,Mat2Spec演示了材料项目中一系列具有周期晶体结构的材料的eDOS和phDOS光谱预测。这些态密度代表了从头计算得到的最基本的光谱,表征了材料的振动和电子性质。加上监督对比学习,研究者的材料-光谱(Mat2Spec)模型在预测晶体材料从头开始的phDOS和eDOS方面优于最先进的方法。研究者展示了Mat2Spec识别费米能量以下eDOS间隙的能力,通过从头计算验证了预测,从而发现候选热电和透光导体。Mat2Spec是一个通过战略整合的机器学习技术预测材料光谱特性的范例框架。


图1 Mat2Spec模型体系结构。


图2 从测试集中的phDOS计算出的指标的比较。


图3 测试集的phDOS和eDOS预测示例。


图4 eDOS预测的数据大小依赖。


图5 测试集中用于eDOS预测的损耗指标摘要。


图6 发现有VB间隙的材料。

综上所述,上述的模型学习了合适的材料嵌入来预测phDOS和eDOS,表明该模型也适用于从phDOS或eDOS计算的光谱特性,如声子散射和光谱吸收。研究者希望社区能够参与Mat2Spec扩展到材料性能预测的其他领域。该模型架构和基于分布的学习,可以应用于材料科学以外的科学领域。Mat2Spec的概率嵌入生成器,为人们如何通过先验分布建模人们的潜在分布,提供了重要的控制。因此,通过选择适当的先验分布、模型校准损失和预测损失,该模型可以推广到其他领域。(文:水生

本文来自微信公众号“材料科学与工程”。欢迎转载请联系,未经许可谢绝转载至其他网站。

推荐阅读:
欢迎微信后台回复“应聘编辑”加入我们

实用!Origin软件使用经典问题集锦

免费下载:18款超实用软件轻松搞科研

合作 投稿 点击此处

欢迎留言,分享观点。点亮在看👇

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/130277
 
275 次点击