发现具有超高性能的材料配方一直是材料科学研究中的主要瓶颈之一。在近乎无穷大的化学成分设计空间搜索到具有稳定结构且有某种性能的材料搜索无异于大海捞针。这是因为绝大部分化学元素的混合组成都不能形成结构稳定且满足化学条件可合成的化合物。光是基本的5元化合物,其组合空间(不含掺杂)就多达1013以上。而目前人类已知的无机晶体化合物才二十万种左右。这种给定各种积木块(如原子、氨基酸、电子元件),需要找出满足各种功能条件的组合设计问题在新材料设计、化合物设计、药物分子设计、电路设计等诸多领域都面临如何有效地搜索具有约束和隐性组合规则的设计空间搜索问题。
该研究提出了一种利用深度学习中的生成对抗神经网络模型MATGAN通过机器学习算法从已知无机材料化学式中学习化学元素组合成稳定化合物的隐性组合规则,从而能够生成千万级以上的新的无机材料化学分子式。来自中国贵州大学机械工程学院与美国南卡罗来纳大学计算机科学系与机械工程系的胡建军教授、李少波教授、胡明教授团队通过应用人工智能中的深度神经网络对ICSD、OQMD、MaterialsProject等无机材料数据库中的材料化学式进行训练,发现他们得到的生成式机器学习模型能够学习到组合不同元素形成符合化学电中性与电负平衡且具有稳定结构的材料的各种化学显式与隐式规则(尽管在他们的模型中没有给定这种规则),从而使得他们的模型能够大规模生成各种满足化学条件的新材料采样点,避免了以前枚举法或其他启发式算法大量遍历无效分子式的缺点。
他们生成的2百万种分子式中,发现了很多训练集里面没有包括的化学材料,得到了其他材料数据库的验证或者最近新材料发现文献报道的间接验证。这种算法有助于生成超大规模的新材料配方候选方案,以便进一步进行计算或者实验验证。这种通过生成对抗神经网络自动从大量已知设计方案中学习各种隐性设计规则,然后应用于生成式创新设计的方法在无机材料、有机分子、药物分子、蛋白质、电路等各种创新设计中具有广泛的应用潜力。
该文近期发表于npj Computational Materials 6: 84 (2020),英文标题与摘要如下,点击https://www.nature.com/articles/s41524-020-00352-0可以自由获取论文PDF。
Generative adversarial networks (GAN) based efficient sampling of chemical composition space for inverse design of inorganic materials
Yabo Dan, Yong Zhao, Xiang Li, Shaobo Li, Ming Hu & Jianjun Hu*
A major challenge in materials design is how to efficiently search the vast chemical design space to find the materials with desired properties. One effective strategy is to develop sampling algorithms that can exploit both explicit chemical knowledge and implicit composition rules embodied in the large materials database. Here, we propose a generative machine learning model (MatGAN) based on a generative adversarial network (GAN) for efficient generation of new hypothetical inorganic materials. Trained with materials from the ICSD database, our GAN model can generate hypothetical materials not existing in the training dataset, reaching a novelty of 92.53% when generating 2 million samples. The percentage of chemically valid (charge-neutral and electronegativity-balanced) samples out of all generated ones reaches 84.5% when generated by our GAN trained with such samples screened from ICSD, even though no such chemical rules are explicitly enforced in our GAN model, indicating its capability to learn implicit chemical composition rules to form compounds. Our algorithm is expected to be used to greatly expand the range of the design space for inverse design and large-scale computational screening of inorganic materials.
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved