Communications Materials: 详解图神经网络在化学和材料科学中大展宏“图”


一、【导读】

机器学习在化学和材料科学的许多领域发挥着越来越重要的作用,用于预测材料特性、加速模拟、设计新结构和预测新材料的合成路线。图神经网络 (GNN) 是增长最快的机器学习模型类别之一。图神经网络与化学和材料科学十分契合,因为它们可以直接处理分子和材料的图形或结构表示,并且通过神经网络的信息传递过程,最大限度地获得分子和材料的“构效关系”。近日,一篇综述概述了GNN的基本原理、广泛使用的数据集和最先进的架构,然后讨论了GNN在化学和材料科学中的广泛最新应用,并给出了 GNN 进一步开发和应用的路线图。

二、【成果掠影】

2022年11月,德国卡尔斯鲁厄理工学院Pascal Friederich团队综述了图神经网络(GNN)在化学和材料研究中成果和进展,为把握最新的AI4Sci的技术手段提供了一份详尽的内容宝典。

相关研究工作以“Graph neural networks for materials science and chemistry”为题发表在Communications Materials上。

三、【核心创新点】

讨论了当前广泛使用的GNN形式;展示了最新的GNN架构、广泛使用的数据集以及GNN用于逆向设计的初步成果。

四、【数据概览】

1 GNNs的工作原理概览。a GNN处理分子和晶体材料时,信息传递的示意图。b 2017年以来,各种GNNs在QM9数据集上的表现结果,以预测值的平均绝对误差展示,红色圆圈:总能;橘色三角形:HOMO;蓝色倒三角形:LUMO。 © 2023 The Authors

2 GNN在分子和材料体系中性质预测的应用。a GNN可以预测ADMET性质、可以囊括原子的环境信息、预测分子对蜜蜂的毒性b基于强化学习的GNN用于分子的逆向设计c GNN用于无模版逆合成d GNN用于可迁移激发态动力学过程预测,粗粒化模型e可解释GNN模型f晶体GNN预测甲烷在MOF上的吸附体积g GNN预测HF气体在Al2O3表面的反应以及多晶材料的磁致伸缩效应h GNN用于液相或玻璃态的分类。© 2023 The Authors

表1 常用的“分子图表示”中的节点、边上的特征选取© 2023 The Authors

2 分子和材料研究中“图机器学习”常用的基准数据库© 2023 The Authors

3 “图神经网络”架构(按类别划分)© 2023 The Authors

表4 材料领域中的数据库(按应用类别给出)© 2023 The Authors

五、【成果启示】

在AIGC(机器学习生成内容)成为流行的当下,AI for Science也成为了必然趋势之一。迈向基于 GNN 的生成模型的第一步已经存在,但是在可靠性和可迁移性方面存在许多开放性挑战。为了使生成模型更具应用相关性,未来需要对GNN框架设计进行规范,加入更多的控制条件,生成具有期待性质的分子或者材料。最后,设计更多具备可解释性的GNN 模型,将有助于更好地了解大型复杂数据集中的潜在相关性和最终因果关系,最终有助于科学认识与进步。

原文详情https://www.nature.com/articles/s43246-022-00315-6

本文由Pearl供稿

 

分享到