学术干货丨揭开材料基因组面纱——高通量计算平台简介


一、引言

新材料从设计到商用化有18年的平均开发周期,继美国材料基因组计划后,我国也于2016年开始了材料基因组重大科研专项,旨在通过高通量材料计算和材料数据共享平台促进新材料的研发。在国内外有诸多典型案例,如Materials Project、AFLPWlib、OQMD与Citrine等。此文以Materials Project为例简阐高通量材料计算框架和其在具体材料开发中应用,该工程的基于WEB分享材料数据的主页是了解Materials Project的第一站。

图一 The Materials Project的主页

二、Materials Project高通量计算平台简介:

Materials Project项目已收录约65000种ICSD中存在的材料的第一性原理计算数据,这样大规模材料数据集对材料的开发有着显著的作用。而它的建立依赖高性能计算集群和运行其上的用于高通量计算任务的一系列具有特定功能的程序。其中,下图概括了Materials Project的工作流程。

图二Materials Project的工作流程

Python Materials Genomics (pymatgen)是进行高通量材料计算的强大程序包之一。它规范了运行高通量计算前所需的初始化设置,并提供针对计算所产生的数据的流程化分析。我们可以通过下图来对其提供服务有一个直观了解。需要注意的是,Pymatgen也提供了基于Hypertext Transfer Protocol (HTTP)协议获取MaterialsProject数据库中材料数据的接口。

图三  Pymatgen的工作原理图

FireWorks(FWS)的功能是对高性能计算集群上运行的高通量计算工作流进行作业管理。该软件是采用python编写,同时与MongoDB实现数据交换,他们共同满足JavaScript Object Notation (JSON)数据交换格式。用户可以通过定制launchPad和FireWorkers来满足特定计算任务的作业管理需求。FWS的程序架构的简易图示如下。

图四 FWS的程序架构的简易图示

同时我们可以通过定义fws文件来使得作业按照设想在计算集群上批量运行。

图五 FWS的文件语法

图六 FireWorks任务架构

同时,FWS借助Appache也实现了对运行在超算上的计算作业的实时监控。

图七 计算任务监视界面

最后,Custodian对计算任务运行过程中可能出现的错误进行合理校正。以上这些功能保证了FWS在高性能计算集群上超长时间稳定运行大量材料的第一性原理计算和数据分析。

三、Materials Project 对功能材料开发的影响

运行在Materials Project上的高通量计算已促进了多种新型材料的设计研发。例如,Prof. Ceder等人通过高通量筛选LiA 0.5 B 0.5 O 2化合物结构空间,成功预测LiCo 0.5 Zr 0.5 O 2这一高能量密度锂电材料,并已被实验所证明。

图八 高通量筛选

图九  LiCo 0.5 Zr 0.5 O 2 的实验验证(参考文献配图)

高通量第一性原理计算所产生的材料性质数据,同时也是用于机器学习的很好的学习样本,通过定义恰当的材料问题,可以通过数据挖掘算法形成描述器,并用于未知材料数据集或材料性质的预测。Stefano Curtarolo, Gerbrand Ceder, Kristin A. Persson 及Mark Asta 等人通过对已知的约1000种无机化合物来自高通量计算的材料数据,通过机器学习的方法产生了描述器,并将其用于材料力学性质预测,与材料实验数据获得了很好的匹配。材料数据由Materials Project的高通量第一性原理计算平台所产生,以下给该工作FireWorks的工作流程图。

图十 该任务的FireWorks的工作流程图

对于机器学习所产生的材料预测数据, Prof. Asta 等人也将对它们进行了可视化处理,使得数据拥有了很好的可读性。

图十一 材料数据可视化

与材料实验数据的对比, 验证材料预测数据的准确性,如图所示。

图十二 预测数据与实验数据对比

三、小结:

诸如Materials Project, AFLOWlib之类的高通量计算材料开发平台, 有效的缩短了新材料的开发周期, 显著降低新材料开发成本。 高性能计算集群的开始发展, 以及数据挖掘在海量材料数据中的成功应用使得材料基因组计划展现出巨大的潜在经济价值。

四、主要参考文献:

 [1]Eagar,T.; King, M. Technology Review (00401692) 1995, 98, 42.

[2]Anubhav Jain, Kristin A. Persson, and Gerbrand Ceder, Research Update: The materials genome initiative: Data sharing and the impact of collaborative ab initio databases, APL MATERIALS 4, 053102 (2016) .

 [3]S.P. Ong, W.D. Richards, A. Jain, G. Hautier, M. Kocher, S. Cholia, et al. ,      Comput. Mater. Sci. 68 (2013) 314–319.

[4]Jain, S.P. Ong, D. Gunter, W. Chen, B. Medasani, X. Qu, et al., Fireworks: a

dynamic workflow system designed for high-throughput applications,

Concurr. Comput. Pract. Exp. (2014) .

[5]A Urban, I Matts, A Abdellahi, G Ceder, Computational Design and Preparation of Cation‐Disordered Oxides for High‐Energy‐Density Li‐Ion Batteries, Adv. Energy Mater. 2016, 1600488.

[6]Maarten de Jong , Wei Chen,  Thomas Angsten , Anubhav Jain, Randy Notestine, Anthony Gamst, Marcel Sluiter, Chaitanya Krishna Ande, Sybrand van der Zwaag,Jose J. Plata, Cormac Toher, Stefano Curtarolo, Gerbrand Ceder, Kristin A. Persson &Mark Asta,Charting the complete elastic properties of inorganic crystalline compounds,SCIENTIFIC DATA, 2:150009.

本文由材料人编辑部学术干货组pengyuman供稿,材料牛编辑整理。

材料人网向各大团队诚心约稿,课题组最新成果、方向总结、团队访谈、实验技能等皆可投稿,优秀稿件一经录用,我们会奉上稿酬,请联系:邮箱tougao@cailiaoren.com 或 QQ:97482208。

材料人现已邀请材料计算各方向人才入驻网站,对外提供材料计算服务。如有需求,欢迎进入测试谷网联系服务商,或直接联系材料计算客服QQ:825116915。

分享到