4
Help us understand the problem. What are the problem?

More than 1 year has passed since last update.

posted at

updated at

Materials Projectで取得できるデータを徹底的に理解する!

はじめに

Materials Projectで取得できるデータについて詳細に解説していきます。Materials Projectの概要やデータの取得方法はこちらにて解説していますので、是非参考にして下さい。

※マテリアルズインフォマティクス関係の内容を他にも投稿していますので、よろしければこちらの一覧から他の投稿も見て頂けますと幸いです。

Materials Projectからのデータの取得

データの取得方法は前回の投稿こちらに詳しく書かれていますので、参考にしてみてください。

環境

  • windows10
  • conda 4.9.2
  • python 3.7.1
  • rdkit 2020.03.2.0
  • pymatgen 2020.4.29
  • pandas 1.1.5

NaClのデータの取得

例として、NaClのデータを以下のコードで取得していきます。こちらの投稿を参考にさせて頂きました。

# ライブラリのインポート
import pandas as pd
from pymatgen.ext.matproj import MPRester

# Materials Project の API キーの入力(自分のAPI keyを入力)
API_KEY = 'Your API'   

# m.get_data(chemsys_formula_id)は Material Projectから指定化合物のデータを取得
# chemsys_formula_id は、元素の組み合わせ(e.g.,Li-Fe-O)、化合物名(e.g.,Fe2O3)、
# Material Projectの材料id (e.g., mp-1234)のいずれかを入力
with MPRester(API_KEY) as m:
    NaCl_df = pd.DataFrame(m.get_data('NaCl',data_type='vasp'))

# 結果を保存
NaCl_df.to_csv('NaCl_df.csv')
# 結果を出力
NaCl_df

2つのデータが取得されたことが分かります。この2つについてもう少し詳しく見ていきます。

NaCl_df[["e_above_hull", "band_gap"]]

Nacl_df.png

2行目の1のデータの方がe_above_hullが小さく、より安定であることが分かります。(e_above_hullの意味は以下で解説していきます)今回は2行目の1のデータを題材として採用します。参考にさせて頂いたページでは結晶構造に着目し、2行目の1のデータの方がより一般的であると結論づけていました。なお、Materials Projectで検索した結果が以下です。赤枠でNaClを示していますが、この2つが取得できていることが分かります。

mp_NaCl.png

Materials Projectから取得したデータの解説

取得したNaClのデータを詳しく見ていきます。

NaClのデータの詳細

PROPERTIES NaClの値
energy -6.77627872
energy_per_atom -3.38813936
volume 46.0961483324369
formation_energy_per_atom -2.10388776329666
nsites 2
unit_cell_formula {'Na': 1.0, 'Cl': 1.0}
pretty_formula NaCl
is_hubbard FALSE
elements ['Na', 'Cl']
nelements 2
e_above_hull 0
hubbards {}
is_compatible TRUE
spacegroup {'symprec': 0.1, 'source': 'spglib', 'symbol': 'Fm-3m', 'number': 225, 'point_group': 'm-3m', 'crystal_system': 'cubic', 'hall': '-F 4 2 3'}
task_ids ['mp-655654', 'mp-656552', 'mp-656209', 'mp-22862', 'mp-1141489', 'mp-1440825', 'mp-1593596', 'mp-1592749', 'mp-1686774', 'mp-1792313']
band_gap 5.14509999999999
density 2.10530608435761
icsd_id
icsd_ids [18189, 240599, 240604, 61662, 53816, 240598, 100633, 240601, 52232, 622369, 41411, 44277, 240603, 52233, 165592, 240602, 240600, 181148, 162800, 169462, 28948, 41439, 60280, 655785, 53815]
cif # generated using pymatgen
data_NaCl
symmetry_space_group_name_H-M 'P 1'
_cell_length_a 4.02463542
_cell_length_b 4.02463542
_cell_length_c 4.02463542
_cell_angle_alpha 60.00000000
_cell_angle_beta 60.00000000
_cell_angle_gamma 60.00000000
_symmetry_Int_Tables_number 1
_chemical_formula_structural NaCl
_chemical_formula_sum 'Na1 Cl1'
_cell_volume 46.09614833
_cell_formula_units_Z 1
loop

symmetry_equiv_pos_site_id
_symmetry_equiv_pos_as_xyz
1 'x, y, z'
loop

_atom_site_type_symbol
_atom_site_label
_atom_site_symmetry_multiplicity
_atom_site_fract_x
_atom_site_fract_y
_atom_site_fract_z
_atom_site_occupancy
Na Na0 1 0.00000000 0.00000000 0.00000000 1
Cl Cl1 1 0.50000000 0.50000000 0.50000000 1
total_magnetization 0.0000508
material_id mp-22862
oxide_type None
tags ['Sodium chloride', 'Halite', 'High pressure experimental phase']
elasticity {'G_Reuss': 14.0, 'G_VRH': 14.0, 'G_Voigt': 15.0, 'G_Voigt_Reuss_Hill': 14.0, 'K_Reuss': 23.0, 'K_VRH': 23.0, 'K_Voigt': 23.0, 'K_Voigt_Reuss_Hill': 23.0, 'elastic_anisotropy': 0.17, 'elastic_tensor': [[46.0, 11.0, 11.0, 0.0, 0.0, 0.0], [11.0, 46.0, 11.0, 0.0, 0.0, 0.0], [11.0, 11.0, 46.0, 0.0, 0.0, 0.0], [0.0, 0.0, 0.0, 12.0, 0.0, 0.0], [0.0, 0.0, 0.0, 0.0, 12.0, 0.0], [0.0, 0.0, 0.0, 0.0, 0.0, 12.0]], 'homogeneous_poisson': 0.24, 'poisson_ratio': 0.24, 'universal_anisotropy': 0.17, 'elastic_tensor_original': [[46.34615434739699, 10.709055272479805, 10.709055272479805, 0.0, 0.0, 0.0], [10.709101919737014, 46.34659526138915, 10.709101919737014, 0.0, 0.0, 0.0], [10.709005258895582, 10.709005258895582, 46.34634908080158, 0.0, 0.0, 0.0], [-3.3994077816060055e-07, -6.969950030705446e-06, 5.7313416741614496e-05, 12.301509494016342, 0.0, 0.0], [-3.0123300583534208e-05, -1.1249930949851892e-05, -2.8823318810698234e-05, 0.0, 12.301596650705338, 0.0], [-2.9323392471349104e-05, -8.94008426681169e-06, -2.3540043928489777e-05, 0.0, 0.0, 12.30160224398984]], 'compliance_tensor': [[23.6, -4.4, -4.4, -0.0, 0.0, 0.0], [-4.4, 23.6, -4.4, 0.0, -0.0, -0.0], [-4.4, -4.4, 23.6, -0.0, 0.0, -0.0], [-0.0, 0.0, -0.0, 81.3, -0.0, -0.0], [0.0, -0.0, 0.0, -0.0, 81.3, 0.0], [0.0, -0.0, -0.0, -0.0, 0.0, 81.3]], 'warnings': [], 'nsites': 2}
piezo
diel {'e_electronic': [[2.488147000000011, 0.0, 0.0], [0.0, 2.488147000000011, 0.0], [0.0, 0.0, 2.488147000000011]], 'e_total': [[6.530282000000013, 0.0, 0.0], [0.0, 6.530282000000007, 0.0], [0.0, 0.0, 6.530282000000012]], 'n': 1.577386129012174, 'poly_electronic': 2.488147000000011, 'poly_total': 6.530282000000011}
full_formula Na1Cl1

取得したデータに含まれる特性の解説

PROPERTIESの意味について以下に記載していきます。公式サイトの説明は引用として記載します。(記載のない特性もあります)

energy (BASIC PROPERTIES)

Calculated vasp energy for structure

vasp(第一原理計算ソフト)で計算した生成エネルギー



energy_per_atom (BASIC PROPERTIES)

Calculated vasp energy normalized to per atom in the unit cell

energyを単位格子内の原子ごとに正規化した値。
(energy)÷(nsites)の計算結果。



volume (BASIC PROPERTIES)

Final relaxed volume of the material

体積



formation_energy_per_atom (THERMODYNAMIC PROPERTIES)

Calculated formation energy from the elements normalized to per atom in the unit cell

formation energyは生成熱の意味。



nsites (BASIC PROPERTIES)

Number of sites in the unit cell

構成している元素の数の合計数。例えばBe2H2ではBeの2とHの2の合計4。



unit_cell_formula (BASIC PROPERTIES)

The full explicit formula for the unit cell

完全な化学式。リスト形式。pretty_formulaと比較して、正規化しない化学式といった意味合いでしょうか。Be2H2では{'Be': 2.0, 'H': 2.0}です。



pretty_formula (BASIC PROPERTIES)

A nice formula where the element amounts are normalized

正規化された化学式。例えば、Be6H12ではBeH2、B64H80ではB4H5と表される。



is_hubbard (CALCULATION PARAMETERS)

A boolean indicating whether the structure was calculated using the Hubbard U extension to DFT

構造がDFT(離散フーリエ変換)のHubbard U拡張を使用して計算されたかどうかを示すブール値。



elements (BASIC PROPERTIES)

A array of the elements in the material

構成している元素。NaClでは['Na', 'Cl']となります。



nelements (BASIC PROPERTIES)

The number of elements in the material

構成している元素の種類数。例えばBe2H2ではBeとHの合計2。



e_above_hull (THERMODYNAMIC PROPERTIES)

Calculated energy above convex hull for structure. Please see Phase Diagram Manual for the interpretation of this quantity.

熱力学的凸包(Convex Hull)からどのくらいエネルギー的に不利であるかを表す指標。安定相では0であり、Energy Above Hullが小さいということは実験上最も生成しやすい(安定である)ことを表している。



hubbards (CALCULATION PARAMETERS)

An array of Hubbard U values, where applicable.

is_hubbardが"TRUE"の際にHubbard Uの値が返ってくるという感じでしょうか。



is_compatible (CALCULATION PARAMETERS)

Whether this calculation is considered compatible under the GGA/GGA+U mixing scheme.

GGA / GGA + U混合スキームにて、この計算が互換性があると見なされるか否か。ブール値。



spacegroup (BASIC PROPERTIES)

An associative array containing basic space group information.

結晶構造に関する情報を含む。space groupは空間群の意味。



task_ids
ここは解読できませんでしたが、上のNaCl(mp-22862)では['mp-655654', 'mp-656552', 'mp-656209', 'mp-22862', 'mp-1141489', 'mp-1440825', 'mp-1593596', 'mp-1592749', 'mp-1686774', 'mp-1792313']と複数のidが表示されました。これらの材料を検索すると全て以下のようにmp-22862が表示されました。このことから取得した材料(今回であればNaCl)に結びつくMaterials Projectのid(材料?)といった感じでしょうか。

taskid.png




band_gap (ELECTRONIC STRUCTURE)

The calculated band gap

バンドギャップ。結晶のバンド構造において電子が存在できない領域。単位はeV。



density (BASIC PROPERTIES)

Final relaxed density of the material

密度。単位はg/cm3



icsd_id (BASIC PROPERTIES)

The Inorganic Crystal Structure Database id for the initial structure, if any.

ICSD (無機結晶構造データベース) でのid。



icsd_ids (BASIC PROPERTIES)

List of Inorganic Crystal Structure Database (ICSD) ids for structures that have been deemed to be structurally similar to this material based on pymatgen's StructureMatcher algorithm, if any.

pymatgenのアルゴリズムにて構造的に似ているとみなされた構造のICSDのidのリスト。



cif (BASIC PROPERTIES)

A string containing the structure in the CIF format.

cif(Crystallographic Information File)形式にて結晶構造の情報を含んでいる。
cifについてはこちらに記事を投稿をしています。



total_magnetization (OTHER PROPERTIES)

total magnetic moment of the unit cell

総磁気モーメント。



material_id
Materials Projectのid



oxide_type
酸化状態を表す。酸化(oxide)、超酸化(superoxide)、オゾン化(ozonide)、過酸化(peroxide)、水酸化(hydroxide)。



tags
取得した材料を表すキーワードといった感じでしょうか。NaClの場合は'Sodium chloride', 'Halite', 'High pressure experimental phase'でした。ちなみに、'Halite'は鉱物として産する塩化ナトリウム(岩塩)の意味です。




elasticity (MECHANICAL PROPERTIES)

Mechanical properties in the elastic limit. Contains the full elastic tensor as well as derived properties, e.g. Poisson ratio and bulk (K) and shear (G) moduli. Consult our hierarchical documentation for the particular names of sub-keys.

弾性率。変形のしにくさを表す値。Kは体積弾性率。Gはせん断弾性率。



piezo (MECHANICAL PROPERTIES)

Piezoelectric properties. Contains a tensor and derived properties. Again, consult our repository for the names of sub-keys.

圧電効果に関する特性。圧電素子の場合は性能が入っている。



diel (MECHANICAL PROPERTIES)

Dielectric properties. Contains a tensor (one each for total and electronic contribution) and derived properties, e.g. dielectric constant, refractive index, and recognized potential for ferroelectricity.

誘電特性。誘電率、屈折率、強誘電性などの特性を含む。



full_formula
完全な化学式。"unit_cell_formula"がリスト形式であるのに対して、full_formulaは通常の化学式の形式で表されます。

まとめ

Materials Projectで取得できるデータについて詳細に解説致しました。

参考

Register as a new user and use Qiita more conveniently

  1. You can follow users and tags
  2. you can stock useful information
  3. You can make editorial suggestions for articles
What you can do with signing up
4
Help us understand the problem. What are the problem?