マテリアルズインフォマティクス(MI)とは
1. 記事作成の背景
記事作成者は、過去に材料開発に携わっており、
現在はデータサイエンティスト(DS)にシフトするために日々勉強しています。
今回、MIに対して興味を持ったため、記事を作成しました。
記事作成の際に多くの資料を参照しながら作成していますが、
間違っている可能性もあります。
その際にはご指摘いただければ幸いです。
よろしくお願いいたします。
2. マテリアルズインフォマティクス(MI)とは
株式会社 日立ハイテクソリューションズではこのように定義しています。
マテリアルズインフォマティクス(以下「MI」と記載)は、
「情報科学技術(機械学習、データマイニング等)や統計分析の手法により材料開発を高効率化する取り組みです。 参考1)
簡単に言いますと、材料開発を効率化するAIです。
実験や論文を解析して素材の分子構造や製造方法を予測するなど、デジタル化の進展で膨大なデータをスーパーコンピューターなどの高性能な情報処理装置で操れるようになり、近年、素材分野での応用が広がりつつあります。
これまでの材料探索は、ひとりの研究者が知識と経験に基づいて化合物を選定・設計し、多くの合成をし、特性を評価するということが広く行われてきました。
物質特性をコンピューター上で高精度に計算された材料データベースやAIなどを活用するマテリアルズ・インフォマティクスによって、
研究者の知識と直観をデータで支え、時間とコストを大幅に削減することが期待されています。 参考1)
いい材料を作成するには、
温度、時間、圧力、材料投入タイミング、方法、触媒の有無など実験パラメーターがたくさんあり、
それを過去のデータ、経験、勘をもとに最適化しなければならなく、
実験の条件出しだけでも非常に時間がかかり、面倒です。
それをMIなどで自動で条件出しがされれば、
その分科学者はクリエイティブなことに頭と時間を使うことができ、開発効率化にもなるといわれています。
MIの開発が進むことで、
今まで、人の経験と勘で行っていたところをデータに基づいて評価を行うことができるようになり、開発スピードが加速するとされています。
3. なぜ注目されているのか
経済産業省の世界の開発費の推移を確認すると
米国、中国は2006年から2015年の10年間で開発費が急激に高くなっているが、日本はほぼ横ばいである。
三井化学株式会社(化学メーカー)の有価証券報告書を確認しても
研究開発費はほぼ横ばいです。
1社では断定できないですが、
材料開発における開発費もあまり増加していないと考えられます。
経済産業省の発表資料によると、
日本は、今後の材料開発期間を従来の1/20に短縮して進めていこうとしています。
開発期間を1/20にするには、
現状の予算や研究者の経験と勘で開発している今の開発手法では不可能であるため、AIなど徹底的に活用することが求められています。
そのため、材料開発の高効率化に向けてMIの開発が進められています。
マテリアルズ・インフォマティクス(MI)がなぜ注目されているのか
最近なぜMIが注目されているのか、
日本政府の戦略などから、調査を行い、まとめてみた。
マテリアルズ・インフォマティクス(MI)とは?
下記記事にも、MIについて説明があります。
【超入門】マテリアルズインフォマティクス(MI)とは
https://qiita.com/YH_BK/items/dd14b875425ce53930b6
機械学習を含む情報処理技術をフルに活用し材料開発を進めていく分野をマテリアルズインフォマティクス(MI)と呼びます。
短期間で、新しい材料が開発できると期待されています。
参考
DXの教養 デジタル時代に求められる実践的知識 [ 志度 昌宏 ]
MIの概念として、
機械学習やデータマイニングなどをうまく活用し、天才研究者の頭脳を模擬していくことで、新材料開発に貢献していくことです。
参考 :
https://www.smbc.co.jp/hojin/report/investigationlecture/resources/pdf/3_00_CRSDReport090.pdf
MIは科学者(研究者)のアシスタントとして活用していくものである。
機械学習さえできれば何でもOKではなく、材料の知見を持った科学者が機械学習をうまく使わないといけない。
参考
マテリアルズ・インフォマティクス 材料開発のための機械学習超入門 [ 岩崎 悠真 ]
MIの活用事例としては、
・材料の構造情報などをもとに予測モデル作成、物性予測値、モデル最適化(学習)を行っていき、
物性評価を行っていく。
・今まで自社内で培ってきた材料、製品のデータベースを作り、新たな用途の探索につなげる。
など、企画、研究、開発、量産と幅広く活用することができる。
また、下図のように、
材料(ターゲット)や目的によって、適用する技術が異なるため、
一概にもどの場合、どの技術を適用したらよいかパターン化を作るのは難しいところである。
参考 :
https://www.jpo.go.jp/resources/report/gidou-houkoku/tokkyo/document/index/2019_07.pdf
なぜMIが注目されてきているのか
化学産業として
ある調査では、化学産業のデジタル化を推進していくことで
売上拡大をけん引して10%を超える増収が実現できることが分かった。
参考 :
https://www.strategyand.pwc.com/jp/ja/publications/industry-trends/trends-2019-chemicals.html
化学産業は化学反応を使って製品を作る産業である。
そのため1つ1つ深い専門知識がないと生き残れないため、
その分野に特化した人(専門家)が集まりやすい産業です。
そのため、デジタル化を推進できる人材が少ないため、
デジタル化は複雑だと思われており、なかなか進められていないのが現状である。
最近では業務効率化のためのデジタル化が進んでいるところも多いが、
DXの本来の目的であるビジネスの変革に至っていないのが現状である。
文部科学省として
文部科学省は、マテリアル各新緑強化のための政府戦略に向けて、下記イメージを提唱している。
参考 :
マテリアル革新力強化のための政府戦略に向けて
(戦略準備会合取りまとめ)
令和2年 6 月 2 日
マテリアル革新力強化のための戦略策定に向けた準備会合
https://www.mext.go.jp/content/20200602-mxt_nanozai-000007507_1_2.pdf
日本として、マテリアルDXプラットフォームを作っていきたいと考えており、
大学や研究所と民間企業のデータをうまく活用できるようにしようとしている。
経済産業省として
経済産業省としては、デジタル技術を活用した新しい素材開発インフラの整備として、「超超PJ」を始動している。
AIなどを徹底活用して、開発期間を今までの1/20を目指そうとしている。
政府として
2030年にIT人材が40万人以上不足が生じる懸念があり、
政府としてもIT人材の育成にも力を入れようとしている。
参考 :
https://www.smbc.co.jp/hojin/report/investigationlecture/resources/pdf/3_00_CRSDReport090.pdf
まとめ
化学産業としてはデジタル化、MI推進をしていきたいが、
デジタル化を推進できる人材が少なく、
推進できていいないのが現状である。
もちろん材料開発者が機械学習などを学んでいき
材料開発者が自ら進めていけるのがベストであるが、
すぐには習得は厳しいため、
はじめは、
データサイエンティストと材料開発者が
協力して進めていくのがよいと考えられる。
記事作成者もデータサイエンスを学び、
データサイエンティストと材料開発者をうまくつなげて
MIの推進に貢献できればと思う。
4. なぜMIが進んでいないのか
資料を参考にしながら記事作成者の考えを記載する。
①材料開発は目的もルールも不明確
例えば、ボードゲームなどはルールが明確に決められており、目的も相手に勝つ(将棋の場合王将をとる)とはっきり決まっているので、AIに任せやすいところもある。
しかし、材料開発の場合、ルールも目的も決まっていなく、どのような材料開発をするかは自由です。
なので、人間が物理、化学、材料学などの専門知識を上手に使って、材料開発における問題設計(ルールや目的の設定)をし、その問題を解くのに適した機械学習を使いこなしながら材料開発を進めていく必要がある。 参考3)
しかし、問題設計をし、適した機械学習を選定できる人材が少ないのが現状である。
② 演繹的か帰納的かどちらで行うか
材料開発は、構造や組成から考える手法と、機能性、特性から考える手法がある。
CNF(セルロースナノファイバー)という新しい素材が発見されたときに
どのような材料特性があるのか、何かに応用できないかを考えながら
順問題を解くように材料開発を進めてきた。
最近の開発手法は、「強度がよい素材の開発をしたい」など明確な目的(材料の機能や特性)を達成するために、材料の構造・組成を探していく逆問題を解くように開発を進めていくことが多い。
目的によって、ルールの設定も違うため、その選定から難しい状況である。
シミュレーターとMIの違い
下シミュレーター → 演繹法
今までの理論をもとに、結果を推測する
MI → 帰納法
今までの結果から、傾向を推測する。
③ 分野による違い
材料と一言で言っても幅広い分野です。(ほんの一例です)
有機物
- 低分子
- 医薬品関係
- アルコール類
- 高分子
- 固い樹脂(ケースなど)
- 軟らかい樹脂(フィルムなど)
- 電子部品(有機ELなど)
- 潤滑剤(エンジンオイルなど)
無機物
- 金属系
- 電池部品
- 車部品 - 非金属系
-陶器(茶碗など)
-ガラス
-電解質
上記のように材料と一言で言っても幅は非常に広く、
開発手法、進め方、評価方法が全然違い、
一つ一つの分野ではかなり深い知識まで必要です。
(自分も会社が変わるたびにいろいろな方にお伺いしながら、
専門書読んで業務行っていました)
どこかの分野でMIを作っても他分野で同様に使うのが難しく、
新たに作成しなければいけないと考えています。
④ データがそろっていない
成功例は論文などに乗っていることも多いが、
論文でも詳細な条件は記載されていなかったり、
全ての分析結果が記載されていないこともある。
失敗例については、実験ノートに記載してあるのみで
公表されていないことがある。
データが少ないので、
一つ一つ実験してデータをとっていくのもよいが、
一つの材料作成、評価に1週間かかったりすることもある。
データを集めるにしても人、お金、時間が多く必要になり
現在の日本の開発費では難しいところもある。
また、データの保存方法も研究者によってバラバラであるため、
機械学習できるための前処理にも非常に時間がかかる。
⑤現場でDSを理解している人が少ない
経済産業省、文部科学省でも提唱されているが、
材料開発がわかるデータサイエンティストが非常に少ない
人材の交流が少ない
といった課題がある。
5. 今後のMIを進めていくには
今後MIを進めていくには下記2点が必要と考えている。
・材料開発の専門知識を持ちつつ、機械学習などデータサイエンスの知識を持った人材を増やしていくこと。
どの材料開発の時にどの機械学習モデルや統計学を当てはめていくか判断できる人材を増やしていくこと。
・経営者も含めて全員がMIのメリット理解をし、予算、人財を十分に確保できる状態にすること。
(DX促進するための話に近い)
6. 参考資料
近年注目の「マテリアルズ・インフォマティクス(MI)」
(株式会社 日立ハイテクソリューションズ)
https://www.hitachi-hightech.com/hsl/products/ict/cloud/ci/or_mi.html
素材産業におけるイノベーションの役割と期待
(経済産業省)
https://www.meti.go.jp/policy/mono_info_service/mono/chemistry/downloadfiles/180112materials-innovation.pdf
マテリアルズ・インフォマティクス-材料開発のための機械学習超入門-
出版社 : 日刊工業新聞社 (2019/7/20)
発売日 : 2019/7/20
ISBN-10 : 4526079863
https://a.r10.to/hDM6pz
マテリアルズ・インフォマティクスによる材料開発
(株式会社 三井住友銀行)
https://www.smbc.co.jp/hojin/report/investigationlecture/resources/pdf/3_00_CRSDReport090.pdf
国立研究開発法人 化学技術振興機構
研究開発戦略センター (事例の紹介などしています)
https://www.jst.go.jp/crds/
MIを実際に作ってみるなら下記書籍があります。
実践 マテリアルズインフォマティクス―Pythonによる材料設計のための機械学習
サイズ B5判/ページ数 184p/高さ 24cm
商品コード 9784764906150
NDC分類 571.07
Cコード C3043
https://a.r10.to/hDxJjE
詳しく知りたい場合は下記書籍があります。
マテリアルズ・インフォマティクスによる材料開発と活用集
https://www.gijutu.co.jp/doc/b_1975.htm