以下の駄文を読まずに、
https://www.microsoft.com/en-us/research/publication/mattergen-a-generative-model-for-inorganic-materials-design/
を見てください。十分な可能性が示せていると思います。
ただ検証のしかたなどあんまりよくわからなかったところも多いので勉強中です。
============================
拡散モデルで自由に画像が作れるようになってきた。一方、CODなどの結晶データベースもある。CODなりを学習させてそれなりにリアリスティックな結晶構造を作れるのではないか?というテーマが浮上する。最近、盛んになってきているようだ。作った仮想結晶が、局所的にもっともらしい構造を持つのであればそれなりに「存在可能性のある」構造であり得る。これはまさに画像AI(拡散モデル)に期待できるようなこと。指の数が増えたりする難点も結晶生成には悪くない。
いままでは遺伝アルゴリズムとかでいささかゴリ押し的に生成してきた候補になる仮想構造をもっとうまく作れるような気がする。NdFeB磁石は、Feの塊をNdBの平面で抑え込むような構造。似たような候補物質などAIで探せるのではないか?あるいは太陽電池やら固体電解質やら。。。
UnetなどのCNNは近傍情報、短距離秩序を学習する。拡散法はそれをバランスよくつなぎ合わせることを行っている。そして、全体的に整合性のある絵が形成される。「与えた周期的セルの中に、データベース中の結晶構造の持つ局所構造をもっともらしく結合したものを作成せよ」という課題なら解けるんじゃないかと思う。その局所構造をUnetで学習させるのには問題ない。生成時に周期性をもたせるのは簡単である(ラベルタイリング参照)。
中・長距離秩序はUnetに担わせてないでもっとウマい方法があるかも。マーデルング和みたいなことはヒントにならないか?
問題点は、
1.3次元の周期系であること。ヘタにやるとデータが多すぎる。3次元のCNNを座標表現に適用するには?これには3Dの拡散モデルのアイデアが使えるのでは?
2.セルサイズを可変にしたい。圧力に対応するものを入れるか?セルの可変性を要求することになるが、損失関数のセルサイズ依存性を問題にするなら可能なようにも思う。
3.データが少なすぎるかもしれない。
だろうか?