LoginSignup
4
6

More than 1 year has passed since last update.

薬の設計のための量子化学シミュレーション

Posted at

IBMが開催しているQuantum Challengeという量子コンピューターのプログラミングコンテストがあります。2019年からすでに5、6回開催されていますが、2021年の秋に、IBM Quantum Challenge Africa 2021 というアフリカ大陸の社会問題を取り扱った大会がありました。1問目は最適化、2問目は金融の問題、3問目は量子化学となっており、量子コンピューターの応用事例としておもしろい例題が並んでいました。
今回、3問目を翻訳したので、概要を紹介したいと思います。(3問目の全編翻訳はこちらです。1問目は、こちらにリョウコさんによる日本語解説があります。)
化学についてすっかり忘れてしまった方にも、原子や分子について思い出しながら読んでいただけるような内容になるように心がけました!

目標:量子コンピューターを使ってHIVの薬の効果を確認する

皆さんもご存知の通り、HIVは公衆衛生上、大きな課題となっているウイルスです。このHIVの薬の効果をVQE(変分量子固有値ソルバー)を使って調べるのが、このチャレンジの課題です。(ただし実際の計算にはトイモデルを使います。)
量子コンピューターによって、これまでシミュレーションの難しかった医薬品の設計が飛躍的に向上する可能性があります。
image.png

HIV(ヒト免疫不全ウイルス、Human Immunodeficiency Virus)は、人の免疫細胞に感染して破壊し、最終的に後天性免疫不全症候群 (AIDS)を発症させるウイルスです。増えていく過程で、ウイルスの組み立てに必要なタンパク質を、感染した細胞に作らせますが、大きなタンパク質のままではウイルスが組み立てられません。
HIVに特有の「プロテアーゼ」という酵素によって、そのタンパク質が適当な大きさに切断され、増殖されていきます。この「プロテアーゼ」が今回のシミュレーションの対象となる分子その1で、いわゆる悪者の分子です。
これに対し、2つ目のシミュレーションの対象となる分子が「抗レトロウイルス薬」で、プロテアーゼに結合してブロックする薬剤です。まとめると、

シミュレーションの対象となる分子:
1)「プロテアーゼ」:ウイルスタンパクをハサミでカットしてウイルスを増やす悪者
2)「抗レトロウイルス薬」:プロテアーゼにくっついてハサミの能力をブロックする薬

VQE概要

今回使う、VQE (Variational Quantum Eigensolver、変分量子固有値ソルバー)アルゴリズムは、量子化学の分子エネルギー固有値問題において使うことができる、量子・古典のハイブリッドアルゴリズムです。特にNISQ(ノイズあり中規模量子コンピューター)向けの量子アルゴリズムとして活用が期待されていて、以下のような手順で計算を行います。

  1. 対象とする分子のエネルギーに相当するハミルトニアン$H$(演算子)を準備する。
  2. パラメーター$\theta$の入った試行状態(ansatz)$|\psi(\theta)\rangle$を作る。
  3. $|\psi(\theta)\rangle$に$H$演算をして測定し、エネルギー期待値$\langle H(\theta)\rangle$ を求める。
  4. 古典コンピューターで$\theta$を調整して 2.、3.を繰り返し、エネルギーが最小になるように最適化する。
    image.png

図の出典:Alberto Peruzzo,他 "A variational eigenvalue solver on a quantum processor"
具体的な計算方法は、この後に水素分子の例が載っています。さらに詳しい解説は、QiskitテキストブックのVQEの章をご覧ください。

化学の用語

原子の一般的な構造の模式図は、wikipediaによると以下のようになっています。化学反応の決め手となるのは、原子の外側にある電子の反応であるため、電子軌道について調べることが重要となります。
image.png

上の図は模式図であり、もう少し詳しく電子軌道を見てみると、原子軌道のWikipediaに掲載されている以下の図からも見て取れるように、原子核の周りに存在する電子の波動関数が電子軌道であり、大雑把にいうと電子の存在確率が高い場所が電子軌道になります。(絶対値の二乗が存在確率に比例。)
image.png
(左から順に1s、2s、2px、2py、2pz軌道。)

ここで、量子コンピューターにおける量子化学分野での頻出用語をまとめておくと、

  • 電子軌道:電子の波動関数(電子の存在確率が高い場所)。一つの軌道には↑スピンと↓スピンの2個の電子が入る。
  • 原子軌道:原子核のまわりの電子軌道。
  • 分子軌道:分子(原子が複数集まったもの)の電子軌道。
  • スピン軌道:電子の個数分ある(電子軌道の2倍)スピンの軌道。(量子化学計算で使われるJordan Wigner変換ではこの数だけ量子ビットが必要になる。)
  • アルファ電子:↑(+)スピンの電子。
  • ベータ電子:↓(-)スピンの電子。

原子軌道や分子軌道といわれると原子や分子が回っている軌道のことかと勘違いするかもしれませんが、原子軌道、分子軌道とも電子の軌道のことを指しています。

元素の周期表では、1から順番に番号が振られていますが、それぞれの元素は、その原子番号の数だけ電子を持っています。例えば、原子番号1の水素原子の電子の数は1個、原子番号6の炭素原子の電子の数は6個です。
また、基底状態の電子は入る軌道が決まっていて、エネルギーの低い順に順番に席が埋まっていきます。下の図のように、↑または↓で表された電子が、1sから順番に2個ずつペアで配置されていきます。
image.png

例題:水素分子の基底エネルギーを求める

目標のHIVの薬の効果を調べる前に、本文(和訳版)では、水素分子の基底エネルギーを例に、VQEの手順を解説しています。以下のようなステップで行います。(ステップの番号は本文の番号と同じです。)

1 :ドライバーで、原子の位置を指定して、古典計算から必要な情報を取得。
2a:取得した古典情報からフェルミ演算子のハミルトニアンを作成。(Hartree-Fock近似(電子1個ずつの運動に近似)。電子(フェルミオン)の存在する場所を量子化(第二量子化)。)
2b:ハミルトニアンを量子ビット(パウリ演算子)に変換。(Jordan Wigner変換では、量子ビットをスピン軌道として表現:$|0\rangle$、 $|1\rangle$ がスピン軌道の占有,非占有に相当)
3a:初期状態をセット。
3a:試行状態(パラメーター付き量子状態、Ansatz)をセット。
3b:量子計算の実行環境を設定。
3c:(古典オプティマイザーを設定。今回は設定していませんでした。)
4 :VQEを実行し、最適なパラメーターを探し、エネルギーの近似解を求める。

HIVチャレンジ:薬の効果を調べる

さて、とうとうHIVの「プロテアーゼ(悪者)」と「抗レトロウイルス薬」の反応を調べます。基本の考え方は、二つの分子が結合すると全体のエネルギーが下がるという自然の現象を使います。具体的には、「プロテアーゼ(悪者)」分子と「抗レトロウイルス薬」分子の位置を近づけていって、その位置ごとにVQEでエネルギーを計算し、エネルギー曲面を作り、局所的にエネルギーが低いところがあるかどうか確認します。ある一定の距離内でエネルギーの最小値が見つかれば、二つの分子はその位置で結合した状態が安定であり、薬の効果が現れることになります。
以下は、水素分子(水素原子が2個くっついて水素分子になる)の2つの原子間距離を変えたときのエネルギー曲面の例です。エネルギーが最小となる原子核の位置が安定な水素分子の構造です。(水素の基底状態の構造はよく知られているため今回は既知の原子核の位置を0に設定したので0が最小値になっています。)
image.png

ここで、「プロテアーゼ(悪者)」と「抗レトロウイルス薬」について、本物の分子は大きすぎてそのまま計算にかけることはできないため、トイモデルを使います。

トイモデルの設定

本物の「プロテアーゼ(悪者)」は、約100個のアミノ酸からなる2本のポリペプチド鎖で構成されています。ペプチド鎖とは、ペプチド結合したアミノ酸がたくさんつながったものです。アミノ酸とペプチド結合について振り返っておくと、下の図のように
image.png

アミノ酸とはアミノ基($-NH_2$)とカルボキシル基($-COOH$)を持つ有機化合物のことです。2つのアミノ酸がペプチド結合すると、ジペプチドと水($H_2O$)ができます。「プロテアーゼ(悪者)」は、このペプチド結合したアミノ酸が100個くらいつながった鎖が2本で作られているとのことです。
ペプチド結合は、一般的なタンパク質の折りたたみやHIVの「プロテアーゼ(悪者)」のハサミの切断能力などタンパク質の化学的な性質を決定する最も重要な要素の一つです。このペプチド結合に注目して、トイモデルを設定します。「プロテアーゼ(悪者)」のトイモデルを、ペプチド結合の$O=C-N$に水素原子($H$)を足した$HCONH_2$ (ホルムアミド)にします。ホルムアミドは、実際にイオン性の溶媒でもあるので、イオン結合を「切る」ことができる物質でもあるとのことです。以下の図がそのモデルです。
image.png

また、「抗レトロウイルス薬」として、今回は、1個の炭素原子($C$)を使います。
この2つのトイモデルを使って、窒素($N$)と炭素($C$)の間の距離を変えてエネルギーが局所的に最小となるところがあるか調べます。
image.png

具体的な計算ステップ

以下は、実際のHIVチャレンジの手順と設問をまとめたものです。上から順に解いていくことで、トイモデルを使って薬の効果があるかどうか調べ、また、最後は独自の試行状態(Ansatz)を作り、最も精度の良いシミュレーションモデルを作成するオープンチャレンジになっています。

1:分子の形を変化させる設定

  • $N$と$C$の原子間距離を変化させます。
  • Ex 3a:原子の座標と動かす原子を設定する問題。

2:量子ビット数を削減

  • そのままでは60量子ビット必要になり、ビット数が多すぎて実行できないため、Active Space Transformerで内殻電子をただのポテンシャルとみなし、反応に必要な外殻電子のみ計算で扱う設定をします。
  • Ex 3b:分子構造についての化学的な質問。
    • Q1: 内側の電子より外側の電子を先に量子処理する方が高分子の計算において、経験的に意味を持つのはなぜですか?
    • Q2: 量子で扱う電子の数が一定の場合、それらの電子がアクセスできる軌道の数を増やすと、計算される基底状態のエネルギーは、上からも下からも漸近的なエネルギーに近づくのでしょうか?

3:VQEを実行し、原子間距離を変化させた際のエネルギー曲面を表示

  • 結合するかどうかを全体のエネルギーが最小となる状態があるかどうかで判定。
  • Ex 3c:薬の効果があるか調べる問題。
    • 有限の距離の間に明確な最小値はありますか?結合は起こりますか?

4:試行状態(パラメーター付き量子状態)の調整。

  • Ex 3d:パラメーターの繰り返し数と計算精度の関係について調べる問題。
  • Ex 3e:$HCONH_2-C$の分子について、8量子ビットまでのVQEで、誤差が最も小さくなるハードウェア由来の試行状態を見つける問題。
    • スコアは以下で計算されます:
      $$\text{score} = -10 \times \log_{10}{\left(\left\lvert{\frac{E_{true} - E_{computed}}{E_{true}}}\right\rvert\right)}$$

まとめ

IBM Quantum Challenge Africa 2021の3問目は、HIVのトイモデルを使って薬の効果をVQEで調べる問題でした。まだモデルレベルでの計算ですが、量子コンピューターの具体的な応用例の一つを学べる良い例題になっていると思います。
ぜひ皆さんも、薬の効果があるのかどうか、実際にVQEを実行して調べてみてください!

4
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
6