この記事にたどり着いた方であれば、AlphaFold2を用いた予測構造の精度が恐ろしく高いことはご存知のことだと思いますが、AlphaFold2は(まだ)リガンド分子との複合体構造を予測してくれません。これに対応するべく、AlphaFillは入力されたタンパク質の配列や構造をもとに、そのリガンド候補を自動的にサーチし、その位置を自動的に当てはめた複合体構造モデルを返してくれます。コマンドラインでも利用可能ですが、多くの方にとってはブラウザからその機能を利用する方がとても簡単で助かることでしょう。しかしながら、AlphaFillはAlphaFold DBで配信されているmmCIFフォーマットにしか対応しておらず、AlphaFold2/ColabFoldで出力されたpdbフォーマットのタンパク質構造ファイルについては計算を行ってくれません。
この記事ではそれを簡単に解決する方法と、実際の使い方を紹介します。
pdbファイルフォーマットではどうなる?
試しにATPと結合することがわかっているFur5というタンパク質で試してみます。AlphaFold2/ColabFoldで出力されたタンパク質構造はPDBフォーマットなので、これをAlphaFillにアップロードしてみようとすると
Since the file did not start with a valid PDB HEADER line mmCIF was assumed, but that failed. と表示されて開始することができないようです。
cifフォーマットへの変換
この目的を達成するには、wwPDBが想定するヘッダー情報を含んだmmCIFフォーマットに変換しなければなりません。最も簡単な方法は PDBjのPDBフォーマット - PDBx/mmCIF 変換サービス
を利用する方法で、ここにファイルをアップロードして「送信」するだけです。
次のメニューではデフォルト設定のPDB format -> mmCIF, 改行コードLFのままでOKです。変換は(よほどサーバーが混雑していない限り)数秒で終わるので、メールアドレスを入力しなくても問題ないでしょう。押しましたら変換実行します。
数秒待ってから「変換処理を確認」ボタンを押して、完了と表示されていましたら、「変換ファイルをダウンロード」からそのmmCIFファイルをダウンロードすることができます。
AlphaFillにcifファイルをアップロード
そのmmCIFファイルをAlphaFillのフォームからアップロードすると、計算が始まります。
およそ1分くらいすると、すでにPDBに登録されてある類縁のタンパク質構造から見つかったリガンド分子との複合体構造モデルを画面に表示してくれます。
上のStructure fileを押した場合は全リガンド候補がダウンロードされますが、Showの右側にある↓ボタンを押すと、画面に表示されているものだけがダウンロードされるようです。後者のほうがわかりやすいでしょう。