本記事は創薬 (wet) Advent Calendar 2019の14日目の記事です
本記事は下記の環境に基づいて執筆されました
- MacBook Pro (13-inch, 2016, Four Thunderbolt 3 Ports)
-- macOS Mojave (ver. 10.14.6)
--- CueMol2 (ver. 2.2.3.443)
本記事の概要
# CueMolを利用して蛋白質の立体構造を__可愛く__作図します
# 基礎編です (より実践的な作図例は別記事にて紹介予定)
# インストール手順や使い方の詳細は公式ページをご参照ください
# 読むのが面倒な方は__INTRODUCTION__をぜひ飛ばしましょう
INTRODUCTION
Structure-based drug design,いわゆるSBDDという言葉が今や当たり前となったように,蛋白質の立体構造は創薬研究 (特に薬剤探索/設計) を行う上で極めて価値のある情報です。具体的には蛋白質の立体構造はin silicoの薬剤スクリーニングに用いられる基本情報であり,より原始的にはmedicinal chemistに薬剤設計のインスピレーションを与える媒体として機能します。ここで言う「インスピレーション」を得るためには__蛋白質の立体構造を観察すること__が,また得られた「インスピレーション」を他者に伝えるためには__蛋白質の立体構造を作図すること__が必要であり,そのために不可欠なソフトウェアが__分子ビューワー__です。
代表的な分子ビューワー
実験 (X線結晶構造解析/核磁気共鳴/クライオ電子顕微鏡) により決定された蛋白質の立体構造情報は,学術論文に投稿される際にProtein Data Bank (PDB) に登録されます。wet/dryにかかわらず,多くの研究者がPDBに登録された立体構造座標であるPDBファイル (.pdbあるいは.cif) をダウンロードし,自身の研究に日々活用しています。
上述のPDBファイルを読み込み,蛋白質の立体構造を表示することのできる分子ビューワーがいくつも存在しています。そしてこれら分子ビューワーの多くは,蛋白質の立体構造を作図する機能を内包しています。学術論文用のFigureを作成するために使われる分子ビューワーとしては,PyMOL,Chimera,VMDそしてCueMolが代表的でしょう (企業の方だとMOEなんかの有償ソフトを使われている方も多いんですかね?)。本記事ではCueMolを用いた蛋白質構造の作図方法について紹介します。
CueMolとは
CueMol (きゅうもる) はMozilla xulrunnerベースの生体高分子の構造を見るためのソフトウェアです。
近年ちまたには,フリーのも含め結構な数の分子ビューワー/モデリングプログラムが出回ってます。しかし,それぞれかなりくせがあり,いちいちマニュアルを熟読しないと使い方がわからないものが多いと思いませんか?
というわけで,OSのGUIとシームレスでかつ,わかりやすいユーザーインタフェイスを目指して開発を進めています。
さらに,論文やプレゼンのための高品位の分子グラフィクスを作成できるという特徴もあります。
——CueMol公式ページより
Windows版/macOS版が公開されています。DownloadページからWindows installer/macOS dmgをダウンロードし,一般的なアプリケーションと同様の手順でインストール可能です。
ライセンスですが,基本的に非商用/商用ともに (無保証で良いなら) 無料で使用できるようです (感謝)。詳細については各自ライセンスページを確認してください。
個人的にはPyMOLより__楽に可愛く作図できる__ので好んでCueMolを使用しています。パッと開いて軽く構造を眺めたり,変異導入操作等の少し高度な作業をする際にはPyMOLもまだ使っていますが,最近は基本的にCueMolで済ませることが多くなりました。ちなみにChimeraはほとんど使ったことがありません。VMDはMDシミュレーションのトラジェクトリを確認する際に使う程度です。
ようやく本題
本記事で作図する蛋白質について
インフルエンザ治療薬Xofluzaの標的蛋白質 (PA) 1 と__Xofluzaの有効成分であるbaloxavir acid (BXA)__ 2 との__複合体の共結晶構造__を例に作図していこうと思います。この蛋白質を選んだ理由は特にありません! 蛋白質について事細かに説明もしません!(そもそも詳しくないです……。興味のある人は参考文献 3 を読んでね!)
CueMolを起動する
CueMolを起動すると次のようなwindowが開きます。

黒背景の部分は構造が描画される領域です。また,その左側にあるSceneやColorなどが表示されている領域をPanelsと呼びます。Panelsに表示させる項目は,
メニューバー > Window > Panels
から設定可能です。
PDBファイルを読み込ませる
インフルエンザウイルスA型 (A/California/04/2009/H1N1) のPA (PA-A) とBXAの複合体の結晶構造 (PDB code: 3FS6) を読み込んでみましょう。
PDBファイルをすでにお持ちの場合は,
メニューバー > File > Open File...
でファイルを指定するか,目的のファイルを構造描画領域にドラッグ&ドロップすることでPDBファイルを読み込むことができます。PDBファイルをお持ちでない場合は
メニューバー > File > Get PDB using accession code ...
からPDB codeを指定することで,目的のPDBファイルを読み込むことも可能です (当然ネットワークに繋がっている必要があります)。

本記事では事前にダウンロードしていた6fs6.cifを読み込ませました。すると次のようなwindowが開きます。

[Renderer]を上記画像の通りに設定しOKを押しましょう (Object:やRenderer name:の欄は,お好きな名前をつけて大丈夫です)。Renderer type:は,構造をどのようなモデルで描画するかの設定です。今回は蛋白質をribbonモデル 4 で描画しますので,ribbonを選択しています。Selection:にチェックを入れることで,PDBファイルの一部を指定して描画することができます。今回はproteinと指定しているため,蛋白質領域のみ描画されます (リガンドおよび結晶水などは無視されます)。Recenter viewにチェックを入れることで,描画開始時にセンタリングを行います。
[mmCIF options]の各項目は,基本的に変更しません。Calculate protein secondary structureにチェックが入っていると,PDBファイル内に記述されている二次構造のアサインメント情報を無視してDSSP 5 により推定された二次構造に基づいた描画が実行される,ということに留意しておけば良いでしょう。
すると下記のようにPA-Aが描画されます (マウスで分子を回せます。スクロールでズームの度合いを変更できます。奥行きはPanelsにある[View]のSlabから変更できます)。
Ribbonの設定
それでは続いてribbon表示の設定を行います (個人的によく使用している設定を公開します)。また,どうやら本PDBファイルは非対称単位 (生物学的単位とは必ずしも一致しない 6) 中に6分子のPAを含むようです。今はA chainのみを対象に描画したいので,その設定も同時に行ってしまいます。
まずPanelsにある[Scene]にribbon1 (ribbon)があることを確認してください。

このようにCueMolでは読み込ませたPDBファイルの下階層にribbonや後述のstickなどがどんどん足されていきます。また,左側にある
のアイコンをクリックすると,各objectの表示/非表示をトグル形式で切り替えることができます (便利)。下側にある
,
,および
のアイコンは,クリックすることでそれぞれズーム,objectの追加,およびobjectの削除を行うことができます。
ribbon1 (ribbon)をダブルクリックすると下記のwindowが開きます。

[Common],[Helix],[Sheet],および[Coil]について順に設定を行います。
[Common]については次のように設定します (変更箇所:赤枠)。

一部補足すると……
Smooth colorのチェックを外すことで,色付けの際のグラデーションを無くしました
Selection:をproteinからprotein & c; Aに変更することで,蛋白質のA chainのみを描画するようにしました (選択文法については後述)
Materialをtoon1にすることで,レンダリングの際のタッチを__可愛く__しました
Edge lineをedgesにすることで,描画の縁取りを追加しました (Widthは0.06に設定)
入力できたらApplyをクリックして設定を適応しましょう。
[Helix]については次のように設定します (変更箇所:赤枠)。

入力できたらApplyをクリックして設定を適応しましょう。
[Sheet]については次のように設定します (変更箇所:赤枠)。

入力できたらApplyをクリックして設定を適応しましょう。
[Coil]については次のように設定します (変更箇所:赤枠)。

入力できたらApplyをクリックして設定を適応しましょう。
OKをクリックしていい感じにズーム (
とスクロール) してあげると__あら可愛い__,下記のように表示されるはずです。

[Scene]のribbon1 (ribbon)を右クリックして表示されるCreate style...から本設定を登録することができます。次からはribbon1 (ribbon)を右クリックして表示されるStyleの中から,保存した設定を楽に読み出せるようになります。
Disorder領域の描画と設定
PDB code: 3FS6にはdisorder領域が含まれているので,次にこれを追加で描画します。[Scene]の下部の
アイコンをクリックするとwindowが表示されるので,下記のように入力してOKをクリックしましょう。

するとdisorder領域 (欠損領域) が破線で表示されるはずです。続いて描画の設定を行います。
[Scene]のdisorder1 (disorder)をダブルクリックすると下記のwindowが開きます。

[Common]および[Disorder]について順に設定を行います。
[Common]については次のように設定します (変更箇所:赤枠)。

入力できたらApplyをクリックして設定を適応しましょう。
[Disorder]については次のように設定します (変更箇所:赤枠)。

入力できたらApplyをクリックして設定を適応しましょう。Color:を$molcolと設定していますが,これについては後述の色設定に関する説明の中で併せて解説します。
OKをクリックしていい感じ角度を調節してあげると__あら可愛い__,下記のように表示されるはずです。

Ribbonの設定と同様,[Scene]のdisorder1 (disorder)を右クリックして表示されるCreate style...から本設定を登録することができます。
低分子リガンドのstick描画と設定
次にPA-Aに結合しているBXAをstick表示してみましょう。[Scene]の下部の
アイコンをクリックするとwindowが表示されるので,下記のように入力してOKをクリックしましょう。

Selection:のr; E4Zは本PDBファイルにおけるBXAの残基名を指定しています (選択文法については後述)。
するとBXAがball & stickモデルで表示されるはずです。続いて描画の設定を行います。
[Scene]のballstick1 (ballstick)をダブルクリックすると下記のwindowが開きます。

[Common]および[Ball & Stick]について順に設定を行います。
[Common]については次のように設定します (変更箇所:赤枠)。

入力できたらApplyをクリックして設定を適応しましょう。
[Ball & Stick]については次のように設定します (変更箇所:赤枠)。

Bond widthとAtom radiusの値を同じにすることで,stick表示にすることができます。
入力できたらApplyをクリックして設定を適応しましょう。
OKをクリックしていい感じ角度を調節してあげると__あら可愛い__,下記のように表示されるはずです。

[Scene]のballstick1 (ballstick)を右クリックして表示されるCreate style...から本設定を登録することができます……,がstickについては後述の色設定を行ってから登録するのがおすすめです。
特定のアミノ酸残基のCPK描画と設定
BXAに対する耐性株では,PAにおけるIle38のThrへの変異が報告されています 3。
というわけで,次にPA-AのIle38をCPK表示してみましょう。[Scene]の下部の
アイコンをクリックするとwindowが表示されるので,下記のように入力してOKをクリックしましょう。

Selection:のi; 38は本PDBファイルにおける38番目のアミノ酸残基を指定しています (選択文法については後述)。
するとIle38がCPKモデルで表示されるはずです。続いて描画の設定を行います。
[Scene]のcpk1 (cpk)をダブルクリックすると下記のwindowが開きます。

[Common]および[Atom radii]について順に設定を行います。
[Common]については次のように設定します (変更箇所:赤枠)。

入力できたらApplyをクリックして設定を適応しましょう。
[Atom radii]については次のように設定します (変更箇所:赤枠)。

入力できたらApplyをクリックして設定を適応しましょう。
OKをクリックしていい感じ角度を調節してあげると__あら可愛い__,下記のように表示されるはずです。

[Scene]のcpk1 (cpk)を右クリックして表示されるCreate style...から本設定を登録することができます……,がCPKについても後述の色設定を行ってから登録するのがおすすめです。
色の設定
[Color]についてまずは6fs6.cif全体の色指定を行います。

Paint coloring:のsheetをダブルクリックすると下記のようなwindowが開くので,Color:に#00ACC1と入力してOKを押してください (▼を押すことでGUIでも色選択できます)。

続いてhelixも同様にダブルクリックし,Color:に#FB8C00と入力してOKを押してください。
*はPDBファイル全体を指定しています (FloralWhiteのままでOKです)。
Paint coloring:は上ほど優先度が高く,結果として下から順に色を重ねていくことになります。
つまり今の状態では優先度が * < helix < sheet なので,分子全体がFloralWhiteで塗られた上にhelixとsheetの着色が行われています。

ちなみに*を一番上に移動させると下記のように分子全体がFloralWhiteになります。

次に各objectの色指定を行います。
6fs6.cif/ribbon1を選択すると,下記のように[Color]がribbon1の設定画面に切り替わります。

Coloring type: SolidColoringとなっていますが,これは単色指定モードです。
Default colorを指定することでribbon全体の色を指定できます。
(ちなみにさきほどの6fs6.cif全体の色指定はPaint coloring:というモードでした)
今回は設定変更する必要はありません。
Default colorが$molcolとなっていますが,これはさきほど設定した6fs6.cif全体の色指定を反映するというコードです (重要)。つまり今回の場合は,二次構造に基づいた配色を行うことになります。
次に6fs6.cif/ballstick1を選択すると,下記のように[Color]がballstick1の設定画面に切り替わります。

CPK coloring:となっていますが,これは原子の種類ごとに色指定を行うモードです。まず次のように色指定を行います。
Sulfur:darkkahki
Phosphorus:#FB8C00
Hydrogen:floralwhite
Others:#43A047
この時点で[Scene]のballstick1 (ballstick)を右クリックして表示されるCreate style...からstickの描画設定を登録します。登録できたらあらためてCarbonに#8D6E63を指定しましょう (Carbonが$molcolの方が使い勝手の良いstyleになるため)。
次に6fs6.cif/cpk1を選択すると,下記のように[Color]がcpk1の設定画面に切り替わります。

CPK coloring:となっていますが,これは原子の種類ごとに色指定を行うモードです。まず次のように色指定を行います。
Sulfur:darkkahki
Phosphorus:#FB8C00
Hydrogen:floralwhite
Others:#43A047
この時点で[Scene]のballstick1 (ballstick)を右クリックして表示されるCreate style...からstickの描画設定を登録します。登録できたらあらためてCarbonに#AB47BCを指定しましょう (Carbonが$molcolの方が使い勝手の良いstyleになるため)。
作図した構造のレンダリング
それでは最後に,作図した構造のレンダリングを行いましょう。まず,次のように背景の色を白に変更します。
Panels > [Scene] > Scene: Untitled 1 (右クリック) > Background color > White

角度,ズーム度合い,そして奥行き (slab) をレンダリング用に調整したら,次のようにPOV-Ray renderingを開きます。
メニューバー > Rendering > POV-R rendering ...

[Main options]および[POV-Ray options]について順に設定を行います。
[Main options]については次のように設定します。

下記,注意点です。
Transp backgroudにチェックを入れると透過PNGで出力できますが,同時にslabが効かなくなります (なので,今回はチェックを外しています)。
Projection:がOrthographicになっていますが,初期設定だとビューワーでの見え方はPerspectiveに設定されています (__ビューワーで観ていた画__と__レンダリング後の画__で見え方が変わってしまう)。これを回避するためには,下記のように設定を行います。
メニューバー > View > Orthographic
[POV-Ray options]については次のように設定します。

おそらく変更箇所は無いと思います。もう少し応用的な使い方をする際には変更が必要です (別記事で紹介予定)。
設定ができたらRenderを押してレンダリングを開始しましょう。下記のようにResultにレンダリング結果が表示されるはずです (25%表示にしています)。

もし分子が見切れてしまっている場合は,Image sizeのW:とH:を変更し,再度レンダリングを行いましょう。
レンダリング結果はSave image ...を押すと画像ファイルとして保存できます。また,Copy to clipboardを押すと,クリップボードにレンダリング結果をコピーできます。
最終的なできあがりはこんな感じです。可愛く作図できましたね!

【補足】 選択文法について
CueMolではGUIでの分子選択も可能ですが (本記事では説明していません),個人的には分子選択文に慣れることをおすすめします (慣れるとサクサク表示/配色させられます)。
基本的には下記の公式サイトを読めば解決します (丸投げ)
『分子選択文のリファレンス (CueMol2版)』
が,ここでは個人的に使用頻度の高い選択文を挙げていこうと思います (追記予定)
最後に
本記事ではCueMolを用いた蛋白質構造の作図について解説しました。しかし__「基礎編」としているように,まだまだ作図のテクニックはたくさんあります。ので,次回は「実践編」__としてより応用的な作図例を示す記事を書こうかなと考えています。本記事もまだ分かりづらいところが多々あると感じているので,徐々に改定していけたらと思います。
-
正確には「インフルエンザウイルスのRNA-dependent RNA polymeraseを構成するサブユニットの一つであるpolymerase acidic protein (PA) におけるcap-dependent endonucleaseドメイン」ですね ↩
-
実際には経口投与における薬剤吸収を改善するために,BXAをプロドラッグ化したbaloxavir marboxilがXofluzaの有効成分として用いられています (生体内において標的蛋白質と結合するのは活性体であるBXAです) ↩
-
Omoto, S.; Speranzini, V.; Hashimoto, T.; Noshi, T.; Yamaguchi, H.; Kawai, M.; Kawaguchi, K.; Uehara, T.; Shishido, T.; Naito, A.; Cusack, S. Characterization of influenza virus variants induced by treatment with the endonuclease inhibitor baloxavir marboxil. Sci. Rep. 2018, 8, 9633. ↩ ↩2
-
PyMOLでいうところのcartoon表示です。PyMOLのribbon表示とは異なります ↩ -
Define secondary structure of proteinsの略。ちなみに
PyMOLは独自の二次構造推定アルゴリズムを使用しているらしい ↩


