本記事は創薬 (wet) Advent Calendar 2019の14日目の記事です
本記事は下記の環境に基づいて執筆されました
- MacBook Pro (13-inch, 2016, Four Thunderbolt 3 Ports)
-- macOS Mojave (ver. 10.14.6)
--- CueMol2 (ver. 2.2.3.443)
本記事の概要
# CueMol
を利用して蛋白質の立体構造を__可愛く__作図します
# 基礎編です (より実践的な作図例は別記事にて紹介予定)
# インストール手順や使い方の詳細は公式ページをご参照ください
# 読むのが面倒な方は__INTRODUCTION__をぜひ飛ばしましょう
INTRODUCTION
Structure-based drug design,いわゆるSBDDという言葉が今や当たり前となったように,蛋白質の立体構造は創薬研究 (特に薬剤探索/設計) を行う上で極めて価値のある情報です。具体的には蛋白質の立体構造はin silicoの薬剤スクリーニングに用いられる基本情報であり,より原始的にはmedicinal chemistに薬剤設計のインスピレーションを与える媒体として機能します。ここで言う「インスピレーション」を得るためには__蛋白質の立体構造を観察すること__が,また得られた「インスピレーション」を他者に伝えるためには__蛋白質の立体構造を作図すること__が必要であり,そのために不可欠なソフトウェアが__分子ビューワー__です。
代表的な分子ビューワー
実験 (X線結晶構造解析/核磁気共鳴/クライオ電子顕微鏡) により決定された蛋白質の立体構造情報は,学術論文に投稿される際にProtein Data Bank (PDB) に登録されます。wet/dryにかかわらず,多くの研究者がPDBに登録された立体構造座標であるPDBファイル (.pdb
あるいは.cif
) をダウンロードし,自身の研究に日々活用しています。
上述のPDBファイルを読み込み,蛋白質の立体構造を表示することのできる分子ビューワーがいくつも存在しています。そしてこれら分子ビューワーの多くは,蛋白質の立体構造を作図する機能を内包しています。学術論文用のFigureを作成するために使われる分子ビューワーとしては,PyMOL
,Chimera
,VMD
そしてCueMol
が代表的でしょう (企業の方だとMOE
なんかの有償ソフトを使われている方も多いんですかね?)。本記事ではCueMol
を用いた蛋白質構造の作図方法について紹介します。
CueMolとは
CueMol (きゅうもる) はMozilla xulrunnerベースの生体高分子の構造を見るためのソフトウェアです。
近年ちまたには,フリーのも含め結構な数の分子ビューワー/モデリングプログラムが出回ってます。しかし,それぞれかなりくせがあり,いちいちマニュアルを熟読しないと使い方がわからないものが多いと思いませんか?
というわけで,OSのGUIとシームレスでかつ,わかりやすいユーザーインタフェイスを目指して開発を進めています。
さらに,論文やプレゼンのための高品位の分子グラフィクスを作成できるという特徴もあります。
——CueMol公式ページより
Windows版/macOS版が公開されています。DownloadページからWindows installer/macOS dmgをダウンロードし,一般的なアプリケーションと同様の手順でインストール可能です。
ライセンスですが,基本的に非商用/商用ともに (無保証で良いなら) 無料で使用できるようです (感謝)。詳細については各自ライセンスページを確認してください。
個人的にはPyMOL
より__楽に可愛く作図できる__ので好んでCueMol
を使用しています。パッと開いて軽く構造を眺めたり,変異導入操作等の少し高度な作業をする際にはPyMOL
もまだ使っていますが,最近は基本的にCueMol
で済ませることが多くなりました。ちなみにChimera
はほとんど使ったことがありません。VMD
はMDシミュレーションのトラジェクトリを確認する際に使う程度です。
ようやく本題
本記事で作図する蛋白質について
インフルエンザ治療薬Xofluzaの標的蛋白質 (PA) 1 と__Xofluzaの有効成分であるbaloxavir acid (BXA)__ 2 との__複合体の共結晶構造__を例に作図していこうと思います。この蛋白質を選んだ理由は特にありません! 蛋白質について事細かに説明もしません!(そもそも詳しくないです……。興味のある人は参考文献 3 を読んでね!)
CueMolを起動する
CueMolを起動すると次のようなwindowが開きます。
黒背景の部分は構造が描画される領域です。また,その左側にあるScene
やColor
などが表示されている領域をPanels
と呼びます。Panels
に表示させる項目は,
メニューバー
> Window
> Panels
から設定可能です。
PDBファイルを読み込ませる
インフルエンザウイルスA型 (A/California/04/2009/H1N1) のPA (PA-A) とBXAの複合体の結晶構造 (PDB code: 3FS6) を読み込んでみましょう。
PDBファイルをすでにお持ちの場合は,
メニューバー
> File
> Open File...
でファイルを指定するか,目的のファイルを構造描画領域にドラッグ&ドロップすることでPDBファイルを読み込むことができます。PDBファイルをお持ちでない場合は
メニューバー
> File
> Get PDB using accession code ...
からPDB codeを指定することで,目的のPDBファイルを読み込むことも可能です (当然ネットワークに繋がっている必要があります)。
本記事では事前にダウンロードしていた6fs6.cif
を読み込ませました。すると次のようなwindowが開きます。
[Renderer]
を上記画像の通りに設定しOK
を押しましょう (Object:
やRenderer name:
の欄は,お好きな名前をつけて大丈夫です)。Renderer type:
は,構造をどのようなモデルで描画するかの設定です。今回は蛋白質をribbonモデル 4 で描画しますので,ribbon
を選択しています。Selection:
にチェックを入れることで,PDBファイルの一部を指定して描画することができます。今回はprotein
と指定しているため,蛋白質領域のみ描画されます (リガンドおよび結晶水などは無視されます)。Recenter view
にチェックを入れることで,描画開始時にセンタリングを行います。
[mmCIF options]
の各項目は,基本的に変更しません。Calculate protein secondary structure
にチェックが入っていると,PDBファイル内に記述されている二次構造のアサインメント情報を無視してDSSP 5 により推定された二次構造に基づいた描画が実行される,ということに留意しておけば良いでしょう。
すると下記のようにPA-Aが描画されます (マウスで分子を回せます。スクロールでズームの度合いを変更できます。奥行きはPanels
にある[View]
のSlab
から変更できます)。
Ribbonの設定
それでは続いてribbon表示の設定を行います (個人的によく使用している設定を公開します)。また,どうやら本PDBファイルは非対称単位 (生物学的単位とは必ずしも一致しない 6) 中に6分子のPAを含むようです。今はA chainのみを対象に描画したいので,その設定も同時に行ってしまいます。
まずPanels
にある[Scene]
にribbon1 (ribbon)
があることを確認してください。
このようにCueMolでは読み込ませたPDBファイルの下階層にribbonや後述のstickなどがどんどん足されていきます。また,左側にあるのアイコンをクリックすると,各objectの表示/非表示をトグル形式で切り替えることができます (便利)。下側にある,,およびのアイコンは,クリックすることでそれぞれズーム,objectの追加,およびobjectの削除を行うことができます。
ribbon1 (ribbon)
をダブルクリックすると下記のwindowが開きます。
[Common]
,[Helix]
,[Sheet]
,および[Coil]
について順に設定を行います。
[Common]
については次のように設定します (変更箇所:赤枠)。
一部補足すると……
Smooth color
のチェックを外すことで,色付けの際のグラデーションを無くしました
Selection:
をprotein
からprotein & c; A
に変更することで,蛋白質のA chainのみを描画するようにしました (選択文法については後述)
Material
をtoon1
にすることで,レンダリングの際のタッチを__可愛く__しました
Edge line
をedges
にすることで,描画の縁取りを追加しました (Width
は0.06
に設定)
入力できたらApply
をクリックして設定を適応しましょう。
[Helix]
については次のように設定します (変更箇所:赤枠)。
入力できたらApply
をクリックして設定を適応しましょう。
[Sheet]
については次のように設定します (変更箇所:赤枠)。
入力できたらApply
をクリックして設定を適応しましょう。
[Coil]
については次のように設定します (変更箇所:赤枠)。
入力できたらApply
をクリックして設定を適応しましょう。
OK
をクリックしていい感じにズーム (とスクロール) してあげると__あら可愛い__,下記のように表示されるはずです。
[Scene]
のribbon1 (ribbon)
を右クリックして表示されるCreate style...
から本設定を登録することができます。次からはribbon1 (ribbon)
を右クリックして表示されるStyle
の中から,保存した設定を楽に読み出せるようになります。
Disorder領域の描画と設定
PDB code: 3FS6にはdisorder領域が含まれているので,次にこれを追加で描画します。[Scene]
の下部のアイコンをクリックするとwindowが表示されるので,下記のように入力してOK
をクリックしましょう。
するとdisorder領域 (欠損領域) が破線で表示されるはずです。続いて描画の設定を行います。
[Scene]
のdisorder1 (disorder)
をダブルクリックすると下記のwindowが開きます。
[Common]
および[Disorder]
について順に設定を行います。
[Common]
については次のように設定します (変更箇所:赤枠)。
入力できたらApply
をクリックして設定を適応しましょう。
[Disorder]
については次のように設定します (変更箇所:赤枠)。
入力できたらApply
をクリックして設定を適応しましょう。Color:
を$molcol
と設定していますが,これについては後述の色設定に関する説明の中で併せて解説します。
OK
をクリックしていい感じ角度を調節してあげると__あら可愛い__,下記のように表示されるはずです。
Ribbonの設定と同様,[Scene]
のdisorder1 (disorder)
を右クリックして表示されるCreate style...
から本設定を登録することができます。
低分子リガンドのstick描画と設定
次にPA-Aに結合しているBXAをstick表示してみましょう。[Scene]
の下部のアイコンをクリックするとwindowが表示されるので,下記のように入力してOK
をクリックしましょう。
Selection:
のr; E4Z
は本PDBファイルにおけるBXAの残基名を指定しています (選択文法については後述)。
するとBXAがball & stickモデルで表示されるはずです。続いて描画の設定を行います。
[Scene]
のballstick1 (ballstick)
をダブルクリックすると下記のwindowが開きます。
[Common]
および[Ball & Stick]
について順に設定を行います。
[Common]
については次のように設定します (変更箇所:赤枠)。
入力できたらApply
をクリックして設定を適応しましょう。
[Ball & Stick]
については次のように設定します (変更箇所:赤枠)。
Bond width
とAtom radius
の値を同じにすることで,stick表示にすることができます。
入力できたらApply
をクリックして設定を適応しましょう。
OK
をクリックしていい感じ角度を調節してあげると__あら可愛い__,下記のように表示されるはずです。
[Scene]
のballstick1 (ballstick)
を右クリックして表示されるCreate style...
から本設定を登録することができます……,がstickについては後述の色設定を行ってから登録するのがおすすめです。
特定のアミノ酸残基のCPK描画と設定
BXAに対する耐性株では,PAにおけるIle38のThrへの変異が報告されています 3。
というわけで,次にPA-AのIle38をCPK表示してみましょう。[Scene]
の下部のアイコンをクリックするとwindowが表示されるので,下記のように入力してOK
をクリックしましょう。
Selection:
のi; 38
は本PDBファイルにおける38番目のアミノ酸残基を指定しています (選択文法については後述)。
するとIle38がCPKモデルで表示されるはずです。続いて描画の設定を行います。
[Scene]
のcpk1 (cpk)
をダブルクリックすると下記のwindowが開きます。
[Common]
および[Atom radii]
について順に設定を行います。
[Common]
については次のように設定します (変更箇所:赤枠)。
入力できたらApply
をクリックして設定を適応しましょう。
[Atom radii]
については次のように設定します (変更箇所:赤枠)。
入力できたらApply
をクリックして設定を適応しましょう。
OK
をクリックしていい感じ角度を調節してあげると__あら可愛い__,下記のように表示されるはずです。
[Scene]
のcpk1 (cpk)
を右クリックして表示されるCreate style...
から本設定を登録することができます……,がCPKについても後述の色設定を行ってから登録するのがおすすめです。
色の設定
[Color]
についてまずは6fs6.cif
全体の色指定を行います。
Paint coloring:
のsheet
をダブルクリックすると下記のようなwindowが開くので,Color:
に#00ACC1
と入力してOK
を押してください (▼を押すことでGUIでも色選択できます)。
続いてhelix
も同様にダブルクリックし,Color:
に#FB8C00
と入力してOK
を押してください。
*
はPDBファイル全体を指定しています (FloralWhite
のままでOKです)。
Paint coloring:
は上ほど優先度が高く,結果として下から順に色を重ねていくことになります。
つまり今の状態では優先度が *
< helix
< sheet
なので,分子全体がFloralWhite
で塗られた上にhelix
とsheet
の着色が行われています。
ちなみに*
を一番上に移動させると下記のように分子全体がFloralWhite
になります。
次に各objectの色指定を行います。
6fs6.cif/ribbon1
を選択すると,下記のように[Color]
がribbon1
の設定画面に切り替わります。
Coloring type: SolidColoring
となっていますが,これは単色指定モードです。
Default color
を指定することでribbon全体の色を指定できます。
(ちなみにさきほどの6fs6.cif
全体の色指定はPaint coloring:
というモードでした)
今回は設定変更する必要はありません。
Default color
が$molcol
となっていますが,これはさきほど設定した6fs6.cif
全体の色指定を反映するというコードです (重要)。つまり今回の場合は,二次構造に基づいた配色を行うことになります。
次に6fs6.cif/ballstick1
を選択すると,下記のように[Color]
がballstick1
の設定画面に切り替わります。
CPK coloring:
となっていますが,これは原子の種類ごとに色指定を行うモードです。まず次のように色指定を行います。
Sulfur
:darkkahki
Phosphorus
:#FB8C00
Hydrogen
:floralwhite
Others
:#43A047
この時点で[Scene]
のballstick1 (ballstick)
を右クリックして表示されるCreate style...
からstickの描画設定を登録します。登録できたらあらためてCarbon
に#8D6E63
を指定しましょう (Carbon
が$molcol
の方が使い勝手の良いstyleになるため)。
次に6fs6.cif/cpk1
を選択すると,下記のように[Color]
がcpk1
の設定画面に切り替わります。
CPK coloring:
となっていますが,これは原子の種類ごとに色指定を行うモードです。まず次のように色指定を行います。
Sulfur
:darkkahki
Phosphorus
:#FB8C00
Hydrogen
:floralwhite
Others
:#43A047
この時点で[Scene]
のballstick1 (ballstick)
を右クリックして表示されるCreate style...
からstickの描画設定を登録します。登録できたらあらためてCarbon
に#AB47BC
を指定しましょう (Carbon
が$molcol
の方が使い勝手の良いstyleになるため)。
作図した構造のレンダリング
それでは最後に,作図した構造のレンダリングを行いましょう。まず,次のように背景の色を白に変更します。
Panels
> [Scene]
> Scene: Untitled 1
(右クリック) > Background color
> White
角度,ズーム度合い,そして奥行き (slab) をレンダリング用に調整したら,次のようにPOV-Ray rendering
を開きます。
メニューバー
> Rendering
> POV-R rendering ...
[Main options]
および[POV-Ray options]
について順に設定を行います。
[Main options]
については次のように設定します。
下記,注意点です。
Transp backgroud
にチェックを入れると透過PNGで出力できますが,同時にslabが効かなくなります (なので,今回はチェックを外しています)。
Projection:
がOrthographic
になっていますが,初期設定だとビューワーでの見え方はPerspective
に設定されています (__ビューワーで観ていた画__と__レンダリング後の画__で見え方が変わってしまう)。これを回避するためには,下記のように設定を行います。
メニューバー
> View
> Orthographic
[POV-Ray options]
については次のように設定します。
おそらく変更箇所は無いと思います。もう少し応用的な使い方をする際には変更が必要です (別記事で紹介予定)。
設定ができたらRender
を押してレンダリングを開始しましょう。下記のようにResult
にレンダリング結果が表示されるはずです (25%表示にしています)。
もし分子が見切れてしまっている場合は,Image size
のW:
とH:
を変更し,再度レンダリングを行いましょう。
レンダリング結果はSave image ...
を押すと画像ファイルとして保存できます。また,Copy to clipboard
を押すと,クリップボードにレンダリング結果をコピーできます。
最終的なできあがりはこんな感じです。可愛く作図できましたね!
【補足】 選択文法について
CueMol
ではGUIでの分子選択も可能ですが (本記事では説明していません),個人的には分子選択文に慣れることをおすすめします (慣れるとサクサク表示/配色させられます)。
基本的には下記の公式サイトを読めば解決します (丸投げ)
『分子選択文のリファレンス (CueMol2版)』
が,ここでは個人的に使用頻度の高い選択文を挙げていこうと思います (追記予定)
最後に
本記事ではCueMol
を用いた蛋白質構造の作図について解説しました。しかし__「基礎編」としているように,まだまだ作図のテクニックはたくさんあります。ので,次回は「実践編」__としてより応用的な作図例を示す記事を書こうかなと考えています。本記事もまだ分かりづらいところが多々あると感じているので,徐々に改定していけたらと思います。
-
正確には「インフルエンザウイルスのRNA-dependent RNA polymeraseを構成するサブユニットの一つであるpolymerase acidic protein (PA) におけるcap-dependent endonucleaseドメイン」ですね ↩
-
実際には経口投与における薬剤吸収を改善するために,BXAをプロドラッグ化したbaloxavir marboxilがXofluzaの有効成分として用いられています (生体内において標的蛋白質と結合するのは活性体であるBXAです) ↩
-
Omoto, S.; Speranzini, V.; Hashimoto, T.; Noshi, T.; Yamaguchi, H.; Kawai, M.; Kawaguchi, K.; Uehara, T.; Shishido, T.; Naito, A.; Cusack, S. Characterization of influenza virus variants induced by treatment with the endonuclease inhibitor baloxavir marboxil. Sci. Rep. 2018, 8, 9633. ↩ ↩2
-
PyMOL
でいうところのcartoon表示です。PyMOL
のribbon表示とは異なります ↩ -
Define secondary structure of proteinsの略。ちなみに
PyMOL
は独自の二次構造推定アルゴリズムを使用しているらしい ↩