LoginSignup
10
11

More than 3 years have passed since last update.

CueMolで「推し蛋白質」を可愛く作図しよう (基礎編)

Last updated at Posted at 2019-12-15

:christmas_tree:本記事は創薬 (wet) Advent Calendar 2019の14日目の記事です

:christmas_tree:本記事は下記の環境に基づいて執筆されました
- MacBook Pro (13-inch, 2016, Four Thunderbolt 3 Ports)
-- macOS Mojave (ver. 10.14.6)
--- CueMol2 (ver. 2.2.3.443)

:christmas_tree:本記事の概要
CueMolを利用して蛋白質の立体構造を可愛く作図します
# 基礎編です (より実践的な作図例は別記事にて紹介予定)
# インストール手順や使い方の詳細は公式ページをご参照ください
# 読むのが面倒な方はINTRODUCTIONをぜひ飛ばしましょう

INTRODUCTION

Structure-based drug design,いわゆるSBDDという言葉が今や当たり前となったように,蛋白質の立体構造は創薬研究 (特に薬剤探索/設計) を行う上で極めて価値のある情報です。具体的には蛋白質の立体構造はin silicoの薬剤スクリーニングに用いられる基本情報であり,より原始的にはmedicinal chemistに薬剤設計のインスピレーションを与える媒体として機能します。ここで言う「インスピレーション」を得るためには蛋白質の立体構造を観察することが,また得られた「インスピレーション」を他者に伝えるためには蛋白質の立体構造を作図することが必要であり,そのために不可欠なソフトウェアが分子ビューワーです。

代表的な分子ビューワー

実験 (X線結晶構造解析/核磁気共鳴/クライオ電子顕微鏡) により決定された蛋白質の立体構造情報は,学術論文に投稿される際にProtein Data Bank (PDB) に登録されます。wet/dryにかかわらず,多くの研究者がPDBに登録された立体構造座標であるPDBファイル (.pdbあるいは.cif) をダウンロードし,自身の研究に日々活用しています。

上述のPDBファイルを読み込み,蛋白質の立体構造を表示することのできる分子ビューワーがいくつも存在しています。そしてこれら分子ビューワーの多くは,蛋白質の立体構造を作図する機能を内包しています。学術論文用のFigureを作成するために使われる分子ビューワーとしては,PyMOLChimeraVMDそしてCueMolが代表的でしょう (企業の方だとMOEなんかの有償ソフトを使われている方も多いんですかね?)。本記事ではCueMolを用いた蛋白質構造の作図方法について紹介します。

CueMolとは

CueMol (きゅうもる) はMozilla xulrunnerベースの生体高分子の構造を見るためのソフトウェアです。
近年ちまたには,フリーのも含め結構な数の分子ビューワー/モデリングプログラムが出回ってます。しかし,それぞれかなりくせがあり,いちいちマニュアルを熟読しないと使い方がわからないものが多いと思いませんか?
というわけで,OSのGUIとシームレスでかつ,わかりやすいユーザーインタフェイスを目指して開発を進めています。
さらに,論文やプレゼンのための高品位の分子グラフィクスを作成できるという特徴もあります。
——CueMol公式ページより

Windows版/macOS版が公開されています。DownloadページからWindows installer/macOS dmgをダウンロードし,一般的なアプリケーションと同様の手順でインストール可能です。

ライセンスですが,基本的に非商用/商用ともに (無保証で良いなら) 無料で使用できるようです (感謝)。詳細については各自ライセンスページを確認してください。

個人的にはPyMOLより楽に可愛く作図できるので好んでCueMolを使用しています。パッと開いて軽く構造を眺めたり,変異導入操作等の少し高度な作業をする際にはPyMOLもまだ使っていますが,最近は基本的にCueMolで済ませることが多くなりました。ちなみにChimeraはほとんど使ったことがありません。VMDはMDシミュレーションのトラジェクトリを確認する際に使う程度です。

ようやく本題

本記事で作図する蛋白質について

インフルエンザ治療薬Xofluzaの標的蛋白質 (PA) 1Xofluzaの有効成分であるbaloxavir acid (BXA) 2 との複合体の共結晶構造を例に作図していこうと思います。この蛋白質を選んだ理由は特にありません! 蛋白質について事細かに説明もしません!(そもそも詳しくないです……。興味のある人は参考文献 3 を読んでね!)

CueMolを起動する

CueMolを起動すると次のようなwindowが開きます。
01.png
黒背景の部分は構造が描画される領域です。また,その左側にあるSceneColorなどが表示されている領域をPanelsと呼びます。Panelsに表示させる項目は,
  メニューバー > Window > Panels
から設定可能です。

PDBファイルを読み込ませる

インフルエンザウイルスA型 (A/California/04/2009/H1N1) のPA (PA-A) とBXAの複合体の結晶構造 (PDB code: 3FS6) を読み込んでみましょう。

PDBファイルをすでにお持ちの場合は,
  メニューバー > File > Open File...
でファイルを指定するか,目的のファイルを構造描画領域にドラッグ&ドロップすることでPDBファイルを読み込むことができます。PDBファイルをお持ちでない場合は
  メニューバー > File > Get PDB using accession code ...
からPDB codeを指定することで,目的のPDBファイルを読み込むことも可能です (当然ネットワークに繋がっている必要があります)。
02.png

本記事では事前にダウンロードしていた6fs6.cifを読み込ませました。すると次のようなwindowが開きます。
03.png
[Renderer]を上記画像の通りに設定しOKを押しましょう (Object:Renderer name:の欄は,お好きな名前をつけて大丈夫です)。Renderer type:は,構造をどのようなモデルで描画するかの設定です。今回は蛋白質をribbonモデル 4 で描画しますので,ribbonを選択しています。Selection:にチェックを入れることで,PDBファイルの一部を指定して描画することができます。今回はproteinと指定しているため,蛋白質領域のみ描画されます (リガンドおよび結晶水などは無視されます)。Recenter viewにチェックを入れることで,描画開始時にセンタリングを行います。

[mmCIF options]の各項目は,基本的に変更しません。Calculate protein secondary structureにチェックが入っていると,PDBファイル内に記述されている二次構造のアサインメント情報を無視してDSSP 5 により推定された二次構造に基づいた描画が実行される,ということに留意しておけば良いでしょう。

すると下記のようにPA-Aが描画されます (マウスで分子を回せます。スクロールでズームの度合いを変更できます。奥行きはPanelsにある[View]Slabから変更できます)。

05.png

Ribbonの設定

それでは続いてribbon表示の設定を行います (個人的によく使用している設定を公開します)。また,どうやら本PDBファイルは非対称単位 (生物学的単位とは必ずしも一致しない 6) 中に6分子のPAを含むようです。今はA chainのみを対象に描画したいので,その設定も同時に行ってしまいます。

まずPanelsにある[Scene]ribbon1 (ribbon)があることを確認してください。
06.png
このようにCueMolでは読み込ませたPDBファイルの下階層にribbonや後述のstickなどがどんどん足されていきます。また,左側にある:eyes:のアイコンをクリックすると,各objectの表示/非表示をトグル形式で切り替えることができます (便利)。下側にある:mag::heavy_plus_sign:,および:heavy_minus_sign:のアイコンは,クリックすることでそれぞれズーム,objectの追加,およびobjectの削除を行うことができます。

ribbon1 (ribbon)をダブルクリックすると下記のwindowが開きます。
07.png
[Common][Helix][Sheet],および[Coil]について順に設定を行います。

[Common]については次のように設定します (変更箇所:赤枠)。
08.png
一部補足すると……
Smooth colorのチェックを外すことで,色付けの際のグラデーションを無くしました
Selection:proteinからprotein & c; Aに変更することで,蛋白質のA chainのみを描画するようにしました (選択文法については後述)
Materialtoon1にすることで,レンダリングの際のタッチを可愛くしました
Edge lineedgesにすることで,描画の縁取りを追加しました (Width0.06に設定)

入力できたらApplyをクリックして設定を適応しましょう。

[Helix]については次のように設定します (変更箇所:赤枠)。
09.png
入力できたらApplyをクリックして設定を適応しましょう。

[Sheet]については次のように設定します (変更箇所:赤枠)。
10.png
入力できたらApplyをクリックして設定を適応しましょう。

[Coil]については次のように設定します (変更箇所:赤枠)。
11.png
入力できたらApplyをクリックして設定を適応しましょう。

OKをクリックしていい感じにズーム (:mag:とスクロール) してあげるとあら可愛い,下記のように表示されるはずです。
12.png

[Scene]ribbon1 (ribbon)を右クリックして表示されるCreate style...から本設定を登録することができます。次からはribbon1 (ribbon)を右クリックして表示されるStyleの中から,保存した設定を楽に読み出せるようになります。

Disorder領域の描画と設定

PDB code: 3FS6にはdisorder領域が含まれているので,次にこれを追加で描画します。[Scene]の下部の:heavy_plus_sign:アイコンをクリックするとwindowが表示されるので,下記のように入力してOKをクリックしましょう。
13.png

するとdisorder領域 (欠損領域) が破線で表示されるはずです。続いて描画の設定を行います。
[Scene]disorder1 (disorder)をダブルクリックすると下記のwindowが開きます。
14.png
[Common]および[Disorder]について順に設定を行います。

[Common]については次のように設定します (変更箇所:赤枠)。
15.png
入力できたらApplyをクリックして設定を適応しましょう。

[Disorder]については次のように設定します (変更箇所:赤枠)。
16.png
入力できたらApplyをクリックして設定を適応しましょう。Color:$molcolと設定していますが,これについては後述の色設定に関する説明の中で併せて解説します。

OKをクリックしていい感じ角度を調節してあげるとあら可愛い,下記のように表示されるはずです。
17.png

Ribbonの設定と同様,[Scene]disorder1 (disorder)を右クリックして表示されるCreate style...から本設定を登録することができます。

低分子リガンドのstick描画と設定

次にPA-Aに結合しているBXAをstick表示してみましょう。[Scene]の下部の:heavy_plus_sign:アイコンをクリックするとwindowが表示されるので,下記のように入力してOKをクリックしましょう。
19.png
Selection:r; E4Zは本PDBファイルにおけるBXAの残基名を指定しています (選択文法については後述)。

するとBXAがball & stickモデルで表示されるはずです。続いて描画の設定を行います。
[Scene]ballstick1 (ballstick)をダブルクリックすると下記のwindowが開きます。
20.png
[Common]および[Ball & Stick]について順に設定を行います。

[Common]については次のように設定します (変更箇所:赤枠)。
21.png
入力できたらApplyをクリックして設定を適応しましょう。

[Ball & Stick]については次のように設定します (変更箇所:赤枠)。
22.png
Bond widthAtom radiusの値を同じにすることで,stick表示にすることができます。
入力できたらApplyをクリックして設定を適応しましょう。

OKをクリックしていい感じ角度を調節してあげるとあら可愛い,下記のように表示されるはずです。
23.png

[Scene]ballstick1 (ballstick)を右クリックして表示されるCreate style...から本設定を登録することができます……,がstickについては後述の色設定を行ってから登録するのがおすすめです。

特定のアミノ酸残基のCPK描画と設定

BXAに対する耐性株では,PAにおけるIle38のThrへの変異が報告されています 3
というわけで,次にPA-AのIle38をCPK表示してみましょう。[Scene]の下部の:heavy_plus_sign:アイコンをクリックするとwindowが表示されるので,下記のように入力してOKをクリックしましょう。
30.png
Selection:i; 38は本PDBファイルにおける38番目のアミノ酸残基を指定しています (選択文法については後述)。

するとIle38がCPKモデルで表示されるはずです。続いて描画の設定を行います。
[Scene]cpk1 (cpk)をダブルクリックすると下記のwindowが開きます。
31.png
[Common]および[Atom radii]について順に設定を行います。

[Common]については次のように設定します (変更箇所:赤枠)。
32.png
入力できたらApplyをクリックして設定を適応しましょう。

[Atom radii]については次のように設定します (変更箇所:赤枠)。
33.png
入力できたらApplyをクリックして設定を適応しましょう。

OKをクリックしていい感じ角度を調節してあげるとあら可愛い,下記のように表示されるはずです。
34.png

[Scene]cpk1 (cpk)を右クリックして表示されるCreate style...から本設定を登録することができます……,がCPKについても後述の色設定を行ってから登録するのがおすすめです。

色の設定

[Color]についてまずは6fs6.cif全体の色指定を行います。
25.png

Paint coloring:sheetをダブルクリックすると下記のようなwindowが開くので,Color:#00ACC1と入力してOKを押してください (▼を押すことでGUIでも色選択できます)。
24.png

続いてhelixも同様にダブルクリックし,Color:#FB8C00と入力してOKを押してください。

*はPDBファイル全体を指定しています (FloralWhiteのままでOKです)。

Paint coloring:は上ほど優先度が高く,結果として下から順に色を重ねていくことになります。
つまり今の状態では優先度が * < helix < sheet なので,分子全体がFloralWhiteで塗られた上にhelixsheetの着色が行われています。
35.png

ちなみに*を一番上に移動させると下記のように分子全体がFloralWhiteになります。
36.png

次に各objectの色指定を行います。

6fs6.cif/ribbon1を選択すると,下記のように[Color]ribbon1の設定画面に切り替わります。
28.png
Coloring type: SolidColoringとなっていますが,これは単色指定モードです。
Default colorを指定することでribbon全体の色を指定できます。
(ちなみにさきほどの6fs6.cif全体の色指定はPaint coloring:というモードでした)

今回は設定変更する必要はありません。
Default color$molcolとなっていますが,これはさきほど設定した6fs6.cif全体の色指定を反映するというコードです (重要)。つまり今回の場合は,二次構造に基づいた配色を行うことになります。

次に6fs6.cif/ballstick1を選択すると,下記のように[Color]ballstick1の設定画面に切り替わります。
29.png
CPK coloring:となっていますが,これは原子の種類ごとに色指定を行うモードです。まず次のように色指定を行います。

  Sulfurdarkkahki
  Phosphorus#FB8C00
  Hydrogenfloralwhite
  Others#43A047

この時点で[Scene]ballstick1 (ballstick)を右クリックして表示されるCreate style...からstickの描画設定を登録します。登録できたらあらためてCarbon#8D6E63を指定しましょう (Carbon$molcolの方が使い勝手の良いstyleになるため)。

これで下記のようにBXAが着色ができました。
37.png

次に6fs6.cif/cpk1を選択すると,下記のように[Color]cpk1の設定画面に切り替わります。
38.png
CPK coloring:となっていますが,これは原子の種類ごとに色指定を行うモードです。まず次のように色指定を行います。

  Sulfurdarkkahki
  Phosphorus#FB8C00
  Hydrogenfloralwhite
  Others#43A047

この時点で[Scene]ballstick1 (ballstick)を右クリックして表示されるCreate style...からstickの描画設定を登録します。登録できたらあらためてCarbon#AB47BCを指定しましょう (Carbon$molcolの方が使い勝手の良いstyleになるため)。

これで下記のようにIle38が着色ができました。
40.png

作図した構造のレンダリング

それでは最後に,作図した構造のレンダリングを行いましょう。まず,次のように背景の色を白に変更します。

  Panels > [Scene] > Scene: Untitled 1 (右クリック) > Background color > White
41.png

下記のように背景色が白に変更されます。
42.png

角度,ズーム度合い,そして奥行き (slab) をレンダリング用に調整したら,次のようにPOV-Ray renderingを開きます。

  メニューバー > Rendering > POV-R rendering ...
43.png
[Main options]および[POV-Ray options]について順に設定を行います。

[Main options]については次のように設定します。
44.png
下記,注意点です。
Transp backgroudにチェックを入れると透過PNGで出力できますが,同時にslabが効かなくなります (なので,今回はチェックを外しています)。
Projection:Orthographicになっていますが,初期設定だとビューワーでの見え方はPerspectiveに設定されています (ビューワーで観ていた画レンダリング後の画で見え方が変わってしまう)。これを回避するためには,下記のように設定を行います。

  メニューバー > View > Orthographic

[POV-Ray options]については次のように設定します。
45.png
おそらく変更箇所は無いと思います。もう少し応用的な使い方をする際には変更が必要です (別記事で紹介予定)。

設定ができたらRenderを押してレンダリングを開始しましょう。下記のようにResultにレンダリング結果が表示されるはずです (25%表示にしています)。
46.png
もし分子が見切れてしまっている場合は,Image sizeW:H:を変更し,再度レンダリングを行いましょう。

レンダリング結果はSave image ...を押すと画像ファイルとして保存できます。また,Copy to clipboardを押すと,クリップボードにレンダリング結果をコピーできます。

最終的なできあがりはこんな感じです。可愛く作図できましたね!
47.png

【補足】 選択文法について

CueMolではGUIでの分子選択も可能ですが (本記事では説明していません),個人的には分子選択文に慣れることをおすすめします (慣れるとサクサク表示/配色させられます)。

基本的には下記の公式サイトを読めば解決します (丸投げ)
『分子選択文のリファレンス (CueMol2版)』

が,ここでは個人的に使用頻度の高い選択文を挙げていこうと思います (追記予定)

最後に

本記事ではCueMolを用いた蛋白質構造の作図について解説しました。しかし「基礎編」としているように,まだまだ作図のテクニックはたくさんあります。ので,次回は「実践編」としてより応用的な作図例を示す記事を書こうかなと考えています。本記事もまだ分かりづらいところが多々あると感じているので,徐々に改定していけたらと思います。


  1. 正確には「インフルエンザウイルスのRNA-dependent RNA polymeraseを構成するサブユニットの一つであるpolymerase acidic protein (PA) におけるcap-dependent endonucleaseドメイン」ですね 

  2. 実際には経口投与における薬剤吸収を改善するために,BXAをプロドラッグ化したbaloxavir marboxilがXofluzaの有効成分として用いられています (生体内において標的蛋白質と結合するのは活性体であるBXAです) 

  3. Omoto, S.; Speranzini, V.; Hashimoto, T.; Noshi, T.; Yamaguchi, H.; Kawai, M.; Kawaguchi, K.; Uehara, T.; Shishido, T.; Naito, A.; Cusack, S. Characterization of influenza virus variants induced by treatment with the endonuclease inhibitor baloxavir marboxil. Sci. Rep. 2018, 8, 9633. 

  4. PyMOLでいうところのcartoon表示です。PyMOLのribbon表示とは異なります 

  5. Define secondary structure of proteinsの略。ちなみにPyMOLは独自の二次構造推定アルゴリズムを使用しているらしい 

  6. PDBj『非対称単位と生物学的単位について』 

10
11
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
10
11