LoginSignup
5
5

More than 3 years have passed since last update.

RDKitを使って有機化合物を表示させる環境構築

Last updated at Posted at 2020-03-03

はじめに

はじめまして.私は有機系の研究室で化学合成を行っている大学生です.
近年MachineLearningやDeepLearningが様々な分野で盛んに行われていますが,化学屋ではChemoinfomaticsといった分野もありますがそれほど盛んではありません.

そのため環境構築に関する書籍や記事も少ないため,ここに表題の通りRDKitというPythonのモジュールを使って有機化合物を表示させるための環境構築方法を備忘録も兼ねて記します.

手元の環境

macbook pro 2016
macOS Catalina 10.15.4

RDKitとは

RDKitとはchemoinfomaticsに有用なオープンソースのツールです RDKit公式サイト より

数百万以上の化合物情報(e.g. 2D・3D情報や物性値)を無料で利用できます.

環境構築手順

1.Anacondaのインストール

Anacondaはデータサイエンス向けのPythonパッケージを多く扱うプラットフォームです.

私はすでにインストールしていたため行っていませんが,以下のような記事を参考にするといいと思います.

Anaconda で Python 環境をインストールする

2.RDKitをAnacondaでインストール

Anacondaではcondaコマンドでパッケージを管理し仮想環境を構築します.

RDKit公式サイトの手順が非常に丁寧なので,その中で推奨されている方法をなぞって進めます.

conda create -c rdkit -n my-rdkit-env rdkit

を入力して

Proceed ([y]/n)?

などと表示されるので全て yで続行します.
すると多くのモジュールが自動でインストールされます.

conda activate my-rdkit-env

と入力して my-rdkit-env という仮装環境に入ることができます.成功していれば

(my-rdkit-env) パソコン名:user$ 

のようにターミナルに表示されているはずです.
もしここで問題が発生した場合は

cd [anaconda folder]/bin  #[anaconda folder]はanacondaのインストールされた場所
source activate my-rdkit-env

と試してみてください.
仮装環境から抜け出す際には,

conda deactivate

と入力すればよいです.

次に,仮想環境下でRDKitでよく用いるモジュールをインストールします.

conda install numpy matplotlib
conda install pubchempy
conda install cmake cairo pillow eigen pkg-config
conda install boost-cpp boost py-boost

ここまででRDKitを使うために必要最低限の環境構築は完成しました.次回(多分続く)は今回構築した環境を実際に利用して化合物を表示させてゆきます.

おわりに

環境構築って一番難しいですよね.これまも環境構築で挫折したことが何度あったやら...今回は公式サイトがとても優秀だったのでスムーズに進みました.

それではまたいつか.

5
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
5