#はじめに
はじめまして.私は有機系の研究室で化学合成を行っている大学生です.
近年MachineLearningやDeepLearningが様々な分野で盛んに行われていますが,化学屋ではChemoinfomaticsといった分野もありますがそれほど盛んではありません.
そのため環境構築に関する書籍や記事も少ないため,ここに表題の通りRDKitというPythonのモジュールを使って有機化合物を表示させるための環境構築方法を備忘録も兼ねて記します.
#手元の環境
macbook pro 2016
macOS Catalina 10.15.4
#RDKitとは
RDKitとはchemoinfomaticsに有用なオープンソースのツールです RDKit公式サイト より
数百万以上の化合物情報(e.g. 2D・3D情報や物性値)を無料で利用できます.
#環境構築手順
##1.Anacondaのインストール
Anacondaはデータサイエンス向けのPythonパッケージを多く扱うプラットフォームです.
私はすでにインストールしていたため行っていませんが,以下のような記事を参考にするといいと思います.
##2.RDKitをAnacondaでインストール
Anacondaではconda
コマンドでパッケージを管理し仮想環境を構築します.
RDKit公式サイトの手順が非常に丁寧なので,その中で推奨されている方法をなぞって進めます.
conda create -c rdkit -n my-rdkit-env rdkit
を入力して
Proceed ([y]/n)?
などと表示されるので全て y
で続行します.
すると多くのモジュールが自動でインストールされます.
conda activate my-rdkit-env
と入力して my-rdkit-env
という仮装環境に入ることができます.成功していれば
(my-rdkit-env) パソコン名:user$
のようにターミナルに表示されているはずです.
もしここで問題が発生した場合は
cd [anaconda folder]/bin #[anaconda folder]はanacondaのインストールされた場所
source activate my-rdkit-env
と試してみてください.
仮装環境から抜け出す際には,
conda deactivate
と入力すればよいです.
次に,仮想環境下でRDKitでよく用いるモジュールをインストールします.
conda install numpy matplotlib
conda install pubchempy
conda install cmake cairo pillow eigen pkg-config
conda install boost-cpp boost py-boost
ここまででRDKitを使うために必要最低限の環境構築は完成しました.次回(多分続く)は今回構築した環境を実際に利用して化合物を表示させてゆきます.
#おわりに
環境構築って一番難しいですよね.これまも環境構築で挫折したことが何度あったやら...今回は公式サイトがとても優秀だったのでスムーズに進みました.
それではまたいつか.