LoginSignup
0
0

More than 1 year has passed since last update.

KNIMEでSMILESから分子の三次元構造を作ってみる

Last updated at Posted at 2022-06-27

概要

  • KNIMEを用いてSMILESから分子の三次元構造を立ち上げるごく簡単なワークフローを作ってみた。
    スクリーンショット 2022-06-27 22.57.11.png

  • アウトプットイメージ
    SMILES: CC(N)=O
     ↓
    三次元構造:
    スクリーンショット 2022-06-27 22.54.14.png

目的

分子構造のデータはSMILESで入手することが多いが、それは文字列のデータであり、そのままでは量子化学計算等にかけることができない。そこで三次元の構造に変換したい。
いくつかやり方はあるが、KNIMEというツールを使うとサクッとできるらしいのでやってみる。

使用したもの

  • KNIME 4.5.0
     (https://www.knime.com)

  • KNIMEノード
     ・RDKitノード
     ・Chemistryノード

  • データ:T.J.Houらの論文にある1290の化合物のSMILES, 水溶解度、構造記述子がまとまったcsv
    明治大・金子先生のサイトで紹介されているもの)
    T. J. Hou, K. Xia, W. Zhang and X. J. Xu, ADME Evaluation in Drug Discovery. 4. Prediction of Aqueous Solubility Based on Atom Contribution Approach, J. Chem. Inf. Comput. Sci., 44(1), 266–275, 2004.

ワークフロー

ざっくりとワークフローでやっていることを解説

Node1: CSV Reader

csvファイルを指定して読み込む。

Node2: Molecule Type Cast

選択した文字列を分子の型として変換する。
ここではSMILESとして認識するようにする。

Node3: RDKit From Molecule

SMILESからRDKitのMol形式に変換する。

Node4: RDKit Add Hs

分子構造で省略されているH原子を明示的に付加する。

Node5: RDKit Generate Coords

Mol形式の分子情報を三次元の構造に変換する。
(恐らくDistance Geometry(DG)法を用いている?)

Node6: RDKit Optimize Geometry

Node5で作成した三次元構造に歪みがある可能性があるので、
念のため、分子力場を用いて構造最適化をする。
(DG法で三次元構造を作成する際には芳香環が歪んでしまうことがあるらしい。)

Node7: SDF Writer

最適化した構造の列をSDFファイルに出力する。
Avogadroなどの分子構造の可視化ソフトでアウトプットのsdfファイルを読み込んでみると「概要」で示したような立体構造が生成されていることが確認できる。

まとめ

KNIMEのRDKitノードを使って簡単にSMILESから三次元の分子構造を作成した。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0