SMILESとは
まずSMILESはsimplified molecular input line entry systemの略称で、分子を文字列化したものです。文字列として計算機に入力できるのでケモインフォマティクスの分野でよく用いられています。他の記事でも解説している通り、後述のルールに則って分子を文字列に書き下すことができるのですが、如何せん、分子が大きくなると書き換えるのも一苦労です。
そんな時に活躍するWEBアプリを見つけたので、備忘録として残しておきます。
MolView
これを使うと分子構造からSMILESにしてくれます。
分子構造からSMILESの出し方
(1) MolViewにアクセスして分子構造を描く
(2) View → Infocard
(3) SMILESが書いてある
SMILESも種類があって、MolViewでは二種類のSMILESを表記してくれています。
SMILESから分子構造の出し方
MolViewはSMILESから分子構造を出してもくれます。
(1) 検索バーにSMILESを入力
(2) Lookup SMILES
画像はナフタレンのSMILESを入力して分子構造を出した例です。
ちなみに普通に分子構造をSMILESに書き換えるには
a. 水素原子(H)を省略する。
b. 単結合を省略し、二重結合を” = “、三重結合を” # ”で表す。
c. 分岐は丸括弧で表現する。
d. 環状分子は環を巻く結合をもつ原子の後ろに同一番号をつける。芳香環を構成する元素は小文字にする。
上記で書き換えた例はこんな感じです。