はじめに
アミノ酸配列で表現される化合物をMOLオブジェクトに変換し、分子の記述子を計算して機械学習を行いたい。このため掲題の件を調べたのでメモっておく。
方法
RDkitのChem.MolFromFASTAを使う。
コード
peptide.py
import rdkit
from rdkit import Chem
def main():
smiles = Chem.MolToSmiles(Chem.MolFromFASTA("RGDfK"))
print(smiles)
if __name__ == "__main__":
main()
出力結果
N=C(N)NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(=O)O
お、出てる。
課題
https://www.novoprolabs.com/tools/convert-peptide-to-smiles-string のサイトのように、条件を指定して環状にした形でSMILESを得る方法が、まだよくわからない。