本記事は創薬アドベントカレンダー2024の17日目の記事です。
はじめに
Artificial intelligence for drug design collection
に論文が掲載されました。
Taguchi, Yh., Turki, T. Novel artificial intelligence-based identification of drug-gene-disease interaction using protein-protein interaction. BMC Bioinformatics 25, 377 (2024). https://doi.org/10.1186/s12859-024-06009-9
同collectionには現時点で16本の論文が収録されていますが自分の論文以外は全部、ニューラルネットワークです
まあ、時節柄普通、そうですよね...。以下、本論文の宣伝です。
何をした論文か?
- インシリコでドラッグリポジショニングをしました。方法はいつものテンソル分解です。
- 今回新しかったのは「まず遺伝子セット特定し、それらがどんな疾患に関係していてその病気に対して、どんな薬が治療薬になるか?を後から特定する」というGene-cetricなドラッグリポジショニングを提案したことです
- 遺伝子セットの特定には疾患や薬に関係あるデータは不要でprotein-protein interaction(PPI)の情報だけからドラッグリポジショニングが可能であることを示しました。
PPI+テンソル分解
PPIからのGene-cetricなドラッグリポジショニングを実現するために、PPIにテンソル分解を適用しました。テンソル分解を用いた教師なし学習による変数選択法をPPIに適用することで選択された遺伝子セットが上記のようなGene-cetricなドラッグリポジショニングを可能にしていることを示しました。
通常、PPIはネットワークとして表現され解析にはネットワークベースの手法が用いられますが、本研究ではPPIを行列/テンソルと表現することでテンソル分解を用いた教師なし学習による変数選択法の適用を可能にしました。
サブクラスター解析では同じことはできない
ネットワーク解析では結合度の高いサブネットワークを抽出することでノード(この場合は個々のprotein)選択を行うことがよくなされますが、本研究の場合にはサブネットワーク抽出によるprotein選択ではGene-cetricなドラッグリポジショニングがうまく行きませんでした。
終わりに
本研究ではPPIを行列/テンソル表現することでテンソル分解を用いた教師なし学習による変数選択法を可能にし、結果、従来では無かったGene-centricなドラッグリポジショニングを可能にしました。このような方法が今後は広まってドラッグリポジショニングに多く活用されることを望みます。