はじめに
DTU health techとは
DTU Health Techは、デンマーク工科大学・健康技術学科のことで、医療技術の発展を目指す研究・教育機関である。
診断技術、バイオテクノロジー、デジタルヘルス、ロボティクス、バイオインフォマティクスなどの分野で革新的な技術を開発し、医療の質向上に貢献することを目指す。病院や産業界との連携を重視し、研究成果を実際の医療ソリューションとして展開している。
その中で、バイオインフォマティクス解析に活用できるWebインターフェースも開発しており、今回紹介するDeepLocもその1つ。
DeepLocとは
DeepLocは、タンパク質の細胞内局在を予測するためのディープラーニングツール。
アミノ酸配列を入力すると、タンパク質が細胞内のどの部位(核、ミトコンドリア、細胞膜など)に存在するかを高精度で予測できる。
また、論文(Thumuluri et al., 2022)を読むと、Swissprotに登録された、真核生物の幅広い生物種の細胞内局在データを使って訓練されているので、真核生物であればどのタンパク質においても適用可能であると考えられる。
Thumuluri, V., Almagro Armenteros, J. J., Johansen, A. R., Nielsen, H., & Winther, O. (2022). DeepLoc 2.0: multi-label subcellular localization prediction using protein language models. Nucleic acids research, 50(W1), W228–W234.
利用シーンとしては、生物学的研究で、特定のタンパク質がどこで機能しているかを知りたい場合がある。また、新規のタンパク質がどの細胞内コンパートメントで機能するか予測することで、実験デザインや解析のサポートになる。
加えて、Deeploc v2.1では、膜タンパク質のタイプを膜貫通型、細胞膜近傍型、脂質結合型、及び可溶性の4種類に分類する。詳しくはこちらの論文。
Ødum, M. T., Teufel, F., Thumuluri, V., Almagro Armenteros, J. J., Johansen, A. R., Winther, O., & Nielsen, H. (2024). DeepLoc 2.1: multi-label membrane protein type prediction using protein language models. Nucleic acids research, 52(W1), W215–W220.
DeepLocの使用方法
①DeepLoc(v2.1)にアクセス
②アミノ酸配列のアップロード
調べたいアミノ酸配列をコピー&ペーストもしくはfastaとしてアップロードする。
今回は、コピー&ペーストで進める。
③モデル
早くしたい場合は、質は劣るが高速なHigh-throughput (Fast)
正確にしたい場合は、少し遅いが正確なHigh-quality (Slow)
④出力
基本的にはLong outputをクリックする
➄実行
すべて終わったら"Submit"をクリックし、解析を実行する
⑥解析中
次に出てくるページのメールアドレスの記入欄に自分のメールアドレスを入れると、プログラム終了後にメールが届く。少なくとも、gmailには届く。
⑦終了後、届いたメールに添付してあるアドレスにアクセスすると、html形式で結果がみられる。
それを使い、細胞内のどこに局在し、タンパク質はどのパターンを示すのかを予測する。
この場合は、Endoplasmic riticulam(小胞体)に局在する可溶性タンパク質であることがわかる。
今後について
DTU health techはDeeploc以外にも多くのバイオインフォマティクス解析ツールを公開しているので、それらの使い方を簡易的ですが、qiitaでまとめていこうと思います。