LoginSignup
0
0

More than 1 year has passed since last update.

FASTA形式配列の大文字と小文字を一括変換しよう

Last updated at Posted at 2022-08-10

塩基配列の大文字と小文字をさっさと変換したくない??

プログラムを使っていくうちに、FASTA内の文字が勝手に小文字になったりしちゃいますよね(小文字になることに意味がある場合もありますがね)。
プログラムのオプションで指定もできますが、変換方法を知っておけば時短になります。
そんなわけで、以下のbefore.txtを加工しましょう

before.txt
>Genome1
aaaaccCCGCTTT
>Genome2
ggttacaAACTCC

seqkitで一発じゃね?

その通りです。FASTA形式のテキスト処理にはseqkitが使えます。
こちらはcondaに入っていますのでダウンロードはconda installで...って知ってる人はもうわかりますよね。
この†超万能最強遺伝子文書編集コマンド†にかかれば、ワンラインで一発ですね。

#小文字to大文字
seqkit seq -u before.txt > after.txt
#大文字to小文字
seqkit seq -l before.txt > after.txt

インストールを省きましたが、seqkitはM1 Macの場合、少しインストールにコツが必要です。それは別記事で紹介してますのでご参照くださいね。

seqkitすごい

紹介したseqkitはこのようなテキスト処理だけでなく、FASTAの配列数などをぱぱっと計算してくれます。
しかも、高速です。最高ですね。
どんどん使いこなしていきましょう!!

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0