塩基配列の大文字と小文字をさっさと変換したくない??
プログラムを使っていくうちに、FASTA内の文字が勝手に小文字になったりしちゃいますよね(小文字になることに意味がある場合もありますがね)。
プログラムのオプションで指定もできますが、変換方法を知っておけば時短になります。
そんなわけで、以下のbefore.txtを加工しましょう
before.txt
>Genome1
aaaaccCCGCTTT
>Genome2
ggttacaAACTCC
seqkitで一発じゃね?
その通りです。FASTA形式のテキスト処理にはseqkit
が使えます。
こちらはconda
に入っていますのでダウンロードはconda install
で...って知ってる人はもうわかりますよね。
この†超万能最強遺伝子文書編集コマンド†にかかれば、ワンラインで一発ですね。
#小文字to大文字
seqkit seq -u before.txt > after.txt
#大文字to小文字
seqkit seq -l before.txt > after.txt
インストールを省きましたが、seqkit
はM1 Macの場合、少しインストールにコツが必要です。それは別記事で紹介してますのでご参照くださいね。
seqkitすごい
紹介したseqkitはこのようなテキスト処理だけでなく、FASTAの配列数などをぱぱっと計算してくれます。
しかも、高速です。最高ですね。
どんどん使いこなしていきましょう!!