LoginSignup
1

More than 5 years have passed since last update.

配列名を使ってfastaをまとめて別ファイルに出力

Last updated at Posted at 2017-12-07

Rをつかって、multi_fastaファイルから、配列名が同じものを切り出して、1つのファイルにまとめる。
配列の由来がわかるように、個別の名前もつけておく.

2つの生物種の全遺伝子が1ファイルにそれぞれまとまっているときに、
それぞれからオーソログ遺伝子を取り出して、別ファイルにするときなどを想定

select.R

# パッケージのインストール
#source("http://bioconductor.org/biocLite.R")
#biocLite("Biostrings")

# パッケージのロード
library(Biostrings)

# 指定したファイルを読み込む
F1 <- readDNAStringSet("./Fasta1.fa")
F2 <- readDNAStringSet("./Fasta2.fa")

F1_name <- names(F1)
F2_name <- names(F2)
names(F1)<-sub("^","f1_", names(F1))
names(F2)<-sub("^","f2_", names(F2))


# for文で要素ごとに書き出す
for(i in 1:length(F1)){
  for(j in 1:length(F2)){
    if(F1_name[i]== F2_name[j]){
      outFileName  <- paste(F1_name[i],"fa",sep=".")
      writeXStringSet(c(F1[i], F2[j]), file=outFileName)
    }
  }
}

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1