Rをつかって、multi_fastaファイルから、配列名が同じものを切り出して、1つのファイルにまとめる。
配列の由来がわかるように、個別の名前もつけておく.
2つの生物種の全遺伝子が1ファイルにそれぞれまとまっているときに、
それぞれからオーソログ遺伝子を取り出して、別ファイルにするときなどを想定
select.R
# パッケージのインストール
#source("http://bioconductor.org/biocLite.R")
#biocLite("Biostrings")
# パッケージのロード
library(Biostrings)
# 指定したファイルを読み込む
F1 <- readDNAStringSet("./Fasta1.fa")
F2 <- readDNAStringSet("./Fasta2.fa")
F1_name <- names(F1)
F2_name <- names(F2)
names(F1)<-sub("^","f1_", names(F1))
names(F2)<-sub("^","f2_", names(F2))
# for文で要素ごとに書き出す
for(i in 1:length(F1)){
for(j in 1:length(F2)){
if(F1_name[i]== F2_name[j]){
outFileName <- paste(F1_name[i],"fa",sep=".")
writeXStringSet(c(F1[i], F2[j]), file=outFileName)
}
}
}