LoginSignup
4
3

More than 5 years have passed since last update.

sraファイルをダウンロードする

Last updated at Posted at 2019-01-13

NCBIなどにアップロードされたfastqファイルは、sraという形式に変換され、保管されています。論文などにアクセッションナンバーが書かれていることが多いのですが、それをググってもなかなかダウンロードするリンクを見つけることが難しいので、コマンドでダウンロードしたほうが簡単です。

ダウンロード方法

例えば、SRR1234567 というIDのsraファイルをダウンロードするとします。ダウンロードの仕方は以下の通りです。

wget ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR123/
SRR1234567/SRR1234567.sra

SRR/のあとは、IDの最初の三桁のディレクトリ、その後はすべてのIDの数字のディレクトリ、その中に、sraファイルがあります。

また、複数のファイルをダウンロードする場合は以下の通りです。例えばSRR1234567~SRR1234570 までのファイルをダウンロードするとします。

for i in {67..70}
do
wget ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR123/
SRR12345$i/SRR12345$i.sra
done

Prefetchでもできるかもしれないけど

sra-toolkitのprefetchでsraをダウンロードできるらしいのですが、少なくとも僕はできませんでした。一応そのコマンドも書いておきます。

#sra-toolkitのインストール
conda install sra-tools

#prefetch
prefetch SRR1234567
4
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
3