LoginSignup
6
3

More than 3 years have passed since last update.

Webページに載っている特定のデータをwgetで一括ダウンロードする

Posted at

一つ一つクリックしたらダウンロードできるけど、wgetで一括ダウンロードしたいと友人に聞かれたときのことをメモ。

BIの分子データを載せているサイトらしい、以下のサイトからダウンロードする。
https://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-8581/files/

手順

以下のコマンドでダウンロードできた。

$ wget -r -l 1 -A txt,gz -w 1 -nd https://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-8581/files/

解説

-r -l 1

-rでリンク先にリンクがあればダウンロード、そこにまたリンクがあればダウンロード、、、と再帰的にダウンロード。
-lでリンクをたどる回数を指定。1を指定することで、そのWebページに貼ってあるリンクのみを複数ダウンロードする。

-A txt,gz

-Aでダウンロードする拡張子を指定する。ここではtxtgzを指定。

-w 1

ダウンロード処理の間隔を一秒開ける。ダウンロード先の負担を軽減するために一応指定

-nd

同一のディレクトリへのダウンロードを指定。
これがないとWebページの/home/index/hoge/のようにURLの階層通りにダウンロードが行われる。

参考

6
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
3