# wgetとは
「wget」コマンドは“ノンインタラクティブなダウンローダー”です。「wget URL」で指定したURLのファイルをダウンロードします。
# wgetの書式
- wget [オプション] URL
- wget -r [オプション] URL (指定したURLからのリンクも含めて保存する(再帰ダウンロード))
# Macにwgetインストール
Homebrewを使ってwgetコマンドをインストールしてみていきます。ターミナルを開けてwgetをインストールします。
wgetコマンドがインストールされます。次のコマンドを実行してみましょう。
上記のコマンドが実行されたら、次のような内容が表示されます。
GNU Wget 1.20.1, 非対話的ネットワーク転送ソフト
使い方: wget [オプション]... [URL]...
wgetの主なオプション
オプション |
意味 |
-b --background
|
バックグラウンドで実行する。経過のメッセージは「-o」オプションで指定したログファイルへ、指定がない場合は「wget-log」に出力する |
-o ファイル名 --output-file=ファイル名 |
経過のメッセージを全て指定したファイルに出力する |
-a ファイル名 --append-output=ファイル名 |
「-o」オプションのように経過のメッセージを指定ファイルに出力するが、指定したファイルが既にある場合は上書きではなく追加する。ファイルがない場合は新規作成される |
-d --debug |
動作内容を詳しく出力する |
-q --quiet |
経過のメッセージを出力しない |
-v --verbose |
経過のメッセージを出力する(デフォルト) |
-i ファイル名 --input-file=ファイル名 |
指定したファイルからダウンロードするURLを読み込む |
-t 回数 --tries=回数 |
リトライ回数を指定する(デフォルトは20回) |
-T 秒数 --timeout=秒数 |
タイムアウトするまでの秒数を指定する(デフォルトは900秒) |
-w 秒数 --wait=秒数 |
リトライの待ち時間を指定する |
-nc --no-clobber |
ファイルを上書きしない |
-c --continue |
途中までダウンロードされていたら続きをダウンロードする |
-N --timestamping |
ファイルのタイムスタンプをサーバ上のタイムスタンプに変更する |
--no-use-server-timestamps |
ファイルのタイムスタンプを変更しない(「wget」で保存した時刻とする) |
--spider |
ファイルをダウンロードせず、URLの存在だけチェックする(“Web spider”として動作する)。例えば、ブックマークをチェックするなら「wget --spider --force-html -i bookmarks.html」のように指定する |
--user=ユーザー名 |
ダウンロードする際の「ユーザー名」を指定する |
--password=パスワード |
ダウンロードする際の「パスワード」を指定する |
--ask-password |
接続毎にパスワードを入力する(プロンプトが表示される) |
-p --page-requisites |
ローカル環境で表示するための必要なファイルも含めてダウンロードする |
-r --recursive |
再帰ダウンロードを行う(URLで指定したファイルからのリンクもダウンロードする。デフォルトは5階層まで:実行例3を参照) |
-l 数 --level=数 |
指定した回数分リンクをたどる(「-r」オプションは「-l 5」相当) |
-k --convert-links |
ダウンロード後に、ダウンロードファイル内のURLをローカル閲覧用に変換する |
-K --backup-converted |
ファイルを変換した際のバックアップを「.orig」という拡張子を付けて保存する |
-nd --no-directories |
再帰ダウンロード時にディレクトリを作成しない |
-nH --no-host-directories |
再帰ダウンロード時にホスト名のディレクトリを作成しない |
--max-redirect=回数 |
URLリダイレクトの回数を指定する(デフォルトは20回) |
-R 拡張子 --reject 拡張子 |
指定した拡張子のファイルはダウンロードしない(複数ある場合は「-R jpg,png」のように「,」で区切って指定する) |
-A 拡張子 --accept 拡張子 |
指定した拡張子のみ取得する(複数ある場合は「-A jpg,png」のように「,」で区切って指定する) |
-D リスト --domains=リスト |
ダウンロードするドメインのリスト(デフォルトでは別サイトへのリンクはダウンロードしないが、「-D」で指定したドメインはダウンロードの対象とする。複数ある場合は「,」で区切って指定する) |
--exclude-domains リスト |
ダウンロードしないドメインのリスト |
-np --no-parent |
親ディレクトリは対象としない |