95
112

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

PythonでWeb上のファイルをダウンロードする

Last updated at Posted at 2015-10-02

#Webサーバーにあるファイルをダウンロードする

自動ダウンロードをしたいと思った時に便利なプログラムをpythonで書いてみた。urllibを使うとすごく簡単にできる。

download.py

#!/usr/bin/env python
#-*- coding:utf-8 -*-

import urllib.request
import sys

def download():

	url = sys.argv[1]
	title = sys.argv[2]
	urllib.request.urlretrieve(url,"{0}".format(title))

if __name__ == "__main__":
	download()

実行方法
python download.py [url] [ファイルタイトル]

実行するとdownload.pyのファイルと同上のディレクトリにファイルが作成される。(ファイルタイトルに絶対パスを入れるとそのパス上に作成される。)

sys.argvはsysモジュールをインポートすることで使用できる。sys.argv[0]にはそのプログラムのファイル名が入り、sys.argv[1]からはターミナルでの実行の際に入れた引数が順番に代入される。いくつものファイルを自動でダウンロードしたい場合はurlの規則性を見つけるか、Beautifulsoupのようなモジュールを使ってスクレイピングを行いurlを抽出しfor文でdownload()を複数回走らせればできる。

規則性とは、「https://hogehoge/service/10-1.png」 といった画像のURLがあった場合、3-1.pngの3がカテゴリ、1が連番で並んでいるといったようなことがありえる。複数個サンプルを見てみて規則性を見つけると一括ダウンロードができたりする。(サーバー側に負担がかかるので、スクリプト内にtime.sleep(0.1)を入れる等工夫はした方がよい)

##参考
urllib
sys
Beautifulsoup

95
112
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
95
112

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?