1
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【Python】icrawlerを用いた画像収集(たった3行!)

Posted at

はじめに

Pythonで簡単に画像収集ができるので、趣味での収集だけでなく、機械学習でのデータセットでも活用できると思ったので記載します。

icrawlerパッケージのインストール

pip install icrawler

コード

例として、Googleから犬の画像を10枚取得します。
keywordに検索したい用語を記載(日本語でも英語でも可)
max_numにダウンロード枚数を記載

from icrawler.builtin import GoogleImageCrawler
crawler = GoogleImageCrawler(storage = {"root_dir":"dogs"}) # ダウンロード先のディレクトリ名
crawler.crawl(keyword="犬",max_num = 10) 

実行すると下記の通り、動き出しますので少し待ちます。

2022-05-28 20:32:53,646 - INFO - icrawler.crawler - start crawling...
2022-05-28 20:32:53,654 - INFO - icrawler.crawler - starting 1 feeder threads...
2022-05-28 20:32:53,659 - INFO - feeder - thread feeder-001 exit
2022-05-28 20:32:53,665 - INFO - icrawler.crawler - starting 1 parser threads...
2022-05-28 20:32:53,670 - INFO - icrawler.crawler - starting 1 downloader threads...
2022-05-28 20:32:54,428 - INFO - parser - parsing result page https://www.google.com/search?q=%E7%8A%AC&ijn=0&start=0&tbs=&tbm=isch
2022-05-28 20:32:54,767 - INFO - downloader - image #1	https://guide.line.me/ja/dogday_01.jpg
・
・
・

そして、フォルダを確認するとちゃんと10枚ダウンロードされてます。

image.png
image.png

他の画像も収集

最近欲しくてたまらないジムニーの画像を収集してみようと思います。

from icrawler.builtin import GoogleImageCrawler
crawler = GoogleImageCrawler(storage = {"root_dir":"jb64"})
crawler.crawl(keyword="jb64カスタム",max_num = 10) 

無事、10枚ダウンロードすることができました。
image.png

いろんな方のカスタムを見るのは楽しいので、趣味として利用するのもありですね!

1
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?