はじめに
Pythonで簡単に画像収集ができるので、趣味での収集だけでなく、機械学習でのデータセットでも活用できると思ったので記載します。
icrawlerパッケージのインストール
pip install icrawler
コード
例として、Googleから犬の画像を10枚取得します。
keywordに検索したい用語を記載(日本語でも英語でも可)
max_numにダウンロード枚数を記載
from icrawler.builtin import GoogleImageCrawler
crawler = GoogleImageCrawler(storage = {"root_dir":"dogs"}) # ダウンロード先のディレクトリ名
crawler.crawl(keyword="犬",max_num = 10)
実行すると下記の通り、動き出しますので少し待ちます。
2022-05-28 20:32:53,646 - INFO - icrawler.crawler - start crawling...
2022-05-28 20:32:53,654 - INFO - icrawler.crawler - starting 1 feeder threads...
2022-05-28 20:32:53,659 - INFO - feeder - thread feeder-001 exit
2022-05-28 20:32:53,665 - INFO - icrawler.crawler - starting 1 parser threads...
2022-05-28 20:32:53,670 - INFO - icrawler.crawler - starting 1 downloader threads...
2022-05-28 20:32:54,428 - INFO - parser - parsing result page https://www.google.com/search?q=%E7%8A%AC&ijn=0&start=0&tbs=&tbm=isch
2022-05-28 20:32:54,767 - INFO - downloader - image #1 https://guide.line.me/ja/dogday_01.jpg
・
・
・
そして、フォルダを確認するとちゃんと10枚ダウンロードされてます。
他の画像も収集
最近欲しくてたまらないジムニーの画像を収集してみようと思います。
from icrawler.builtin import GoogleImageCrawler
crawler = GoogleImageCrawler(storage = {"root_dir":"jb64"})
crawler.crawl(keyword="jb64カスタム",max_num = 10)
いろんな方のカスタムを見るのは楽しいので、趣味として利用するのもありですね!