画像認識の実装をしたいなと思いましたので、データを取ってくることに。
今回は男性の写真と女性の写真を取ってきたいと思います。
実行環境
MacOS、Python3.6(anaconda)、VSCode
前回
前回はgoogle_images_downloadを使って画像を集めたのですが、google_images_downloadは100枚までしか集められなかったので、何度も実行しなければならず、面倒だなと感じたので、100枚以上のデータも取得できる方法ないのかなと思い、探したところ、ありました!
Pythonで画像データを手軽に収集したい方必読! icrawler入門
icrawlerを使って今回はデータを取得してきました。
今回使った方法
pip install icrawler
これを実行してまずはicrawlerをインストールします。
そして、自分が使っているテキストエディタで
from icrawler.builtin import BingImageCrawler
crawler = BingImageCrawler(storage={"root_dir": “ファイル名”})
crawler.crawl(keyword=“収集したいものの名前”, max_num=画像数)
これを実行して、画像を収集したら100枚以上の画像でも収集可能でした。
まとめ
icrawlerの方が多く集められるし、そこまで大変でもないので、icrawlerの方のメリットが今のところ大きいですね。
また、これから使っていく中で、google_images_downloadの方のメリットもわかってくるのかもしれませんので、また勉強したいと思います。