概要
機械学習において、学習用の画像を簡単に集めるために
Google画像検索機能を使用し検索対象の画像をまとめて簡単に収集できるツールを見つけました
インストールも簡単にでき、今後また使うことがありそうなため、メモを残しておきます
・環境情報
Windwos10 Pro
Anaconda 1.9
Python 3.X
インストール・実行手順
1.ツールをインストール
以下のpipコマンドでインストール
pip install google_images_download
2.一括画像取得を実行
例:山の手線の電車の画像を収集する場合
googleimagesdownload -k "山手線" -la Japanese -l 20 -f "jpg" -s medium
オプション
k : 検索キーワード
la : 検索言語
f : 画像ファイル形式
l : 取得画像枚数 ※1
s :画像ファイルサイズ
※1 指定枚数よりも検出枚数が少ない場合はエラーになる
実行すると以下のようにファイルのダウンロード状況が表示される
Item no.: 1 --> Item name = 山手線
Evaluating...
Starting Download...
Completed Image ====> 1. 0133-743x418.jpg
Completed Image ====> 2. large_171218_yamanote_01.jpg
Completed Image ====> 3. nc42901?size=l.jpg
Completed Image ====> 4. large_161021_yamanotesen_01.jpg
Completed Image ====> 5. pixta_4590983_s.jpg
実行結果
画像ファイルがダウンロードされると、実行パスの配下に「downloads」フォルダが
さらにその配下に検索キーワードの名称のフォルダが作成され、ダウンロードされた画像ファイルが置かれる。
上記でダウンロードした「山手線」画像の一覧です、山手線の路線図等、関係ない画像もダウンロードされてしまうため、最後は手動で取り除く必要ありです
以上