More than 5 years have passed since last update.

石原さとみ検出器を作ろうとしたら、単なる顔検出器ができあがってしまい絶望した話（失敗談）

Last updated at 2019-07-11Posted at 2018-04-08

追記

2019/07/11 (木)：今思うと機械学習のこと何も理解していなかったんだなと思う。戒めとして、この記事は消さずに残しておくことにします。

やろうとしたこと

Deep Learning を使って石原さとみ検出器（ISD: Ishihara Satomi Detector）を作る

環境

OS: Windows 10
GPU: GeForce GTX 950M
Python: 3.5.4
Tensorflow-GPU: 1.5.0

ISD作成の流れ

石原さとみの画像収集
アノテーション
モデル構築
Training
Test（ここで絶望した、、、）

Data収集

SeleniumとChromedriverを使用
Google Image Search でsatomi ishiharaで検索をかける
スクロールと「結果をもっと表示」ボタンのクリックを繰り返す
画像の表示枚数が上限に達した段階でHTML Sourceを保存
BeautifulSoupでimg tagからsrcを抽出
requestsを使用して、srcから画像をダウンロード（参考）

↓プログラムが動いている様子

アノテーション

今回行うのは物体検出なので、画像＆「どこに石原さとみが写っているか」という2種類の情報が必要。このチュートリアルを参考に、matplotlibを利用したアノテーションツールを作成
matplotlibにこんな使い方があるとは知らなかった、、、

アノテートした領域のLeft TopとRight Bottomの座標を含む以下のようなXMLファイルが出力される

example.xml

<annotaion>
  <folder>satomi_ishihara\original</folder>
  <filename>fc5350cadb3c41ee8881503bea0c009a0b41fce78c394bc6aac5011d7ede9f08.jpg</filename>
  <src>https://i.pinimg.com/originals/e3/c4/7d/e3c47d5b15cab638aef7248780c9aebc.jpg</src>
  <segmented>0</segmented>
  <size>
    <width>474</width>
    <height>474</height>
    <depth>3</depth>
  </size>
  <object>
    <name>satomi_ishihara</name>
    <pose>Unspecified</pose>
    <truncated>0</truncated>
    <difficult>0</difficult>
    <bndbox>
      <xmin>117</xmin>
      <ymin>33</ymin>
      <xmax>348</xmax>
      <ymax>291</ymax>
    </bndbox>
  </object>
</annotaion>