window baseのobject detectionに関してwindowをスライドするのか〜ぐらいにしか理解していなかったので、まとめてみた。

処理手順

様々なサイズや縦横比(aspect ratio)のwindowを定義する
1で定義したwindowをそれぞれ画像の左端から右端まで少しずつスライドさせていく

3. windowでくり抜いた画像をfixしたサイズにresizeする

4. 画像分類器を用いて物体が何であるかを推定すれば、車や人などwindow内の物体が何であるか判別出来る。
画像分類器に関しては良ければ参考に
https://qiita.com/minh33/items/a8b77d7fb809385632ea

=> CARってClassifyされば正解！

プログラムで書くとわかりやすい

参考文献

What do we learn from region based object detectors (Faster R-CNN, R-FCN, FPN)?
https://medium.com/@jonathan_hui/what-do-we-learn-from-region-based-object-detectors-faster-r-cnn-r-fcn-fpn-7e354377a7c9
Window Based Object Detection
https://www.youtube.com/watch?v=jgACj-1zbQw
C4W3L03 Object Detection
https://www.youtube.com/watch?v=5e5pjeojznk

【物体検出】Window Base物体検出

処理手順

参考文献