window baseのobject detectionに関してwindowをスライドするのか〜ぐらいにしか理解していなかったので、まとめてみた。
処理手順
様々なサイズや縦横比(aspect ratio)のwindowを定義する
1で定義したwindowをそれぞれ画像の左端から右端まで少しずつスライドさせていく
3. windowでくり抜いた画像をfixしたサイズにresizeする
4. 画像分類器を用いて物体が何であるかを推定すれば、車や人などwindow内の物体が何であるか判別出来る。
画像分類器に関しては良ければ参考に
https://qiita.com/minh33/items/a8b77d7fb809385632ea
プログラムで書くとわかりやすい
参考文献
What do we learn from region based object detectors (Faster R-CNN, R-FCN, FPN)?
https://medium.com/@jonathan_hui/what-do-we-learn-from-region-based-object-detectors-faster-r-cnn-r-fcn-fpn-7e354377a7c9
Window Based Object Detection
https://www.youtube.com/watch?v=jgACj-1zbQw
C4W3L03 Object Detection
https://www.youtube.com/watch?v=5e5pjeojznk