Training Region-based Object Detectors with Online Hard Example Mining, CVPR2016
物体検出性能はregion based CNNの登場により飛躍的に向上した。
しかしながらこのモデルは未だヒューリスティクスに支えられているためそのチューニングコストは高い。
本論では学習コスト低減のための手法として効率的なonline hard example mining(OHEM)手法を提案する。
ここでの動機は、物体検出にデータは従来ほとんどが簡単なサンプルで、難しいサンプルは少ないという事である。
OHEMではそれら難しいサンプルを自動選択する事で学習効率を向上させる。
従来のヒューリスティクスに頼る必要はなく、またより高効率な学習を実現する事が可能である。
Traffic-Sign Detection and Classification in the Wild, CVPR2016
道路標識検出と分類はそれぞれにおいて高い性能を出してきているが、それらを同時に行う手法は少ない。
本論では、まず様々な条件で獲得された道路標識に関するデータ作成を行った。
またそのデータを用いてCNNによるendtoendな道路標識検出、分類モデルを学習した。
従来手法のような、標識が画像の大部分を占めていなければ上手く働かないモデルとは違い、提案モデルは標識が小さい領域にある場合でも上手く働く。
CNN-RNN: A Unified Framework for Multi-label Image Classification
従来のCNNによる分類タスクは画像を単一のクラスに分類してきた。
しかし本来画像は背景などを含めると複数のラベルが付与可能である。
従来は物体に対してそれぞれ別々に分類を行ってきた。
しかしそれでは画像内物体間の相関関係を考慮に入れる事ができない。
本論ではRNNを用いてこの問題を解決する。
今回提案するCNN-RNNモデルは、画像内の複数ラベルを同時に埋め込みそれらの間の相関、あるいは画像対ラベル間相関を特徴づける事を可能にする。
このモデルはまたendtoendな学習が可能である。