Deep Learningの実装で一番使われていると思われる物体検出(Object Detection)に関して、技術的にはほぼ3種類に固まってきたと思われるため、ここでひとまずまとめてみました。
- Faster R-CNN:精度が高いが(速いほうだけど)遅い
- YOLO:速いが精度がいまいち
- SSD:速くて精度がまぁまぁ
なお個人的な好みにより、コードはTensorFlowかKerasが中心となっています。
※TensorFlowの公式Githubは除いています
※自分用のメモとして作成したのですが、もしかしたら同じような情報を求めている人の役に立てばと
※「動かしてみました」的な資料は除いています(技術的な内容の資料が中心です)
Faster R-CNN
論文
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
https://arxiv.org/abs/1506.01497
コード
- TensorFlow:https://github.com/smallcorgi/Faster-RCNN_TF
- TensorFlow:https://github.com/endernewton/tf-faster-rcnn
- Keras:https://github.com/jinfagang/keras_frcnn
解説資料
私がわかりにくいと思った「Faster RCNN」のポイントの解説
http://nonbiri-tereka.hatenablog.com/entry/2018/03/07/075835
YOLO(You Only Look Once)
YOLO
論文
You Only Look Once: Unified, Real-Time Object Detection
https://arxiv.org/abs/1506.02640
※和訳(要約):https://dev.classmethod.jp/machine-learning/research_paper_yolo/
コード
- TensorFlow:https://github.com/hizhangp/yolo_tensorflow
- keras:https://github.com/sunshineatnoon/Darknet.keras
YOLO v2(YOLO9000)
論文
YOLO9000: Better, Faster, Stronger
https://arxiv.org/abs/1612.08242
※和訳:https://qiita.com/miyamotok0105/items/1aa653512dd4657401db
コード
- Tensorflow:https://github.com/thtrieu/darkflow
- keras:https://github.com/allanzelener/YAD2K
解説資料
[DL輪読会]YOLO9000: Better, Faster, Stronger
https://www.slideshare.net/DeepLearningJP2016/dl-reading-paper20170804pdf
YOLO v3
論文
YOLOv3: An Incremental Improvement
https://arxiv.org/abs/1804.02767
コード
- TensorFlow:https://github.com/mystic123/tensorflow-yolo-v3
- keras:https://github.com/qqwweee/keras-yolo3
SSD(Single Shot MultiBox Detector)
SSD
論文
SSD: Single Shot MultiBox Detector
https://arxiv.org/abs/1512.02325
※和訳:https://qiita.com/de0ta/items/1ae60878c0e177fc7a3a
コード
- TensoeFlow:https://github.com/seann999/ssd_tensorflow
- TensoeFlow:https://github.com/balancap/SSD-Tensorflow
- keras:https://github.com/rykov8/ssd_keras
解説資料
Deepに理解する深層学習による物体検出 by Keras
https://qiita.com/GushiSnow/items/8c946208de0d6a4e31e7
SSD: Single Shot MultiBox Detector (ECCV2016)
https://www.slideshare.net/takanoriogata1121/ssd-single-shot-multibox-detector-eccv2016
リアルタイム物体検出向けニューラルネット、SSD(Single Shot Multi Detector)及びその派生モデルの解説
http://segafreder.hatenablog.com/entry/2018/03/11/152515
DSSD(Deconvolutional Single Shot Detector)
論文
コード
- caffe: https://github.com/zchrissirhcz/caffe-dssd
- mxnet: https://github.com/MTCloudVision/mxnet-dssd
ESSD(Extend the shallow part of Single Shot MultiBox Detector)
論文
Extend the shallow part of Single Shot MultiBox Detector via Convolutional Neural Network
https://arxiv.org/abs/1801.05918
コード
※見当たらない
RefineDet(Single-Shot Refinement Neural Network for Object Detection)
論文
Single-Shot Refinement Neural Network for Object Detection
https://arxiv.org/abs/1711.06897
コード
- caffe: https://github.com/sfzhang15/RefineDet
- chainer: https://github.com/fukatani/RefineDet_chainer
その他
全体的な説明
R-CNNの原理とここ数年の流れ
https://www.slideshare.net/KazukiMotohashi2/rcnn
Deep Learningによる一般物体検出アルゴリズムの紹介
https://tech-blog.abeja.asia/entry/object-detection-summary
物体検出一覧
object-detection
https://github.com/amusi/awesome-object-detection/blob/master/README.md
備考
今後もいいものが見つかれば編集していきます。