目的
DNNのモデル毎の処理量(GOP = Giga Operations)をまとめる。
1画面(フレーム)あたりの処理量の意味。
正確な情報が必要な場合は、**「情報5」**とかを見られるのがいいと思う。
(「情報1」~「情報4」に比して)
GOP(Giga Operations)
GOPS(Giga Operations per Second)
DNNのモデル毎の処理量
情報1
文献『AN ANALYSIS OF DEEP NEURAL NETWORK MODELS FOR PRACTICAL APPLICATIONS』を読む。
model | Gop | 備考 |
---|---|---|
MobileNet-v1 | 1.4 | ※目分量の精度悪し |
MobileNet-v2 | 0.7 | ※目分量の精度悪し |
AlexNet | 2.2 | ※目分量の精度悪し |
GoogleNet | 2.5 | ※目分量の精度悪し |
ResNet-50 | 8.0 | ※目分量の精度悪し |
VGG19 | 39 | ※目分量の精度悪し |
VGG16 | 31 | ※目分量の精度悪し |
情報2
資料『JETSON AGX XAVIER AND THE NEW ERA OF AUTONOMOUS MACHINE』を読む
model | Gop | 備考 |
---|---|---|
Image Recognition | ||
MobileNet | 0.6 | 224x224, 17GOPS@30Hz |
AlexNet | 0.7 | 227x227, 22GOPS@30Hz |
GoogleNet | 2 | 224x224, 60GOPS@30Hz |
ResNet-50 | 4 | 224x224, 120GOPS@30Hz |
VGG19 | 20 | 224x224, 600GOPS@30Hz |
Object Detection | ||
YOLO-v3 | 65 | 416x416, 1,950GOPS@30Hz |
SSD-VGG | 91 | 512x512, 2,730GOPS@30Hz |
Faster-RCNN | 172 | 600x850, 5,160GOPS@30Hz |
情報3
文献『From Model to FPGA: Software-Hardware Co-Design for Efficient Neural Network Acceleration』を読む。
model | Gop | 備考 |
---|---|---|
VGG16 Image classification |
30.68 | 13 Conv layers |
YOLO Tiny General object detection |
5.54 | 9 Conv layers |
Customized Network Face alignment |
0.1046 ※1 | 9 Conv layers |
※1 資料では、104.6 Mop と記載。 |
情報4
文献『Machine learning for embedded deep dive』を読む
model | Gop | 備考 |
---|---|---|
Inception v1 | 3.2 | |
Tiny Yolov3 | 5.6 | |
Tiny Yolov2 | 7 | |
ResNet50 | 7.7 | |
VGG16 | 30 | |
Yolov2 | 36 | |
Yolov3 | 65 | |
SSD | 117 |
情報5
以下などに沢山情報があります。
まとめ
特に、なし。
今後
まだ、単に、情報を集めているレベルです。
コメントなどあれば、お願いします。
関連(本人)
文献『AN ANALYSIS OF DEEP NEURAL NETWORK MODELS FOR PRACTICAL APPLICATIONS』を読む。
資料『JETSON AGX XAVIER AND THE NEW ERA OF AUTONOMOUS MACHINE』を読む
文献『From Model to FPGA: Software-Hardware Co-Design for Efficient Neural Network Acceleration』を読む。