#目的
資料『JETSON AGX XAVIER AND THE NEW ERA OF AUTONOMOUS MACHINE』を読む。
資料は、以下です。
http://info.nvidia.com/rs/156-OFN-742/images/Jetson_AGX_Xavier_New_Era_Autonomous_Machines.pdf
この記事記載の最初の目的は、上記の資料には、DNNのモデル毎の処理量(GOPS)が記載されているので、その量を参照することです。
GOP(Giga Operations)
GOPS(Giga Operations per Second)
#DNNのモデル毎の処理量(GOP)
引用ページ:VISION NETWORKS Compute Demand
model | Gop | 備考 |
---|---|---|
Image Recognition | ||
MobileNet | 0.6 | 224x224, 17GOPS@30Hz |
AlexNet | 0.7 | 227x227, 22GOPS@30Hz |
GoogleNet | 2 | 224x224, 60GOPS@30Hz |
ResNet-50 | 4 | 224x224, 120GOPS@30Hz |
VGG19 | 20 | 224x224, 600GOPS@30Hz |
Object Detection | ||
YOLO-v3 | 65 | 416x416, 1,950GOPS@30Hz |
SSD-VGG | 91 | 512x512, 2,730GOPS@30Hz |
Faster-RCNN | 172 | 600x850, 5,160GOPS@30Hz |
performance
(図 出典: http://info.nvidia.com/rs/156-OFN-742/images/Jetson_AGX_Xavier_New_Era_Autonomous_Machines.pdf )
(図 出典: http://info.nvidia.com/rs/156-OFN-742/images/Jetson_AGX_Xavier_New_Era_Autonomous_Machines.pdf )
(図 出典: http://info.nvidia.com/rs/156-OFN-
742/images/Jetson_AGX_Xavier_New_Era_Autonomous_Machines.pdf )
(図 出典: http://info.nvidia.com/rs/156-OFN-742/images/Jetson_AGX_Xavier_New_Era_Autonomous_Machines.pdf )
#性能限界値との比較
TX2 ResNet-50
グラフより、目分量で、32batchの場合、110images と読んだ。
1 image で 4 G-op なので、1秒 440 G-op となる。
TX2の場合、半精度ならば、1.333 TOPSなので、性能限界の1/3出ていることになる。
単精度ならば、もっと、出ていることになる。どっちなんだろう
#まとめ
DNNのモデル毎の処理量(GOPS)を整理する一環として、NVIDIAの資料を確認した。
#今後
適宜、追記する。
コメントなどあれば、お願いします。
#関連(本人)
DNNのモデル毎の処理量(GOP)をまとめる