#目的
表題の文献
Machine learning for embedded deep dive
Presented By
Andy Luo Sr. Product Marketing Manager
2018-10-0
は、
XILINX DEVELOPER FORUMのサイト
( https://www.xilinx.com/products/design-tools/developer-forum/silicon-valley/access-content.html )
から、アクセス(ダウンロード)できる。
別の記事にも同じようなことを書いたが、
ディープラーニングのモデルの処理量を知りたい場合がある。
処理量としては、G-Ops等で示されているのが、扱いやすい。
処理量が記載された文書やサイトは沢山あるが、どれが、語弊のない数値が書かれているか、判断つかないときがある。
少し、情報を集めたいと考えました。
まず、この文献は、沢山の情報があり、以下の方に役立つと思う。
・ディープラーニングのモデルの処理量(GOPSなど)を知りたい人
#物体検出の処理量
下記の図より、物体検出の処理量が、まず、わかる。
(縦軸の条件が書かれていません、探しても、、、zu9とかでしょうか?)

グラフの数字を表にすると、以下のとおり。
model | Gop | 備考 |
---|---|---|
Inception v1 | 3.2 | |
Tiny Yolov3 | 5.6 | |
Tiny Yolov2 | 7 | |
ResNet50 | 7.7 | |
VGG16 | 30 | |
Yolov2 | 36 | |
Yolov3 | 65 | |
SSD | 117 |
prunedした場合の数値も示されている。

#DPU Scalability
この情報も知りたかった。
(出典: )

#まとめ
この文献は、情報がよく集約されていると思う。
#関連(本人)
良書 「GPUを支える技術 超並列ハードウェアの快進撃[技術基礎]」を読む
文献『From Model to FPGA: Software-Hardware Co-Design for Efficient Neural Network Acceleration』を読む
文献『AN ANALYSIS OF DEEP NEURAL NETWORK MODELS FOR PRACTICAL APPLICATIONS』を読む。
#今後
適宜、情報を足します。
コメントなどあれば、お願いします。