0
0

More than 5 years have passed since last update.

文献『Machine learning for embedded deep dive』を読む

Posted at

目的

表題の文献

Machine learning for embedded deep dive
 Presented By
 Andy Luo Sr. Product Marketing Manager
 2018-10-0

は、
XILINX DEVELOPER FORUMのサイト
https://www.xilinx.com/products/design-tools/developer-forum/silicon-valley/access-content.html )
から、アクセス(ダウンロード)できる。

別の記事にも同じようなことを書いたが、
ディープラーニングのモデルの処理量を知りたい場合がある。
処理量としては、G-Ops等で示されているのが、扱いやすい。
処理量が記載された文書やサイトは沢山あるが、どれが、語弊のない数値が書かれているか、判断つかないときがある。
少し、情報を集めたいと考えました。

 :pencil:まず、この文献は、沢山の情報があり、以下の方に役立つと思う。

   ・ディープラーニングのモデルの処理量(GOPSなど)を知りたい人

物体検出の処理量

下記の図より、物体検出の処理量が、まず、わかる。
(縦軸の条件が書かれていません、探しても、、、zu9とかでしょうか?)

(出典: https://www.xilinx.com/content/dam/xilinx/imgs/developer-forum/2018-silicon-valley/Edge-Machine-Learning-for-Embedded-Deep-Dive.pdf )

gop_xilinx.png

グラフの数字を表にすると、以下のとおり。

model Gop 備考
Inception v1 3.2
Tiny Yolov3 5.6
Tiny Yolov2 7
ResNet50 7.7
VGG16 30
Yolov2 36
Yolov3 65
SSD 117

prunedした場合の数値も示されている。

(出典: https://www.xilinx.com/content/dam/xilinx/imgs/developer-forum/2018-silicon-valley/Edge-Machine-Learning-for-Embedded-Deep-Dive.pdf )

performance2.png

DPU Scalability

この情報も知りたかった。

(出典: )

dpu.png

まとめ

この文献は、情報がよく集約されていると思う。

関連(本人)

DNNのモデル毎の処理量(GOP)をまとめる

良書 「GPUを支える技術 超並列ハードウェアの快進撃[技術基礎]」を読む

文献『From Model to FPGA: Software-Hardware Co-Design for Efficient Neural Network Acceleration』を読む

文献『AN ANALYSIS OF DEEP NEURAL NETWORK MODELS FOR PRACTICAL APPLICATIONS』を読む。

今後

適宜、情報を足します。
コメントなどあれば、お願いします。:candy:

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0