#目的
Kaiyuan Guo, Lingzhi Sui, Jiantao Qiu, Song Yao, Song Han, Yu Wang, Huazhong Yang1.
From Model to FPGA: Software-Hardware Co-Design for Efficient Neural Network Acceleration.
2016 IEEE Hot Chips 28 Symposium (HCS)
ディープラーニングのモデルの処理量を知りたい場合がある。
処理量としては、G-Ops等で示されているのが、扱いやすい。
処理量が記載された文書やサイトは沢山あるが、どれが、語弊のない数値が書かれているか、判断つかないときがある。
少し、情報を集めたいと考えました。
この文献は、ディープラーニングのFPGA実装(xillinx)を検討する場合に役立ちます。
ただし、やや古い情報のため、これをベースに、更に、新しい情報を探されるといいと思います。
まず、この文献は、書籍からも参照されていたので、ある程度、信頼できると考えた。以下の方に役立つと思います。
・ディープラーニングのモデルの処理量(GOPSなど)を知りたい人
#よく見る情報
(適宜、追記します。まずは、この文献の存在の紹介が主な意図です。)
model | Gop | 備考 |
---|---|---|
VGG16 Image classification |
30.68 | 13 Conv layers |
YOLO Tiny General object detection |
5.54 | 9 Conv layers |
Customized Network Face alignment |
0.1046 ※1 | 9 Conv layers |
※1 資料では、104.6 Mop と記載。 |
#まとめ
この文献は、よく見ます。
下記の書籍でも、引用されていました。
「GPUを支える技術 超並列ハードウェアの快進撃[技術基礎]」
#関連(本人)
良書 「GPUを支える技術 超並列ハードウェアの快進撃[技術基礎]」を読む
文献『AN ANALYSIS OF DEEP NEURAL NETWORK MODELS FOR PRACTICAL APPLICATIONS』を読む。
#今後
適宜、情報を足します。
コメントなどあれば、お願いします。