7

More than 5 years have passed since last update.

@nyamu-rd(akira kinoshita)

Deep Leaningの高速推論(CPU)に関する情報まとめ

Posted at 2018-08-13

個人的防備録として。検証のための動作確認は未実施。実施後追記予定。
主にchainerとtensorflowを使っているので、これらのフレームワークで使えるものを調査した
コンパイルを行わない方法に関しては、主にMKL-DNNライブラリを用いて高速化を行っているようだ
コンパイルを行う方法に関しては、TensorFlow XLA, Nervana Graph Compiler, TVM/LLVMなどがあるようだ

Intel nGraph

ONNX形式をサポートしているため、chainerのモデルをインポートできると思われる(未確認)。
IntelはNervana Graph CompilerおよびMKL DNNライブラリによる高速化を実施している
両者の違いはこのページが分かりやすい
- Nervana Graph Compilerでハードウェアに依存しない最適化を実施する
- 後述のTensorFlow XLAと類似の機能と思われる(Intel Nervana Graph とは？)
- MKL DNNでIntel CPUに特化した最適化を行う
MKL-DNN単体のみでの利用も可能(後述のフレームワークはMKL-DNNライブラリ利用したものが多い)で、Nervana Graph Compilerの単体利用も可能
MKL DNNの概要は以下
- Introducing DNN primitives in Intel® Math Kernel Library
- 日本語訳が以下にある
  - インテル® MKL の DNN プリミティブ

TensorFlow

TensorFlow with Intel® MKL DNN
- MKL DNNを利用したTensorFlow
  - TensorflowでIntel MKL-DNNとIntel MKL
  - TensorFlow Optimizations on Modern Intel® Architecture
TensorFlow XLA
- TensorFlow コンパイラ「XLA」を提供
  - IntelのNervana Graph Compilerと似た位置づけ(こちらのほうが先?)
- 解説記事を書いてくださっている方が結構いる
Google TPUに合わせた最適化もできそう

Chainer v4.0.0以降

Intel Deep Learning Package (iDeep）に対応し、Intel CPUでの学習および推論の高速化を実現
- gitのreadmeを見る限り、iDeepもまたMKL DNNのようだ
参考にさせていただいた記事
- iDeep を使ってCPUでのChainerの推論速度をアップしよう

NNVM/TVM

Nervana Graph CompilerやTensorFlow XLAと思想は同じ
解説記事を書いてくださっている方が何人かいる
バックエンドとしてFPGAもサポートしているようだ

7

Register as a new user and use Qiita more conveniently

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

7