cnn-benchmarksでGPUやCNNによる実行時間の比較していたので、メモしておきます。
GPUの比較ではGPU,CPUの比較をしています。
- GeForce GTX 1080
- GeForce GTX TITAN X
- dual Intel Xeon E5-2630 v3
また、CNNでは以下のネットワークの比較をしています。
- AlexNet
- VGG-16
- VGG-19
- ResNet-18
- ResNet-34
- ResNet-50
- ResNet-101
- ResNet-152
- ResNet-200
比較結果で参考になったところ
- TITAN X より GTX1080のほうが1.1~1.15倍程度速い。
- ResNet-50がVGG-16より1.5倍速い。
- ResNet-200はメモリが8GBのGTX1080では動かない(それ以外はGTX1080でも動く)
- ただし上記比較の際のバッチサイズは16のため、バッチサイズを64などにすると
ResNet-50も動かなくなる可能性がある。
まとめ
GTX1080を買おうと思った時にメモリ8GBで、どの程度の規模のニューラルネットが実行できるか見当がつかなかったので、この比較はとても参考になりました。入力のデータサイズが、16×3×224×224の場合でもResNet-152まではGTX1080で動くだろうということがわかったので、GTX1080はこれから買うには良い選択肢になるかと思います。
ただし、上記比較はCUDA8.0での比較なので、各ライブラリがCUDA8.0に正式に対応するまでは、以下の記事のようにインストールする段階で苦労する可能性があります。
Qiita - GTX1080に換装すると一部のtensorflowのコードが動かなくなっていた件
CUDA7.5ではGeForce GTX1080 と TITAN XのDeepLearning学習時間ベンチマーク比較を見るとTITAN Xの方が速いという結果になるようです。