6
6

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

RTX2080の学習速度をざっくり検証(追加)

Last updated at Posted at 2018-09-23

と言うわけで、RTX2080を買ってみました

計算速度を比較するためにVGG16のファインチューニングを
下記の設定でやってみました。
GTX1080Tiは違うパソコンでやったため参考でお願いします

GTX1080TiとRTX2080との速度比較ですが
RTX2080のほうが11%ほど早い結果となりました。

GTX1080Tiの端末に新しく仮想環境を作成しRTX2080と各種ライブラリを
同じバージョンにしたところGTX1080Tiのほうが3%ほど早くなりました(泣

機械学習をするだけであればメモリが3GB多く、値段が4万円安い
GTX1080Tiのほうが良さそうですね・・・

※△1 CUDAを9.0->9.2の計算結果も掲載
※△2 GTX1080Tiの結果を追加
※△3 GTX1080Tiのライブラリのバージョン等を同じに
※△4 GTX1070のノートとGV100追加

#計算内容
 ・トータルパラメーター:18,918,213
 ・training:2548枚
 ・validation:150枚
 ・バッチサイズ:32
 ・エポック:50

#計測環境
CPU:i7-8086K
メモリ:16GB
OS:Windows10Home
cuda:9.0.176
CuDNN:v7.3
python:3.6.6
tensorflow:1.10.0
keras:2.2.2

#計測結果(CUDA9.0+CuDNNv7.3)

timeはスタートから50エポック完までです。

GPU CUDA Cores Tensor Core Memory Bandwidth time(sec)
GTX1070 1920 N.A 256.3 GB/s 1547
GTX1080Ti 3584 N.A 547.2 GB/s 実施無
RTX2080 2944 368 448 GB/s 1065

#計測結果(CUDA9.2+CuDNNv7.3)

timeはスタートから50エポック完までです。
GTX1080Tiは**マシーンが違う(CPU:Xeon)**ので、参考記録としてください

GPU CUDA Cores Tensor Core Memory Bandwidth time(sec)
GTX1070 1920 N.A 256.3 GB/s 1530
GTX1070_note 1920 N.A ? 2000
GTX1080Ti 3584 N.A 547.2 GB/s 1015
RTX2080 2944 368 448 GB/s 1048
GV100 5120 640 870GB/s 730
6
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
6

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?