#TensorFlowのGPU版(tensorflow-gpu)を動かすために必要なこととは?
- Deep Learningを行う計算力(compute capability)のある比較的新しいGPU(nvidia社製)を搭載していること。
- GPUの適切なドライバーがOSに入っていて、使用可能な状態になっていること
- tensorflow-gpuやGPUのドライバー(CUDA)、Deep Learning用のライブラリ(cuDNN)を入れる環境を作るため、Anacondaがインストールされていること。
- Pythonや必要なライブラリがバージョンの互換性を持っていること👈今ここ
#この記事のゴール
tensorflow-gpuを動かすために必要なライブラリを適切なバージョン関係でインストールされた環境を構築する。
#必要なライブラリ
tensorflow-gpu、cuDNN、CUDAの三つです。
これらを互換性に注意してconda installでインストールしていきます。
#バージョンの互換性について
上にあげた三つとPythonのバージョンを下の表に対してある程度、合わせる必要があります。
Anacondaで環境構築する今回はコンパイラとビルドツールは気にせずに、tensorflow-gpu、Python、cuDNN、CUDAの四つのバージョンを合わせれば良いです。
互換性についてはhttps://www.tensorflow.org/install/source?hl=jaにて以下の表を確認しました。
「ある程度」というのは、cuDNNやCUDAは表のバージョンがcondaで配布されていないものもあるので必ずしもぴったりのバージョンはインストールできないです。例えば私はPython==3.6.10、tensorflow-gpu==1.13.1、cudnn==7.6.5、CUDA==10.0_0という環境でその組み合わせは表には載っていないですが問題なく動きます。
ちなみに、次のコマンドで配布されているcuDNNとCUDAのバージョンを確認できます(この二つはセットでインストールできる)。例えば、表で指定されているcudnn==7.4でCUDA==10.0はcondaでは配布されていないことが確認できます。
(base)$conda search cudnn
Loading channels: done
# Name Version Build Channel
cudnn 7.0.5 cuda8.0_0 pkgs/main
cudnn 7.1.2 cuda9.0_0 pkgs/main
cudnn 7.1.3 cuda8.0_0 pkgs/main
cudnn 7.2.1 cuda9.2_0 pkgs/main
cudnn 7.3.1 cuda10.0_0 pkgs/main
cudnn 7.3.1 cuda9.0_0 pkgs/main
cudnn 7.3.1 cuda9.2_0 pkgs/main
cudnn 7.6.0 cuda10.0_0 pkgs/main
cudnn 7.6.0 cuda10.1_0 pkgs/main
cudnn 7.6.0 cuda9.0_0 pkgs/main
cudnn 7.6.0 cuda9.2_0 pkgs/main
cudnn 7.6.4 cuda10.0_0 pkgs/main
cudnn 7.6.4 cuda10.1_0 pkgs/main
cudnn 7.6.4 cuda9.0_0 pkgs/main
cudnn 7.6.4 cuda9.2_0 pkgs/main
cudnn 7.6.5 cuda10.0_0 pkgs/main
cudnn 7.6.5 cuda10.1_0 pkgs/main
cudnn 7.6.5 cuda10.2_0 pkgs/main
cudnn 7.6.5 cuda9.0_0 pkgs/main
cudnn 7.6.5 cuda9.2_0 pkgs/main
【3】UbuntuにAnacondaで構築するTensorFlow-GPU環境構築〜Anaconda仮想環境作成編〜で作成した仮想環境、ibio_envをactivateします。
(base)$ conda activate ibio_env
(ibio_env)$
まず、tensorflow-gpuからインストールします(versionは==(バージョン)で指定できる)。
注意点⚠️:tensorflowとtensorflow-gpuは別物で同じ環境に共存できないのでインストールする際は必ず"-gpu"を忘れずにつけることを気を付けてください。
(ibio_env)$conda install tensorflow-gpu==1.13.1
Pythonもバージョンを合わせる。
(ibio_env)$conda install python==3.6.10
cuDNN、CUDAをインストールします。
先ほど改めて試したら、tensorflow-gpuをインストールしたとき自動でインストールされましたが、一応インストールの方法を示しておきます。
cuDNNとCUDAはセットでインストールします。
cudnn=(バージョン)=(ビルド)で指定します。
(ibio_env)$conda install cudnn=7.6.5=cuda10.0_0
以上で環境構築は終わりです。
#うまくいかない場合
ライブラリの互換性が問題の場合はconda uninstall (ライブラリ名)でアンインストールは可能なのでバージョンを上げたり下げたりして粘り強くうまくいく場所を探してください。環境が煩雑になったり壊れたりすることもあると思いますが、その都度、作り直して試行錯誤していきましょう。
#最後にGPUが認識できているかを確認
最後にtensorflow-gpuがGPUを認識してくれているかを確認してみましょう。
参照:https://thr3a.hatenablog.com/entry/20180113/1515820265
認識しない場合、他のバージョンもアタリをつけて試してみましょう。