主にCuDNNのインストールについての備忘録
環境
Ubuntu 16.04
Python 3.6.2 :: Anaconda, Inc.
Cuda 8.0 のインストール
割愛
tensorflowのインストール
pip install tensorflow tensorflow-gpu
ここでシェル上でtensorflowのインポートを試みたところ、以下のエラー。
ImportError: libcudnn.so.6: cannot open shared object file:
No such file or directory
公式FAQ https://www.tensorflow.org/install/install_linux より、CudNNのバージョン違いが原因と判明
CuDNNのインストール
バージョン6.0.0が必要
https://developer.nvidia.com/rdp/cudnn-download からダウンロード
sudo dpkg -i libcudnn6_6.0*+cuda8.0_amd64.deb
sudo dpkg -i libcudnn6-dev_6.0*+cuda8.0_amd64.deb
sudo dpkg -i libcudnn6-doc_6.0*+cuda8.0_amd64.deb
ここで、一行目の実行で以下のエラー
/sbin/ldconfig.real: /usr/lib/nvidia-375/libEGL.so.1 is not a symbolic link
/sbin/ldconfig.real: /usr/lib32/nvidia-375/libEGL.so.1 is not a symbolic link
/usr/lib(32)/nvidia-375/libEGL.so.1がシンボリックリンクでないといけない(?)ようなので、貼り直してldconfigを実行
sudo mv /usr/lib/nvidia-375/libEGL.so.1 /usr/lib/nvidia-375/libEGL.so.1.org
sudo mv /usr/lib32/nvidia-375/libEGL.so.1 /usr/lib32/nvidia-375/libEGL.so.1.org
sudo unlink /usr/lib/nvidia-375/libEGL.so
sudo ln -s /usr/lib/nvidia-375/libEGL.so.375.66 /usr/lib/nvidia-375/libEGL.so
sudo unlink /usr/lib32/nvidia-375/libEGL.so
sudo ln -s /usr/lib32/nvidia-375/libEGL.so.375.66 /usr/lib32/nvidia-375/libEGL.so
sudo ldconfig
これで無事動きました。