環境
OS : ubuntu 18.04
CPU : Intel® Xeon(R) W-2123 CPU @ 3.60GHz × 8
GPU : RTX 2080 Ti
古いバージョンを消す
sudo apt-get --purge remove nvidia-*
sudo apt-get --purge remove cuda-*
sudo apt-get --purge remove cudnn-*
sudo apt-get --purge remove libnvidia-*
sudo apt-get --purge remove libcuda-*
sudo apt-get --purge remove libcudnn-*
sudo apt-get autoremove
以下を実行して何も出なければ OK です。
dpkg -l | grep nvidia
dpkg -l | grep cuda
dpkg -l | grep cudnn
CUDA 10.0 のインストール
CUDA 10.0をここからダウンロードする。(今回はrunfile)
sudo ./cuda_10.0.130_410.48_linux.run
sudo reboot
nvidia-smi
で GPU が認識されていることを確認します。
続けて PATH を通します。
echo -e "\n## CUDA and cuDNN paths" >> ~/.bashrc
echo 'export PATH=/usr/local/cuda-10.0/bin:${PATH}' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:${LD_LIBRARY_PATH}' >> ~/.bashrc
nvcc -V
で CUDA 10.0がインストールされていることを確認します。
cuDNN 7.4 のインストール
下記のページでログイン後、以下のパッケージをダウンロードします。
- libcudnn7_7.5.1.10-1+cuda10.0_amd64.deb
- libcudnn7-dev_7.5.1.10-1+cuda10.0_amd64.deb
- libcudnn7-doc_7.5.1.10-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7_7.5.1.10-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.5.1.10-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.5.1.10-1+cuda10.0_amd64.deb
以下で Test passed!
が出ればOKです。
cp -r /usr/src/cudnn_samples_v7/ $HOME
cd $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN
Pytorch 1.7.1 のインストール
pip install torch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2
トラブルシュート
途中でミスったりすると、E: 未解決の依存関係です。'apt --fix-broken install' を実行してみてください
みたいなエラーが出る可能性があります。これが解消されると以下2つのコマンドの結果が空になります。
sudo dpkg --audit
sudo dpkg --configure -a
解消するには、上記2つのコマンドで出てくるpackageを
sudo dpkg --remove --force-remove-reinstreq package名
で消しまくります。以上です。