はじめに
機械学習に使用していたサーバが死にました
実施環境
Ubuntu 18.04.4 Desktop (64-bit)
NVIDIA Geforce GTX 1080
NVIDIA Driver 440.82
CUDA 10.2(2020/06/12現在 PytorchがCUDA11に未対応な為)
SSH Serverのインストール(optional)
$ sudo apt install -y openssh-server
$ sudo systemctl enable ssh
$ sudo systemctl restart ssh
CUDAとドライバーのインストール
Dockerのインストール
Install Docker Engine on Ubuntu
NVIDIA Container Toolkitのインストール
インストール方法
Docker 19.03 以降の環境で前だけを見て生きる場合のNVIDIA Docker のインストール方法
Pytorchコンテナのダウンロード
$ docker pull nvcr.io/nvidia/pytorch:20.03-py3
使い方
$ docker run --gpus all -it --rm -v local_dir:container_dir --name pytorch nvcr.io/nvidia/pytorch:xx.xx-py3
root@XXXX:/workspace $ python hoge.py
おわりに
それにしてもDocker凄いですね
面倒くさかった環境構築が一瞬でできるようになるなんて
バックアップはしっかり取りましょう