20
16

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Ubuntu で nvidia-docker を使って PyTorch の環境を作りたい

Last updated at Posted at 2023-08-07

nvidia-dockernvidia-container-toolkitへ統合され非推奨になりました.新しく記事を書いたのでそちらを参照してください


ML 系の論文の実装を試していると,複数バージョンの CUDA と PyTorch を使い分ける必要があったりします

今回は nvidia-docker を使って複数バージョンの環境を構築してみます

ソースコード

動作環境

Ubuntu 22.04

NVIDIA GeForce RTX 3060 Ti

Docker Engine ( Docker Desktop は非推奨です )

事前知識

Ubuntu で Docker のインストール

Docker の使い方的な話

前準備

公式ドキュメント

まずは Docker で GPU を認識するために必要なパッケージをインストールします

    sudo apt install nvidia-container-runtime
    # インストール確認
    which nvidia-contaier-runtime-hook

    sudo apt install nvidia-docker2

Docker デーモンを再起動

    sudo service docker restart

Docker イメージの作成

作成したい環境の nvidia-docker イメージを選びます

Docker hub から 必要な CUDA のバージョンのイメージを選択しましょう

image.png

私は CUDA 11.1 or CUDA 11.7 を使うことが多いので,

  • nvidia/cuda:11.1.1-cudnn8-runtime-ubuntu20.04
  • nvidia/cuda:11.7.1-cudnn8-runtime-ubuntu20.04

を選んでみます

選んだイメージをベースに Dockerfile を作ります

  # サンプルファイル docker/pytorch/Dockerfile.111
  FROM nvidia/cuda:11.1.1-cudnn8-runtime-ubuntu20.04

  ENV DEBIAN_FRONTEND=noninteractive

  WORKDIR /app

  RUN apt update && \
      apt install -y \
      wget \
      bzip2 \
      build-essential \
      git \
      git-lfs \
      curl \
      ca-certificates \
      libsndfile1-dev \
      libgl1 \
      python3.8 \
      python3-pip

  COPY docker/pytorch/requirements.txt /app

  RUN pip3 install --no-cache-dir -U pip && \
      pip3 install --no-cache-dir -r requirements.txt

  RUN pip3 install --no-cache-dir torch==1.9.0+cu111 torchvision==0.10.0+cu111 -f https://download.pytorch.org/whl/torch_stable.html

Dockerfile で PyTorch をインストールしてみる

https://download.pytorch.org/whl/torch_stable.html で CUDA のバージョンに合った PyTorch を探します

いくつか例を載せておきます

CUDA11.1

cu111/torch-1.9.0%...cu111/torchvision-0.10.0%...があるので,pip でインストールようにしておく

  pip3 install --no-cache-dir torch==1.9.0+cu111 torchvision==0.10.0+cu111 -f https://download.pytorch.org/whl/torch_stable.html

CUDA11.7

cu117/torch-1.13.0%...cu117/torchvision-0.14.0%...があるので,pip でインストールようにしておく

  pip3 install torch==1.13.0+cu117 torchvision==0.14.0+cu117 -f https://download.pytorch.org/whl/torch_stable.html

CUDA11.7, PyTorch 2.0

cu117/torch-2.0.0%...cu117/torchvision-0.15.0%...があるので,pip でインストールようにしておく

  pip3 install torch==2.0.0+cu117 torchvision==0.15.0+cu117 -f https://download.pytorch.org/whl/torch_stable.html

コンテナに GPU を割り当てる

docker compose up で GPU を割り当てる

公式ドキュメント

GPU 接続したい Docker サービスで deploy を指定する

docker-compose.yml
  version: '3.3'

  services:

    pytorch_111:
      build:
        context: .
        dockerfile: docker/pytorch/Dockerfile.111
      container_name: 'nvidia-docker_111'
      stdin_open: true
      tty: true
      volumes:
        - ./:/app

    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
            - count: 1
            - capabilities: [gpu]

Docker コンテナの起動

docker compose upで起動できるようになっていると思います

  docker compose up -d

VSCode にコンテナをアタッチしたい

VSCode の拡張機能 Remote DevelopmentDocker を使うことで,コンテナの中に入って VSCode 上で作業ができます (VSCode にアタッチできる)

Remote Development では VSCode のワークディレクトリに .devcontainer/devcontainer.json を作成することでコンテナを VSCode にアタッチします

devcontainer.json の例

Docker サービス名,docker-compose.ymlへのパスなどを指定する

    "name": "PyTorch",
    "dockerComposeFile": "../docker-compose.yml",
    "service": "pytorch_111",
    "workspaceFolder": "/app",

ctrl + shift + Pとかでコマンドパレットを開いて,Dev Containers: Open Folder in Container...を実行します

ターミナルを開くとコンテナの中に入っていることが確認できます

PyTorch で GPU を認識できるか確認します

  >>> import torch
  >>> print(torch.cuda.get_device_name())
  NVIDIA GeForce RTX 3060 Ti

コンテナから抜ける場合は左下のDev Container: Pythonをクリックして,Close Remote Connectionをしてください


以上

おまけ

docker run で GPU を割り当てたい

コンテナを起動するときに --gpus all を指定すれば ok です

nvidia-smi が通るか確認してみます

    docker build . -f docker/pytorch/Dockerfile.111 -t pytorch_111:1.0 # Dockerfileをビルドしてイメージを作成
    docker run -it --rm --gpus all pytorch_111:1.0 nvidia-smi # イメージからコンテナを起動

Docker Desktop を使う場合

私がやったときはエラーを吐いてしまったので,Docker Desktop を完全に削除してから Docker Engine を入れ直しました

20
16
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
20
16

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?