More than 3 years have passed since last update.

dockerコンテナ内でGPUが使用できない際のトラブルシューティング

Last updated at 2021-06-11Posted at 2021-05-02

概要

dockerコンテナ内でGPUが使用できず、下記のようなエラーが出た。
docker-container-runtimeのエラーのよう。

コンテナでGPUが使用できるか下記コマンドで確認を行なった。
docker run --gpus all nvidia/cuda:10.0-cudnn7-devel-ubuntu18.04 nvidia-smi
結果としては、下記のエラー

 Error response from daemon: could not select device driver "" with capabilities: [[gpu]].

docker-container-runtimeのエラーは下記三つで解決を図る
①/etc/docker/daemon.jsonへの記載
②デーモンの再起動(sudo systemctl restart docker)
③docker-container-runtimeの再インストール

しかし、今回の場合は解決できない。

→dockerを再インストールすることで解決できた。

機械学習では、dockerコンテナ内でjupyterを使ったり、スクリプトを使用したりする。
tensorflowとcudaには互換性があるので、tensorflowのバージョンによってcudaのバージョンを下げたい時等に便利だ。
docker内でGPUを使用する方法を簡単に記載する。