More than 3 years have passed since last update.

CUDA on WSL2の速度比較と環境構築

Last updated at 2021-12-13Posted at 2021-12-13

この記事は「【マイスター・ギルド】本物のAdvent Calendar 2021」9日目の記事です。

CUDA on WSL2で機械学習環境を構築した場合に速度を落とさずに学習できるのかが気になったので、調べてみました。機械学習環境を構築する際の助けになれば幸いです。

はじめに

本記事では、CUDA on WSL2環境で機械学習をする場合と、Ubuntu直接環境(Ubuntuを直接インストールした環境)で機械学習をする場合の速度比較を行います。
また、その前段階として。2021年11月時点でのCUDA on WSL2の環境構築手順も記載します。

以下の順序で記載します。

WSL2のインストール
Windows11にアップグレード
CUDA導入
Pytorch環境構築
速度比較

速度比較の結果だけ見たいんだ！という方は、5. 速度比較まで飛んでください。

開発環境

CPU：Intel Core i5-10400
GPU：GeForce RTX 2060
RAM：8.0GB
OS：Windows10 21H1(OSビルド：19043.1348) ※手順の途中でWindows11に変わります

1.WSL2のインストール

1.1. Windowsの機能の有効化

コントロールパネルから[プログラム] > [Windowsの機能の有効化または無効化]を選択する。
「Linux用Windowsサブシステム」と「仮想マシンプラットフォーム」を有効にする。
PCを再起動する。

1.2. WSL2にUbuntuをインストール

WSL2 Linux カーネルの更新ページから、WSL2用Linuxカーネルをダウンロードして、インストールする。
WSL 2を既定のバージョンとして設定する。
コマンドプロンプト等で以下を入力する。

wsl --set-default-version 2

Microsoft Storeから Linuxディストリビューションをインストールする。

4)「Ubuntu 20.04 LTS」を選択する。

初回起動時にのみユーザー名とパスワードを設定する。

2.Windows11にアップグレード

WSL2上でCUDAを使用するためには、Windowsのビルドバージョンを20145以上にする必要があります。
以前はWindows Insiderに登録する必要がありましたが、2021年11月時点ではWindows11にアップグレードするだけでOKです。

3.CUDA導入

3.1.ドライバアップデート

https://developer.nvidia.com/cuda/wsl からドライバをダウンロードし、インストールする。

3.2.CUDA on WSL2をインストール

以下にアクセスする。
https://developer.nvidia.com/cuda-downloads
[Linux] - [x86_64] - [WSL-Ubuntu] - [2.0] - [deb(local)] を選択する。
インストールコマンドが表示されるので、Ubuntuを起動し、Ubuntu上でインストールする。

3.3.cuDNNをインストール

以下にアクセスする。会員登録が必要です。
https://developer.nvidia.com/rdp/cudnn-download
Windows上で以下の2つをダウンロードして、任意のフォルダ(例としてC:\tempとする)に保存する。
・cuDNN Runtime Library for Ubuntu20.04 x86_64 (Deb)
・cuDNN Developer Library for Ubuntu20.04 x86_64 (Deb)
UbuntuからWindowsのフォルダは/mnt/c/tempで参照できるので、Ubuntuから以下のコマンドで RuntimeとDeveloperをインストールする。

$ sudo dpkg -i /mnt/c/temp/libcudnn8_8.3.0.98-1+cuda11.5_amd64.deb

※2021/11/22リリースのv8.3.1からRuntimeとDeveloperがなくなって、1ファイルになっているようです。「Local Installer for Ubuntu20.04 x86_64 (Deb)」をダウンロードすれば大丈夫だと思いますが、未確認です。

3.4. 動作確認

Ubuntu上で以下のコマンドで、GPUを認識していることを確認する。

$ sudo cp /usr/lib/wsl/lib/nvidia-smi /usr/bin
$ sudo chmod +x /usr/bin/nvidia-smi
$ nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 510.00       Driver Version: 496.49       CUDA Version: 11.5     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  On   | 00000000:01:00.0  On |                  N/A |
| 32%   34C    P8     8W / 160W |    593MiB /  6144MiB |     N/A      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

$ nvcc -V
NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Mon_Sep_13_20:11:50_Pacific_Daylight_Time_2021
Cuda compilation tools, release 11.5, V11.5.50

4. Pytorch環境構築

Ubuntu上でPytorch環境を構築します。

4.1. venvで仮想環境を構築

$ sudo apt-get update
$ sudo apt install python3.8-venv
$ python3 -m venv pytorchenv
$ source pytorchenv/bin/activate

4.2. Pytorchをインストール

https://pytorch.org/ で表示されるコマンドでインストールを行う。

※ ダウンロード途中で頻繁に通信エラーになったため、ブラウザでダウンロードしてインストールしました。

$ pip3 install torch-1.8.2+cu111-cp38-cp38-linux_x86_64.whl

5. 速度比較

Python(Pytorch：MNIST)とC言語(darcknet)を対象に機械学習の速度の比較を行いました。それぞれ、3回試行の平均値です。

テスト環境

共通

CPU：Intel Core i5-10400
GPU：GeForce RTX 2060
RAM：8.0GB
CUDA ： 11.5
cuDNN ：8.3.0

CUDA on WSL2環境

OS：Windows11 Pro(21H2) + WSL2(Ubuntu 20.04 LTS)

Ubuntu直接環境

OS：Ubuntu 20.04 LTS

結果(Pytorch：MNIST)

学習対象：PytorchのMNISTのサンプルプログラム
- 14epoch分のトレーニング開始～終了までの時間(画像のダウンロード時間は含まない)
Python：3.8
Pytorch：1.8.2

環境	学習時間
CUDA on WSL2環境	139.4秒
Ubuntu直接環境	107.0秒

【参考】
参考までに、Windows11で直接実行した場合、Windows11でGPUを使用しなかった場合、Google Colaboratoryを使った場合の時間です。

環境	学習時間
Windows11(GPU使用)環境	146.6秒
Windows11(CPU使用)環境	1185.8秒
Colabo(Tesla K80)環境	332.7秒
Windows11(GPU使用)環境はCUDA on WSL2環境よりさらに遅かったです。

Colaboratoryは無償版では性能の劣るK80しか割り当たりませんでした。有償版のProができたので、無償版では性能のいいP4やT4は割り当たらないようですね。残念。

結果(darcknet)

学習対象：AlexeyAB/darknet(C言語で書かれた物体検出yoloアルゴリズム)
- バッチサイズ：32
- バッチの繰り返し回数：6000

環境	学習時間
CUDA on WSL2環境	2時間8分
Ubuntu直接環境	48分

まとめ

CUDA on WSL2環境はUbuntu直接環境より、Pytorch：MNISTで1.3倍、darcknetで2.6倍の時間がかかるという結果になりました。言語、ライブラリ、学習対象によって差異はあると思いますが、Ubuntu直接環境の方が学習速度は速そうです。
1.3倍程度だったとしても本格的に機械学習を行う場合は、数時間・数日かかることになると思うので、Ubuntu直接環境を構築した方が効率がいいかもしれません。

WindowsとUbuntuをデュアルブートで入れたい方は、以前に手順を記載したので、【備忘録】Ubuntu 20.04 LTS + GPU 環境構築 (2021年3月版)をご参考ください。少し前の情報ですが、ほぼそのままの手順で構築可能だと思います。

参考にしたサイト

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up