GeForce GTX 1050搭載のパソコンを購入したので、Ubuntu18.04でTensorflowをGPUで扱うための流れをまとめました。Tensorflowのソースコードをダウンロードし、コンパイルすることで、GPUの性能を最大限に活用します。
また、最後にcupyというnumpy配列をCUDAで扱えるようにするパッケージのインストール方法も紹介します。
本記事で例として挙げているものと環境が違っても、バージョン互換性を確認するためのサイトを逐次挙げているので、ご自身の環境にあったバージョンをお選びください。
※本記事はできるだけ正確に私自身が環境構築を行ったときの手順をまとめたものであり、他の人の役に立てるようにという意味でも執筆してはいるものの、正確さは保証できません。ご自身の責任のもと、実行お願いいたします。
編集履歴
| 日付 | 更新内容 |
|---|---|
| 2019年10月17日 | 記事公開 |
| 2024年2月16日 | RTX 3090のCUDAインストールについても追記 |
使用環境
| 名称 | バージョン |
|---|---|
| GPU | NVIDIA GeForce GTX 1050 NVIDIA GeForce RTX 3090 |
| OS | Ubuntu 18.04 LTS Ubuntu 22.04 LTS |
| CUDA | 10.0 12.3 |
| cuDNN | 7.6.4 |
| NCCL | 2.4.8 |
| Bazel | 0.26.1 |
| Tensorflow | 2.0 |
最終的なpipインストールリスト (pip3 freeze)
absl-py==0.8.1
astor==0.8.0
gast==0.2.2
google-pasta==0.1.7
grpcio==1.24.1
h5py==2.8.0
Keras-Applications==1.0.8
Keras-Preprocessing==1.1.0
Markdown==3.1.1
mock==3.0.5
numpy==1.16.2
opt-einsum==3.1.0
pkg-resources==0.0.0
protobuf==3.10.0
six==1.12.0
tensorboard==2.0.0
tensorflow-estimator==2.0.0
tensorflow-gpu-cuda-10.0==2.0.0
termcolor==1.1.0
Werkzeug==0.16.0
wrapt==1.11.2
必要十分かどうかはわかりません。この中のほとんどはpip3 install setuptoolsでインストールされます。
また、この段階でインストールする必要はありません。後のステップで解説していくパッケージをインストールすれば大丈夫です。
参考サイト
はじめに、大変参考にさせていただいたサイトを挙げさせていただきます。
-
全体的に参考にさせていただいたサイト
https://qiita.com/ishizakiyu/items/bcf1b76f1f4f02b0ac57 -
Tensorflowをコンパイルする前までを参考にさせていただいたサイト
https://qiita.com/konzo_/items/3e2d1d7480f7ef632603 -
Ubuntu18.04をデュアルブートする際に参考にさせていただいたサイト(本記事には関係ないですが)
https://qiita.com/TDC/items/9704e7981dd7a072a22d
Ubuntuバージョン確認
uname -m && cat /etc/*release
NVIDIA-GPUバージョン確認
lspci | grep -i nvidia
分からないこともあります。
その場合はシステム情報などから確認してください。
GRUB編集
デフォルトのグラフィックドライバを使わないように/etc/default/grubを編集します。
デフォルトでは次のようになっています。
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
GRUB_CMDLINE_LINUX=""
これを次のように編集します。
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash pci=nomsi nomodeset"
GRUB_CMDLINE_LINUX="pci=noaer"
NVIDIA-GPUドライバインストール
以下のURLで対応するドライバを検索して、ダウンロードします。
https://www.nvidia.co.jp/Download/index.aspx?lang=jp
ダウンロードしたファイルに実行権限を付けてインストールします。
GeForce-GTX1050の場合は次のようになります。
chmod +x NVIDIA-Linux-x86_64-430.50.run
sudo ./NVIDIA-Linux-x86_64-430.50.run
compute capability確認
あとで、Tensorflowをコンパイルする際に必要なcompute capabilityを確認します。
http://developer.nvidia.com/cuda-gpus
GeForce-GTX1050なら6.1です。
事前インストール
sudo apt-get install build-essential
sudo apt-get install cmake git unzip zip
sudo add-apt-repository ppa:deadsnakes/ppa
sudo apt-get update
sudo apt-get install python2.7-dev python3.5-dev python3.6-dev pylint
sudo apt-get install libcupti-dev
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/extras/CUPTI/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
CUDAインストール
CUDA10.1は、Tensorflowに現在(2019年)対応していない(できるかもしれないが公式では確認されていない)ため、CUDA10.0を公式サイトからダウンロードします。
今回は、deb(network)を選択しました。
https://developer.nvidia.com/cuda-toolkit-archive
sudo dpkg -i cuda-repo-ubuntu1604_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda-toolkit-10-0
.bashrcや.zshrcの末尾に以下を追加します。
CUDAが10.0のときは以下のようになります。
export PATH="/usr/local/cuda-10.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH"
CUDAが12.3のときは次のようになります。
パスは実際のディレクトリ構造も確認しながら適宜書き換えが必要です。
export PATH="/usr/local/cuda-12.3/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-12.3/lib64:$LD_LIBRARY_PATH"
再起動後、nvcc -Vでインストールできたか確認できます。
CUDAのバージョンが10.0のときは以下のようになります。
$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130
CUDAのバージョンが12.3の場合は以下のようになります。
$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Wed_Nov_22_10:17:15_PST_2023
Cuda compilation tools, release 12.3, V12.3.107
Build cuda_12.3.r12.3/compiler.33567101_0
またnvidia-smiコマンドで、GPUの型番がわかります。
cuDNNのインストール
https://developer.nvidia.com/rdp/cudnn-download
CUDA10.0に対応するDownload cuDNN v7.6.4 (September 27, 2019), for CUDA 10.0をクリックして、対応するOSのものを3種類ダウンロード。(Ubuntu18.04の場合は以下の3つ)
cuDNN Runtime Library for Ubuntu18.04 (Deb)
cuDNN Developer Library for Ubuntu18.04 (Deb)
cuDNN Code Samples and User Guide for Ubuntu18.04 (Deb)
そして、インストール。(順番もこのまま)
sudo dpkg -i libcudnn7_7.4.1.5-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.4.1.5-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.4.1.5-1+cuda10.0_amd64.deb
NCCLインストール
https://developer.nvidia.com/nccl/nccl-download
CUDA10.0に対応するDownload NCCL v2.4.8, for CUDA 10.0, July 31,2019をクリックして、O/S agnostic local installerをダウンロードして、以下のコマンドを実行してインストール。
tar -xf nccl_2.4.8-1+cuda10.0_x86_64.txz
cd nccl_2.2.13-1+cuda10.0_x86_64
sudo cp -R * /usr/local/cuda-10.0/targets/x86_64-linux/
sudo ldconfig
Bazelインストール
まずは、適当に最新版をインストールし、あとで、tensorflowのコンパイル(./configure)を行ったときに出るErrorに合わせて、バージョンをインストールし直します。
現時点での最新バージョンは2.0.0のようですが、コンパイルをすると、「バージョンは0.26以下にしなさい」と怒られたので、0.26.1をダウンロードしました。
wget https://github.com/bazelbuild/bazel/releases/download/0.26.1/bazel-0.26.1-installer-linux-x86_64.sh
chmod +x bazel-0.26.1-installer-linux-x86_64.sh
./bazel-0.26.1-installer-linux-x86_64.sh --user
echo 'export PATH="$PATH:$HOME/bin"' >> ~/.bashrc
tensorflowソースコードのコンパイル・pipパッケージ化・インストール
tensorflow-gpuを単純にpipでインストールしただけでは、GPUの性能を十分に活かすことができない場合があるため、ソースコードをダウンロードしてコンパイルします。
今回は、OSのデフォルトのpythonを傷つけないように、pythonの仮想環境venvを用いてコンパイルします。
好きなディレクトリに仮想環境を作り、必要なpip-packageをインストールします。
Anacondaなど他の環境を使っても問題ないが、venvはpythonにデフォルトで搭載されている機能なのでより手軽にできます。
python3 -m venv venv
source venv/bin/activate
pip3 install pip six wheel mock
pip3 install setuptools==41.4.0
pip3 install numpy==1.16.2
pip3 install keras_applications==1.0.5 --no-deps
pip3 install keras_preprocessing==1.0.3 --no-deps
pip3 install h5py==2.8.0
各パッケージの最新バージョンが何か知りたい場合は、例えばnumpyの場合なら、次のコマンドを実行します。
pip3 search numpy
このように調べて、最新バージョンをインストールすればよいが、tensorflowを実行する際に互換性が無い場合は適宜ダウングレードする必要があります。(コマンド例:numpyのダウングレード)
pip3 uninstall numpy
pip3 install numpy==1.16.2
本記事と同じ環境なら、上のバージョンで良いはず。
次に、tensorflowのソースコードをクローンする。
最新版のブランチにチェックアウトするには、下のgit checkout r2.0のgit checkout rまで打った時点でtabキーを押せば、候補が出るため、それを見て最新のブランチにチェックアウトすればよい。
git clone https://github.com/tensorflow/tensorflow.git
cd tensorflow
git pull
git checkout r2.0
./configureで、コンパイル実行。このときにBazelのバージョンがダメだと言われれば、それに従って、条件を満たす最大のBazelのバージョンをインストールすれば良い。また、その他にも色々聞かれるが、これまで調べた情報を元に入力する。基本的には、デフォルトの内容のままで良いならそのままEnter、必要のない機能は「n」で良い。(ここの詳細は参考サイトへ。ただ、バージョンによって質問内容はかなり異なるようなので注意。)
bazel build --verbose_failures --config=opt --config=cuda tensorflow/tools/pip_package:build_pip_package
かなりコンパイルに時間がかかる(私の環境では約2時間)が、待つ。
コンパイルが終わったら、pipパッケージ化し、/tmp/tensorflow_pkg/ディレクトリ下に置く。
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg --project_name tensorflow_gpu_cuda_10.0
利用する際は、以下のようにする。
これで、コンパイルした際に使った仮想環境だけでなく、どの環境でも、pip3でこの自分で作ったpip-packageをインストールすれば、使えるようになった。
pip3 install /tmp/tensorflow_pkg/tensorflow_gpu_cuda_10.0-2.0.0-cp36-cp36m-linux_x86_64.whl
検証
Tensorflow-Tutorialでインストールできたか検証する。
別ウィンドウでnvidia-smi -lでGPUを監視していると、学習中はこのプログラムのためにリソースが使われているはず。
import tensorflow as tf
mnist = tf.keras.datasets.mnist
(x_train, y_train),(x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0
model = tf.keras.models.Sequential([
tf.keras.layers.Flatten(),
tf.keras.layers.Dense(512, activation=tf.nn.relu),
tf.keras.layers.Dropout(0.2),
tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])
model.compile(optimizer='adam',
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])
model.fit(x_train, y_train, epochs=5)
model.evaluate(x_test, y_test)
cupyのインストール(おまけ)
cupyは、CUDAで並列計算するためのpythonパッケージ。
numpyで作成した行列をcupy用の配列に変換することで高速に行列演算を計算できる。
numpyのCUDA版と考えればよい(?)
pyCUDAなどの他のパッケージとの違いは、CPU・GPUの違いを意識せずにコーディングできること(agnostic coding)などがある。
インストールはpipで簡単にできる。まずは、次のコマンドを実行してみる。
pip3 search cupy-cuda
すると、以下のような内容が出てきます。
cupy-cuda91 (6.4.0) - CuPy: NumPy-like API accelerated with CUDA
cupy-cuda92 (6.4.0) - CuPy: NumPy-like API accelerated with CUDA
cupy-cuda100 (6.4.0) - CuPy: NumPy-like API accelerated with CUDA
cupy-cuda90 (6.4.0) - CuPy: NumPy-like API accelerated with CUDA
cupy-cuda80 (6.4.0) - CuPy: NumPy-like API accelerated with CUDA
cupy-cuda101 (6.4.0) - CuPy: NumPy-like API accelerated with CUDA
インストールするべきcupyは、cudaのバージョンによって異なる。例えば、CUDA9.1を使っているならcupy-cuda91。
今回はCUDA10.0を使っているのでcupy-cuda100をインストールする。
pip3 install cupy-cuda100==6.4.0
また、CUDAのバージョンが11.2以上のときは次のようになります。
| CUDAバージョン | pipパッケージ |
|---|---|
| v11.2 ~ 11.8 | cupy-cuda11x |
| v12.x | cupy-cuda12x |
xは自身のCUDAのマイナーバージョンを当てはめるのではなく、11x/12xというパッケージ名です。
詳しくは以下のサイトに記載されています。
https://docs.cupy.dev/en/stable/install.html#installing-cupy
編集後記
この界隈を調べていると頻繁にagnosticという用語に出会いました。ここでの意味は「CPUやGPUの違いを意識せずに実装できる」というもので、IT界隈ではよく使われるものの、一般的にはあまり使わない言葉のようです。