#前置き
GPUを活用した機械学習ツールNVIDIA RAPIDSのビルド方法。今回は最新版=21.08)での構築方法を紹介。Arch Linux の環境では、CUDA11.4.2 + GCC11 となっているのですが、一応ビルドできて、テストも数値エラーやメモリエラーは起きるが一応最後までまわる。
やったこと=RAPIDS のビルド
データ処理、機械学習のフレームワークRAPIDSを Arch Linux でビルドした。ただし、ビルドまでにエライ手間がかかったので、皆さんへの共有も兼ねて
0. 基本構成その0 ・・・ Cupyのビルド方法についてはこちらの記事で紹介してます。
- 基本構成その1 ・・・ こちら。RMM, cuDFというRAPIDS の基本コンポーネントの一部のビルド手順。
- 基本構成その2 ・・・ いまここ。CUMLというRAPIDS の基本コンポーネントの一部のビルド手順。ついでに、cuSignal という信号制御ライブラリや、cuxfilter という描画データ変換ライブラリも。
- 基本構成その3 ・・・ こちら。グラフを扱うCUGraphのビルド手順。
RAPIDSについて
RAPIDS って何?(再掲)
NVIDIAが中心となってとりまとめている、GPUを使ったデータ処理&機械学習のフレームワークツールのスイート。Rapidsaiから提供。何が出来るかについては、例えば石黒さんの記事とか参照のこと。
##主なコンポーネント
- RMM(RAPIDS Memory Manager)...GPU上での分散メモリ処理のためのライブラリ
- CUDF(DataFrame library)...データ前処理・管理のためのライブラリ(Pandas に相当)
- CUML(Machine Learning library)...機械学習のためのライブラリ(SciPy, SciKit-Learn に相当)。ただしAPI一覧のとおり、かなりのアルゴリズムがManifold関連中心に充実しているのに対して、scikit-learn に存在するAPIが未実装だったりするのでまだまだ発展形だったりする。
- CuPy...Preferred Networksによって開発されている線形代数を中心とした数式計算処理ライブラリ群(Numpyに相当)。RAPDISのコンポーネントでは無いが、大きく依存している
#ビルド方法
GitHubリンクに、PKGBUILDとかビルド順とか。で済ませたいですが、補足説明を。あと参考までにビルドの依存関係をつけます。(あらたに rmm というパッケージが python-rmm とは別に登場)
#事前想定
- NVIDIA GeForce RTX/GTXを持っている人
- CUDA含めた開発環境が揃っている。
- Arch Linux の使い手。EndeavourOSなど派生ディストリビューションでもOKだが、Manjaro のように独自リポジトリを持ち、カーネル、ドライバなどのリリースのペースが異なるものは関知しません。
- yay とか PKGBUILD とかが何やってるかが、ある程度わかること。
##ビルド順
0. RMM/CUDFビルド記事のとおり、Python CUDF までインストールが終わっていることを想定。CUMLのビルドには、1〜3がいずれも(多分)必要。また、Cupyビルド記事にあるCupyもインストールが終わっていることが必要
1 treelite
Distrubuted/Deep Machine Learning Community (DMLC) から提供されるDecision Tree 探索用ライブラリ。ライブラリ+ヘッダファイル(DMLCも含む)にくわえてPythoパッケージも生成(python-treelite)
2 faiss
FaceBookがレコメンデーション機能などに提供している近傍検索ライブラリ。ライブラリ+ヘッダだけでなくPythonパッケージも生成される。
3cumlprims
NVIDIAからプロプライエタリで提供されるライブラリ。CUMLのビルドに必須。現時点ではCondaパッケージの形式で提供されている。Condaパケージだが、EarlyAccess用にNightly Build版もある。
4CUML
RAPIDSが提供する各種計算ライブラリ。21.08 をインストール。ライブラリ+ヘッダファイルが生成される。
5 openucx
Unified Communication Xは、Arch Linux の AURから取得してください。
6 python-ucx
UCXのPythonラッパ。GPU間で通信を行う場合に必要らしい(シングルGPUでも使える)
9python-CUML
CUMLのPythonラッパ。
ここまでビルドして以下が確認できればOK。
$ python
Python 3.9.6 (default, Jun 30 2021, 10:22:16)
[GCC 11.1.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import cuml
>>>
その後、テスト実施
事前に、scikit-learn や、今回のリポジトリから提供されている1パッケージ、python-umapもインストールしておく。
$ cd src/cuml/python/cuml/test/
$ pytest -v .
とやって、一通りテストが回れば成功。筆者の環境ではテスト(--run_streess/--run_quantity/--run_unit は付けてない)は一通り回る。が、一部項目では計算結果が想定と一致せずFAILとはなっている。
10(オプション) cuSignal
信号処理ライブラリ、Cupy (とCUDA)が入ってたらビルドできます。
11(オプション) cuxfilter
データをGPUを用いて描画データ変換するためのライブラリCUDFが入ってたらビルドできます(その他必要なライブラリは ArchLinuxや AURに入っている)。
#記録
- (2021.10.8 22:18 JST)...Rapidsai 21.10初版
- (2021.10.10 23:56 JST)...CUXFILTERを追加
#おことわり
この記事は、筆者以外の方の環境でも同様に成功することを保証するものではありません。ビルドや動作確認の失敗(ないとは思いますが)環境が破壊されても責任は一切負いかねます(基本的には自己責任でお願いします。)。
#今回紹介したリンク
https://github.com/gdaisukesuzuki/PKGBUILD_rapidsai2110