Alibaba CloudのGPUについて
Alibaba CloudでもElastic GPU Service(EGS)というGPUが利用できるサービスが提供されています。
GPUは並列処理を行うことにより高速に演算を行います。
その性能を深層学習(Deep Learning)で利用することに注目が集まっています。
EGSはNvidia Tesla P100 GPU 上に構築されており、機械学習(深層学習)や大規模な並行計算を行うことが出来ます。
2018/06/06に東京リージョンでもGPUインスタンスが利用出来る様になりました。
Alibaba Cloud 東京リージョンGPU インスタンス追加のお知らせ
Alibaba CloudでのGPUの利用方法
GPUを利用するためにGN5インスタンスを作成する必要があります。
今回は東京リージョンで、以下の手順で作成しました。
インスタンスタイプ:ecs.gn5-c4g1.xlarge
CPU:4
メモリ:30
インスタンスの作成とGPUドライバのインストール
こちらのページを参考にインスタンスを作成しました。
インスタンスを選択する場合は「ecs.gn5-c4g1.xlarge」で検索するとすぐに見つかります。
GPUのドライバはインスタンス作成時に自動インストールの設定項目があります。
自分でGPUドライバをインストールしようとすると、Kernelのバージョン問題など色々と問題が発生し、解決に手間がかかるので自動インストールをおすすめします。
構成はこの様にしました。
GPUのドライバを自動インストールする際はインスタンスの生成に通常より時間がかかると表示されますが、実際には大きな差はほとんどなく数分でインスタンスを生成することが出来ました。
インスタンスにSSHでログインし、GPUの情報を確認します。
# nvidia-smi
GPUが設定されていることが確認できました。
GPUを利用したDeep Learningについて
Deep Learningの利用方法
TensorFlowでMNIST for Beginnersを試したいと思います。
環境としてAnacondaとTensorFlow、Gitを追加インストールします。
手順としては、こちらとこちらを参考に進めました。
実行結果はこちら。
まずまずの結果が出ました。
この様に、GPUを利用してDeep Learningを行うことが出来ました。
データ数が少ないビギナー向けの内容でしたのでGPUの性能を存分に利用出来ませんでしたが、複雑な処理や大規模なデータ数のDeep Learningで真価を発揮出来ると思います。
まとめ
GPUを利用したDeep Learningを動作させる環境の構築は、比較的簡単に出来ました。
また、料金を確認しながら設定出来るので従量課金の場合にも計算しながらインスタンスを作成出来るのは大変便利です。
今回紹介した方法でもDeep Learningの環境は構築出来ますが、Containerクラスターを利用したDeep Learningの環境構築もありますので、試してみてください。