0.はじめに
この記事は私が機械学習で利用する環境のdocker imageを共有するために書きました。
機械学習をしたいけど環境構築が難しくてできないという方の役に立てば幸いです。
深層学習フレーム
- pytorch
データフレーム操作
- pandas
- polars
- cudf
Dockerfileなどはgithub(kaggle_pytorch_docker)に公開しています。
1. Preparation
機械学習用の環境を構築するためにまずdockerをインストールしてください。
dockerを利用できる環境の作り方がわからないという方はNVIDIA Dockerって今どうなってるの?を参考にしてください。
2. Build Image
1.を基にdocker環境が構築できましたら、機械学習用のdocker imageをビルドしましょう!
以下のコマンドを実行してください。
$ git clone https://github.com/oriki101/kaggle_pytorch_docker.git #docker imageを作成するためのDockerfileを保存したリポジトリ
$ cd kaggle_pytorch_docker
$ ./build.sh
もし実行権限がないようでしたらchmod等で権限を適切に付与してください。
こちらの処理にはものすごく時間がかかります。
3. Using docker image
dockerコマンドとdocker-composeコマンドを利用した環境の建て方を用意しています。
現状の構成ではどちらを利用していただいても大丈夫です。
もし複数のコンテナを立てたいという場合はdocker-composeのものを参考に、改良してください。
dockerコマンドでの起動
$ ./run.sh
docker-composeコマンドでの起動
$ ./compose_up.sh
機械学習環境へのアクセス
上記のコマンドを実行すると機械学習環境が起動されます。
現在操作しているPCで実行した場合は
localhost:8888
にアクセスしてください。
リモートPCで環境を起動した場合は
実行したPCのIPアドレス:8888
にアクセスしてください。
4. Explanation of environment
機械学習環境にアクセスすると下の画像のような画面になると思います。
Python3
Notebook欄のPython3は.ipynbのファイルを生成し、インタラクティブにスクリプトを描くことができます。
desktop
真ん中のdesktopはnovncでGUI操作できるデスクトップを作成してくれます。
ボタンをクリックすると新しいタブができ、少し時間が経つと下図のようなデスクトップ画面が開きます。
強化学習などでGUIアプリを起動したい場合に利用してください。
VS Code
一番右のVS CodeはVisual Studio Codeの環境を開いてくれます。
.pyファイルやconfigファイルなどを記述する際は利用してみてください。
5.おわりに
今回共有したdocker imageで大抵のことができると思います。
このdocker imageが機械学習の勉強の役に立ってくれるととても嬉しいです。
何らかのパッケージやpytorchのバージョンを上げたものを作って欲しいという要望などがありましたら、issueであげてもらえると時間がある時に改修しようと思います。
最後まで読んでいただきありがとうございました。