はじめに
「つくりながら学ぶ!PyTorchによる発展ディープラーニング」というPyTorchの良書があります。本の内容は以下。
この本の第7,8章を動かすためのDocker環境構築です。(GPUは非対応です。)
なぜDocker?
素晴らしい本ですが、AWSインスタンスを立てて動かす方法しか書いてありません。学習を回すにはGPUが必要なのでAWSを使うといいと思いますが、著者が学習済みの重みを配布してくれていますし、コードは全て写経して、実行するのは学習以外ならば、ローカルCPUマシンで十分です。
ですが、特に第7,8章の自然言語処理は、OSのパッケージのインストールが必要ですし、Linux環境が前提の記述です。そこで、Dockerを用いて誰でも簡単に環境構築を済ませてしまおうというのがこの記事の目的です。
Dockerのインストール
詳細はググってください。
-
Windowsの方
Docker Desktop for Windows をインストールしてください。 -
Macの方
Docker Desktop for Mac をインストールしてください。
Dockerイメージのダウンロード
私のDockerHubにイメージをアップロードしています。
docker image pull yhaneji/nlp-japanese:1.0.0
Dockerコンテナの起動
上記イメージはJupyter公式イメージをベースにしています。そのためJupyter Lab が使えます。「プロジェクトのディレクトリ」を自分のプロジェクトディレクトリのパスに書き換えてください。
docker container run --rm -it -p 8888:8888 -v プロジェクトのディレクトリ:/tmp/working
Dockerfile
詳細が気になる方のために、Dockerfileを私のGitHubレポジトリに置いています。VSCodeのRemote Containerを利用するための設定ファイルも置いています。是非ご利用ください。