More than 3 years have passed since last update.

【VS Codeでほぼ完結】GPUマシンにssh接続，Dockerコンテナを開いてコードを実行【Ubuntu/Windows/macOS】

Last updated at 2022-10-20Posted at 2022-09-13

1. 背景

sshでGPUマシンに接続し，Dockerコンテナに入ってJupyter Labを実行，
そして生成したURL（トークンなど）をブラウザに貼り付けてNotebookを実行する，
といった流れでPythonなどのコードをNotebookで実行することはできますが，
手順が面倒くさかったり，terminalで色々叩かないといけないのが面倒くさかったりします．

そこで，ほとんどの動作をVS Code上でクリック操作でできるようにしたら色々楽になったので，
備忘録としてやり方をまとめておきます．

※一部，以前書いた記事のコピペ部分があります．

2. 前提

GPUマシンはUbuntu，ローカルPCはMac or Windowsでのみ動作確認を行いました．

PC環境

動作確認を行ったPCの情報です．

GPUマシン（サーバー側）
- Ubuntu 20.04 LTS
- AMD EPYC 7402P 24-Core Processor
- RTX 3090 ×2
- メモリ128GB
- Dockerインストール済み
  - Docker イメージ準備済み
- OpenSSHインストール済み
ローカルPC（ユーザー側）
- MacBook Pro (13-inch, 2020, Thunderbolt 3ポートx 4)
- メモリ16GB
- macOS 12.5.1
- 2.3GHzクアッドコアIntel Core i7
- VS Codeインストール済み（日本語化済み）

3. 最初の準備

初めて手元のローカルPCをGPUマシンに接続するときは少し準備が必要になります．
初期設定的なやつです．

鍵発行

初めて接続する際はローカルPC側で秘密鍵と公開鍵を発行し，公開鍵をGPUマシンに送信し，保存しておく必要があります．

terminal

cd #ホームディレクトリ（Users/ユーザー名/）に移動
cd .ssh #.sshフォルダがない場合はmkdirしてください
ssh-keygen [-f <output_keyfile>]

例：

terminal

cd #ホームディレクトリ（Users/ユーザー名/）に移動
cd .ssh #.sshフォルダがない場合はmkdirしてください
ssh-keygen -f id_rsa_user1

パスフレーズはなくてもOKです（Enterキー押すだけ）．
例：output_keyfileをid_rsaなどにすると，.sshフォルダ内にid_rsa（秘密鍵）とid_rsa.pub（公開鍵）の2種類のファイルが生成されます．複数名でGPUマシンにアクセスすることを想定しているならば，id_rsa_user1など違いがあるとわかりやすいです（管理しやすく）．
参考：ssh-keygenコマンドの使い方

ホスト名の簡略化（hostsファイルの編集）

まず，GPUマシンのIPアドレスを調べておきます．

terminal（サーバー側）

ip a

例：

terminal

>> inet 10.##.#.###  (わざと隠してます）

クライアント側のhostsファイルを開き，編集します．

terminal（ローカルPC側）

sudo vi /etc/hosts

viの使い方はこちらを参考にしました．
「コマンドモードと入力モードの切り替え」と「保存と終了」部分が参考になります．
hostsファイルに以下を追記します．

hosts

[UbuntuPCのIPアドレス] [Tabキー] [任意のホスト名]

[UbuntuPCのIPアドレス]には先程調べたIPアドレスを入力してください．
[Tabキー]はTabスペースを空けるという意味です．
[任意のホスト名]はgpumachineなど覚えやすいホスト名で構いません．

例：

/etc/hosts

10.##.#.###   gpumachine

※Windowsの場合C:\windows\system32\drivers\etc\hostsにあります．これを編集してください（管理者権限が必要となるので，スタートメニューからWindows標準のメモ帳を探し，右クリック→管理者として実行，メモ帳が開いたら左上のメニューから「開く」を押してC:\windows\system32\drivers\etc\hostsのhostsファイルを開いて編集，編集後上書き保存が可能となります．）

公開鍵の転送・登録

先ほど作成した公開鍵をGPUマシンに転送し，登録します．
パスワードの入力が求められた時は，GPUマシンにログインする時のパスワードを入力してください．
macの場合

terminal（クライアント側）

ssh-copy-id -i ~/.ssh/id_rsa.pub [gpuマシンのユーザー名]@[gpuマシンのホスト名]

例：

terminal（クライアント側）

ssh-copy-id -i ~/.ssh/id_rsa_user1.pub user@gpumachine

Windowsの場合
こちらを参考にするとssh-copy-idと同様のことができます．

リモート接続時のコマンドを簡単にする

ローカルPC側の「.ssh」ディレクトリの「config」ファイルにエイリアスを定義することで、リモート接続時のコマンドを省略できます．

terminal

vi ~/.ssh/config

config

Host [エイリアス１]
 HostName [リモートのホスト名]
 User [リモートユーザー]
 IdentityFile /Users/[user名]/.ssh/[秘密鍵]
 Port [ポート番号]
 ServerAliveInterval 60
 LocalForward   8888 localhost:8000

ポート番号は，あれば記述します（ngrok使用時など）．
ServerAliveIntervalはssh接続時に一定時間放置した時自動的に接続が切れてしまうのを防ぐために設定します．
LocalFowardはポートフォワーディングです．
コンテナにポートフォワーディングを設定する場合はここを設定しておいたほうが良いです．
基本的にVS Codeでしか開かない，コンテナへの排他的アクセス制限は行わない，という場合はLocalForwardはなくても良い気がします（VS Code上でコンテナを開いたりする場合は自動的にPort番号が振られている）．
セットアップ時にエラーが出る場合は全て終わった後，設定してもいいかもしれません．
私はポートフォワーディングをconfigに予め書いておけることを後で知り，セットアップ後にconfigに追記しました．
もし，LocalForwardを設定する場合は，未使用のポート番号を振り，ユーザー一人ひとりが違う番号を使うようにしましょう．

※（2022年5月9日追記）
ポートフォワーディングに関して，例で示しているport番号で実行すると
クライアント側のport 8000 ↔ GPUマシンのport 8888 が紐づけされ，
後述のdocker run時の-p オプションにより（例：docker run -it --gpus all --name user1lab -v ~/Desktop/user1:/container/user1 -p 8000:8888 condalab-cuda-torch-jp），最終的にクライアント側のport 8000 ↔ （GPUマシン経由） ↔ dockerコンテナ内のport 8888が紐づけされるイメージになります（間違っていたらごめんなさい）．
ポート番号は排他的に使用しなければいけないので（実行中の1コンテナごとに違うポート番号），configファイルでLocalForwardを例のように固定してる場合，2個目のコンテナを並列で立ち上げるためにはクライアント側で2つ目のconfigファイルを活用しないssh接続を行うなどの方法があります．
例として，2つ目のターミナルウィンドウでssh user名:ホスト名 -L 8888: localhost:8001でGPUマシンにssh接続し，docker run -it --gpus all --name コンテナ名 -v ~~~~ -p 8001:8888 dockerimage_nameでコンテナ作成しコンテナ内でjupyterの起動をし接続するやり方でうまくいきました．
また，GPUマシンを複数人で共有する場合，利用者それぞれでconfig内LocalForwardを違うport番号で設定しておき，portが被るのを防ぐなどのやり方があると思います．

※（2022年6月1日追記）
実際に複数人でコンテナを起動し試したところ，以下のようにするとスムーズに実行できました．

1人目はconfigファイル内でLocalForward 8888 localhost:8000としておき，コンテナrun実行時オプションにて-p 8000:8888，jupyterの起動時jupyter lab --ip=0.0.0.0 --allow-root --port 8888とport番号（8888はデフォルト値）の指定をします．

2人目はconfigファイル内でLocalForward 8889 localhost:8001としておき，コンテナrun実行時オプションにて-p 8001:8889，jupyterの起動時jupyter lab --ip=0.0.0.0 --allow-root --port 8889とport番号の指定をします．

このように一人ひとりが以上の箇所で違う数値を用いることにより，同時にコンテナを実行できることを確認しました．

※（2022年10月20日追記）
ポートフォワーディングに関してですが，VSCodeで主に使う場合，ポートを指定していない場合でも複数人が並行してDockerコンテナを開いて作業できることを確認しました．
Dockerにアクセスできる人を制限したい場合などはssh接続時にポートフォワーディングをし，さらにDocekrコンテナでもポート番号をオプションで指定するとよいかもしれません（Docker runのとき）．

例：

config

Host gpumachine
 HostName gpumachine
 User user
 IdentityFile /Users/user1/.ssh/id_rsa_user1
 ServerAliveInterval 60
 LocalForward   8888 localhost:8000

これで，sshで接続したい時は以下のコマンドのみでパスワード入力無しでssh接続できるようになります．

terminal（クライアント側）

ssh gpumachine

VS Codeの拡張機能のインストール

以下2つのVS Codeの拡張機能をローカルPCのVS Codeにインストールしておきます．

名前: Remote - SSH
ID: ms-vscode-remote.remote-ssh
説明: Open any folder on a remote machine using SSH and take advantage of VS Code's full feature set.
バージョン: 0.84.0
パブリッシャー: Microsoft
VS Marketplace リンク: https://marketplace.visualstudio.com/items?itemName=ms-vscode-remote.remote-ssh
名前: Remote - Containers
ID: ms-vscode-remote.remote-containers
説明: Open any folder or repository inside a Docker container and take advantage of Visual Studio Code's full feature set.
バージョン: 0.251.0
パブリッシャー: Microsoft
VS Marketplace リンク: https://marketplace.visualstudio.com/items?itemName=ms-vscode-remote.remote-containers

バージョンは通常の最新版でOKです．

4. sshでリモート接続

VS Codeを開きRemote-sshがインストールされていることで現れる左下のボタン（>< ←こんなマーク）を押します．
「ホストに接続する」もしくは「現在のウインドウをホストに接続する」をクリックし，hostsファイルに登録しておいたホスト名（例：gpumachine）をクリックすることでGPUマシンへのssh接続が可能になります．接続が完了すると左下に「>< SSH: deepbox」といった接続済みを表す表示があるはずです．

5. 実行中のコンテナに入る

前提

Dockerfileなどを作っておいて，「Reopen in Container」からコンテナを作成することもできますが，今回はGPUマシンのterminal上でDockerイメージをpullし，runし，カスタマイズした後，docker commitしたDocker Imageをrunさせている状態でVS Codeからコンテナに入るというやり方で進めます（ここの詳細なやり方は以前書いた記事を参考にしてください）．

方法

4章で開いたssh接続済みのVS Codeウィンドウで左側のメニューバー中の「リモートエクスプローラー」を開き，メニュー内の上部にある「SSH ターゲット」と書いてあるプルダウンメニューをクリックしContainersを選択します．
開きたいコンテナにマウスカーソルを合わせて，右端の方にある「Attach to Container」をクリックすることで新規ウィンドウが開き，コンテナ内に入ることができます．

6. 閉じ方

コンテナを開いているVS Codeウィンドウやssh接続中のVS Codeウィンドウを閉じたいときは，画面左下の「><」ボタンから「リモート接続を終了する」を押すことで通信を切断できます．

7. Tips

VS Codeでssh接続＆dockerコンテナを開いている時，VS Codeの拡張機能をインストールすると，ローカル上ではなく，コンテナ環境に新たに拡張機能をインストールすることができます（ローカルPC上のVS Codeにはインストールされないが，リモート接続することで，GPUマシン上に拡張機能がインストールされている状態の環境を操作できる）．
docker内でformatter（blackなど）をインストールした時，インストールしたのにショートカットキーなどで起動しないことがありますが，VS Codeで設定を開き「リモート」タブを開き，検索バーに「Python」と入力（事前にPythonに拡張機能を入れておく必要あり）
Python > Formatting: Black Pathの部分にBlackへの完全なパス（docker内のterminalでwhich blackを実行するとパスが分かります）を入れてPython > Formatting: Providerをblackにし，保存しておくことで正常に動作するようになります．
VS Code上でJupyter Notebookを開くためのショートカット：⌘ + shift + P→Create: New Jupyter Notebook
LANの外（WAN）からGPUマシンに接続したい場合は，ngrokなどのツールを用いることで，外部から接続できるようになります（詳しくは以前書いた記事の4章を参照しhostsファイルとconfigファイルに追記を行ってください)．
VS Codeでdockerコンテナに入ると，その中で同期したディレクトリを開くことができ，ファイルのやり取りをスムーズにすることができます．
VS Code上でターミナルを開くショートカット： Ctrl + @
GPUマシンのGPU使用率などの確認： ssh接続しているVS Codeウィンドウ内のターミナルなどでnvidia-smi
何度も最新情報を更新したい時： watch nvidia-smi（Ctrl + cで終了）
※nvidiaのドライバを入れておく必要あり
GPUマシンのCPU使用状況の確認： ssh接続しているVS Codeウィンドウ内のターミナルなどでtop（Ctrl + cで終了）
dockerに関する便利なコマンド集は以前書いた記事の8章を参照してください．
おすすめのdocker内のVS Codeのsettings.jsonの設定（blackとflake8はcondaで入れました）

settings.json

{
	"python.formatting.provider": "black",
	"python.linting.pylintEnabled": false,
	"python.linting.flake8Enabled": true,
	"python.linting.enabled": true,
	"python.linting.lintOnSave": true,
	"editor.formatOnSave": true,
	"editor.formatOnType": true,
	"editor.formatOnPaste": false,
	"editor.bracketPairColorization.enabled": true,
	"files.insertFinalNewline": true,
	"files.trimFinalNewlines": true,
	"files.trimTrailingWhitespace": true,
	"notebook.lineNumbers": "on",
	"python.formatting.blackPath": "/root/anaconda3/bin/black",
	"python.linting.flake8Path": "/root/anaconda3/bin/flake8flake8"
}

8. 最後に

ここまで読んでくださりありがとうございます．
ご質問や修正すべき点などございましたら，コメント欄にお願いします．

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up