これは ZOZO Advent Calendar 2024 カレンダー Vol.9 の 7日目の記事です。
はじめに
昨日はRay ClusterのWorker NodeをSpot VMで起動するというタイトルで、Ray Clusterに関する記事を投稿しました。
本記事では、Ray Jobs CLIをご紹介します。
Ray Jobs CLI
Ray Jobs CLIは通常のPythonパッケージのrayをinstallするとray job
コマンドにより実行可能です。
poetryの場合は次のコマンドでinstall可能です。
poetry add "ray[default]"
Ray Jobの停止・削除
RayのDashboardにアクセスすることでRay Jobsを一覧すること可能ですが、Dashboardから実行中のJobの停止や削除を行うことはできません。(自分が見落としていたらすみません🙏)
RayのJobをSubmitする際に利用するRay Jobs CLIですが、RayのJobの停止、削除なども行えます。
上記の画像で04000000
のJob IDを持つJobはRUNNING
になっています。Jobを停止するには次のコマンドを実行します。
RAY_ADDRESS="https://<ray cluster host>/" poetry run ray job stop 04000000
上記コマンドの実行により、JobのステータスがSTOPPED
に変わったことがわかります。
Jobの削除は次のコマンドにより実行できます。
RAY_ADDRESS="https://<ray cluster host>/" poetry run ray job delete 04000000
そもそもJobをSubmitする際に必ず利用するかとは思いますが、意図せずJobが終了しなくなってしまった場合や、間違ってJobをSubmitした場合などSubmit以外でも利用する場面は多そうです。
Dashboard上でこれらの操作が可能になればより便利かとは思いますが、今後に期待です。