More than 5 years have passed since last update.

AWS Batchでのマルチスレッド処理では、コンテナあたりのスレッド数に要注意

Last updated at 2020-01-07Posted at 2019-08-19

概要

AWS Batchのジョブ設定には、VCPUという項目がある。
設定の名称からすると、コンテナ内から見えるCPU数が変わるのではないか？という期待を持ってしまいがち。

しかし、この設定の実態はただの優先度設定である (docker runの--cpu-sharesオプションにマップされている)。
よって、ここに何を設定したとしても、コンテナ内からは、Dockerホストに実装されている全てのCPUコアが見える。

OpenMPなどの並列化プラットフォームを利用すると、デフォルトでは、システムに実装されているCPU数分のスレッドが起動する動作になっていることが多い。
そのような動作をするプログラムを動かす際、以下のような(間違った)設定をしたとする。

設定時の想定では、16コンテナで32スレッドが起動し、16 * 8 = 128GiBのメモリが消費される。
しかしこの場合、実際には、16コンテナ * 32スレッド(物理コア数分) = 512スレッドが起動する。

スレッド数に比例して消費メモリが(大きく)増える設計/実装は避ける
上記が無理なら、起動するスレッド数を固定する

ハードコードではなく、環境変数経由で指定できるようにして、ジョブ定義で調整するとベター。
OpenMPならデフォルトでOMP_NUM_THREADS環境変数によるスレッド数指定に対応している。