基本コンセプト
オープンソースのバージョンアップはかなり早い、そして安定性も不確かです。
バージョンアップ検証やパフォーマンス検証を繰り返し行える環境を構築する
検証環境は十分な物理PCは用意出来ないので、KVMで検証環境を用意していきます。
構築後の構成としては以下のようになります。
- head ・・・ slurm01 - 03 のネットブート管理、slurmctld(slurmマスタ)
- slurm01 ・・・ slurmd(ノード)
- slurm02 ・・・ slurmd(ノード)
- slurm03 ・・・ slurmd(ノード)
各slurmノードには、openmpi、apptainerを実行出来るようにします。
各ホストは、分散ファイルシステムのbeeGFSを/data , /backupとしてマウントします。
KVMホストは、2台作成する予定です。
一台はopenhpc用、もう一台はbeegfs用
各仮想マシンはvCPUx4 , vMEM=32GBに設定予定
ネットワーク
KVMホスト内に、内部通信用のネットワークを作成し、サービス間通信はこちらを利用する予定です。
KVMホスト間通信は、外部通信用のネットワークを使用します。
サービスの設計、インストールについては次回以降で記載します。