1
Help us understand the problem. What are the problem?

More than 3 years have passed since last update.

posted at

updated at

Organization

CentOS 7でTorqueのセットアップ

CentOS 7にTorqueをセットアップする際のメモ

計算サーバは1台でヘッドノード兼用とする。

主に
http://www.fiatlux.co.jp/faq/build/html/MFmyPresto_Other_Torque.html
の方法でOK。

ホスト名が設定されているか

$ hostname

で確認する。
※localhost.localdomainではダメ
※ホスト名が数字から始まっているとダメ

ホスト名からIPアドレスが引けないと問題になるので、予め設定しておいたほうが良い。
IPアドレス: 192.168.0.10
ホスト名: HostA
の場合、/etc/hostsに

192.168.0.10    HostA

を追加する。
※ループバックアドレス(127.0.0.1)ではダメ

# yum install -y epel-release
# yum install -y torque-client torque-mom torque-server torque-scheduler

# create-munge-key

# pbs_server -t create -f -D &
# pbs_server_pid=$!

# kill $pbs_server_pid

# echo "$HOSTNAME np=$(nproc) num_node_boards=1 numa_board_str=$(nproc)" > /var/lib/torque/server_priv/nodes
# hostname > /etc/torque/server_name

/var/lib/torque/mom_priv/configが

$pbsserver localhost

になっていたので、

$pbsserver HostA

に変更。

# systemctl start munge
# systemctl start trqauthd
# systemctl start pbs_server
# systemctl start pbs_sched
# systemctl start pbs_mom
# systemctl enable munge trqauthd pbs_server pbs_sched pbs_mom

下記コマンドでキューL0を設定する。
キュー名は別の名前でも良い。

# qmgr -c "create queue L0 queue_type=execution"
# qmgr -c "set queue L0 started=true"
# qmgr -c "set queue L0 enabled=true"
# qmgr -c "set queue L0 resources_default.nodes=1"
# qmgr -c "set queue L0 resources_default.walltime=3600"
# qmgr -c "set server default_queue=L0"
# qmgr -c "set server scheduling=true"

# qmgr -c 'p s'

で設定内容を確認する。

# pbsnodes -a

state = free

になっていることを確認。

※スクリプトを作って一気にやってしまっても大丈夫だが、デーモンの立ち上げ等で待たなければいけないところもあるので、適宜sleepを入れましょう。

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Sign upLogin
1
Help us understand the problem. What are the problem?