ファイルデプロイ・バッチ実施などのリリースはサービス維持において避けられないもの。
最低限行っている負荷監視をメモとして記載。
「top」コマンド実行
こんな感じの結果が出ます。
[hoge@fuga]$ top
top - 20:49:53 up 7 min, 1 user, load average: 0.03, 0.36, 0.23
Tasks: 79 total, 2 running, 77 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.0% us, 0.3% sy, 0.0% ni, 99.7% id, 0.0% wa, 0.0% hi, 0.0% si
Mem: 1035556k total, 453728k used, 581828k free, 13820k buffers
Swap: 2096472k total, 0k used, 2096472k free, 329060k cached
大事なのは load average: 0.03, 0.36, 0.23
の一番左の値「0.03」。
どういう意味かと言うと、
直近1分間の単位時間あたりの待ちタスク数
簡潔に言うと、この値がCPU数を超えてくるとヤバい、です。
では、CPU数はどうすれば見れるのか?
さらに「1」を押下
こんな感じの結果が出ます。
[hoge@fuga]$ top
top - 20:49:53 up 7 min, 1 user, load average: 0.03, 0.36, 0.23
Tasks: 79 total, 2 running, 77 sleeping, 0 stopped, 0 zombie
%Cpu0 : 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu1 : 0.3 us, 0.0 sy, 0.0 ni, 99.7 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu2 : 0.7 us, 0.3 sy, 0.0 ni, 99.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu3 : 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
Cpu(s): 0.0% us, 0.3% sy, 0.0% ni, 99.7% id, 0.0% wa, 0.0% hi, 0.0% si
Mem: 1035556k total, 453728k used, 581828k free, 13820k buffers
Swap: 2096472k total, 0k used, 2096472k free, 329060k cached
%Cpu0 ~ %Cpu3
の表示が追加されました。
意味は、
4つのCPUが動作している
となります。
つまり、リリース後 load average: 4.01, 2.36, 1.23
のような状態となると
遅延が発生し始めサービスにも影響を与え始める、と言う事になります。