障害対応というと、技術的な知識や経験が重視されます。
しかし、実際に障害が起きたときに一番重要なのは別の要素でした。
それは「冷静さ」です。
障害が起きた瞬間に起こること
- 焦る
- 手当たり次第に触る
- ログを読まずに再起動する
この行動が、状況を悪化させることがあります。
まずやるべきこと
障害時に最初にやるべきなのは、
- 状況を固定する
- 何が起きているかを把握する
- 触る前の状態を残す
です。
これだけで、復旧の難易度は大きく下がります。
経験を積んで分かったこと
技術的な知識は後からでも身につきます。
しかし、冷静さは意識しないと身につきません。
まとめ
障害対応は技術の勝負ではありません。
- 落ち着いて状況を見る
- 余計な操作をしない
- 一つずつ切り分ける
これができるかどうかで結果は大きく変わります。