More than 3 years have passed since last update.

変更作業 15の心得・心構え（リスク回避のために）

Last updated at 2021-04-16Posted at 2021-01-17

初めに

　運用が始まったシステムに変更作業を行うのは怖いですよね。
ちょっと間違うと障害に直結、徹夜で復旧作業、復旧後はお詫びにお客様訪問。。。

かと言って「できるだけ何もしない」とうのも後ろ向き過ぎます。

　これまで変更作業で多くの失敗をしてきましたので、、、これらを教訓に心得・心構え的なことを共有できればと思います。

読んで下さった方が少しでも安心して作業ができるようになれば嬉しいです。

手順書・チェックリストに関する心得・心構え
4.「5W1H」を意識的に盛り込む。
5.「～かもしれない」という前提で事故を防ぐ。
6. 事前の状態・事後の状態を比較する。
7. 定型作業を個別に手順書化する。
8. 切り戻し手順書を作成する。
9. 手順書をレビューする。

リハーサル
10. リハーサルを実施する。

作業中の心得・心構え
11. 記録を付ける。
12. 作業全体の管理者を立てる。

忘れがち、でも大事なことへの心得・心構え
13. アナウンスを行う。
14. 体制・連絡先を明確にしておく。
15. 記録を保管する。

全般的な心得・心構え

1. 何があっても元に戻せるようにしておく。

　個人的にはこれが一番大事なことだと思っています。

　万一障害を起こしてしまっても最終的に元に戻せれば何とかなりますが、

　　・吹っ飛ばしたDBを元に戻せない。
　　・起動しなくなったソースコード管理サーバ内のソースコードを戻せない。
　　・起動しなくなったネットワーク機器のconfigを代替機に戻せない。

なんてことになると目も当てられないですよね。

　元に戻す手段として、

　　・作業直前にバックアップを取得する。
　　・作業直前にスナップショットを取っておく。
　　・冗長構成になっている場合は待機系をバックアップとして利用する。

などの方法があるかと思います。

　また、一回でもいいので事前に元に戻す手順を実際に試してみて手順書に纏めておくようにしましょう。

一回でも実際に経験しているとポイントを覚えているものです。
逆に一度も経験がない場合、いざというときに慌てることになります。

変更作業 15の心得・心構え（リスク回避のために）

初めに

目次

全般的な心得・心構え

1. 何があっても元に戻せるようにしておく。

2. 副作用がないかチェックする。

3. 何かあった場合のサービスへの影響範囲を洗い出す。

手順書・チェックリストに関する心得・心構え

4.「5W1H」を意識的に盛り込む。

Why：作業目的、手順の意味

When：時刻、作業タイミング、チェックポイント

Who：作業者、体制

Where：作業場所

What：作業対象（対象システム、対象ホスト、対象ディレクトリ）

How：作業方法

5.「～かもしれない」という前提で事故を防ぐ。

6. 事前の状態・事後の状態を比較する。

7. 定型作業を個別に手順書化する。

8. 切り戻し手順書を作成する。

9. 手順書をレビューする。

リハーサル

10. リハーサルを実施する。

作業中の心得・心構え

11. 記録を付ける。

12. 作業全体の管理者を立てる。

忘れがち、でも大事なことへの心得・心構え

13. アナウンスを行う。

14. 体制・連絡先を明確にしておく。

15. 記録を保管する。