Escalation Policyでは、インシデントが発生した際に担当者をアサインするためのルールを設定します。
複数のルールで構成することができ、最初のルールで指定した時間内にユーザーが受任(Acknowledge)しなければ、次のルールに従って別のユーザーに通知を行います(自動エスカレーション)。
Notification Rulesは各ユーザーが自分が担当すべきインシデントを見逃さないための仕組みであるのに対して、
Escalation Policyはチームとして対応すべきインシデントを見逃さないための仕組みになります。
Escalation Policyの作成
(1) People > Escalation Policies を開き、画面右上の「+ New Escalatin Policy」をクリック
(2) Escalation Policyの名前を記入し、1つめのルールに最初に誰に通知を行うか設定します。
(3) 通知先の設定方法は、ユーザーを直接指定する方法と、On-call Scheduleを指定する方法があります。
(4) 自動エスカレーションが発生するまでの時間を指定します。ここで設定した時間内にユーザーが受任(Acknowledge)しないと、次のルールを参照して通知が行われます。
(5) Add a new Escalation Rule の右の「+」をクリックすると、ルールを追加できます。
"If no one acknoledges, repeat this policy.." にチェックを入れておくと、最後のルールでも担当者が決まらなかった場合に、最初のルールから指定した回数繰り返すことができます。
Escalation Policy設定例
以下は3つのルールを設定したEscalation Policyの例です。
この例のように設定した場合、どのように通知が行われるか説明します
このEscalation Policyが紐付けられたServiceでインシデントが発生すると、PagerDutyはルール1を参照して通知を送ります。
ルール1では On-call Schedule: "PS - Primary" が設定されているため、このScheduleを参照して通知先を決めます。Scheduleではいま現在の当番が "Moto 山田" になっているため、このユーザーに対して通知が行われます。
"Moto 山田" が5分以内に受任(Acknowledge)しなかった場合、次のルール2にエスカレーションされます。
ルール2では、On-call Schedule: "PS - Secondary" と User: "Frank" が通知先に指定されています。Schedule上の当番である "Brayan 庄田" と "Frank" に同時に通知を行います。
2名とも5分以内に受任(Acknowledge)しなかった場合、次のルール3にエスカレーションされます。
ルール3では、User: "Ben" と "Caren" が指定されていますが、Round Robin が有効になっています。
この場合、最初にルール3までエスカレーションされた際は、"Ben"にのみ通知されます。
次にルール3へのエスカレーションが発生した場合は、"Caren"に通知されます。
(緑の矢印→が、次に通知を受け取る担当者を示します)
ルール3でも5分以内に受任(Acknowledge)されないと、ルール1から再度通知を行います。
この例ではルール1から3まで、3回繰り返す設定になっています。
ベストプラクティス
Escalation Policyは複数のルールを設定し、繰り返しを有効にする
インシデントに担当者がアサインされず、放置されるのを防ぐため、複数のルールと繰り返しを有効にしてください。
PagerDuty設定ガイド 目次
検知編 | トリアージ編 | 動員編 | 解決編 | 学習編
- 通知を受けるまでの設定の流れ
- ユーザーの追加と通知設定
- On-call Scheduleの作成
- Escalation Policyの作成 << イマココ
- Serviceの作成
- 通知テストの実施
- Slack等との連携