はじめに
Qiita 株式会社では PagerDuty を利用しアラートの通知などを行っています
PagerDuty には OnCall 担当者の通知設定が適切かレポーティングし、修正依頼を行う出来る On-Call Readiness Report があります
今回、 On-Call Readiness Report を利用し集計とフォローアップまで行ってみました
PagerDuty とは
On-Call Readiness Report とは
Well-configured notification rules are essential for effective incident response. Generate an on-call readiness report to review
notification rules for a group and automatically follow up with certain responders to request improvements to their configuration.
(DeepL 訳) 効果的なインシデント対応には、適切に設定された通知ルールが不可欠です。オンコール・レディネス・レポートを作成し、グループの通知ルールを確認することで、特定の対応者に自動的にフォローアップを行い、設定の改善を依頼することができます。
また、特定の応答者に対しては、自動的にフォローアップを行い、設定の改善を依頼することができます。
On-Call Readiness Report を用いて適切通知設定状態にしておくことで、 アラートなどの対応が迅速に行われる体制を作りましょうということですね
On-Call Readiness Report を使って適正化する
PagerDuty にログインしヘッダーの "Analytics" > "On-Call Readiness" と進むと On-Call Readiness Report の設定ページへと遷移出来ます。それでは On-Call Readiness Report を作成してみましょう
Readiness Profile
まず、 On-Call 対応における profile を選択します
通知先や通知タイミングの設定がどのレベルまで済んでいるかを、求めている水準と照らし合わせながら選択します
Profile 名 | 条件 |
---|---|
Never miss a page (BEST PRACTICE) | Required Notification Methods (Email, Phone call, Push notification, SMS) / Notification Timing (delay between notifications) |
Try every notification method | Required Notification Methods (Email, Phone call, Push notification, SMS) |
More than email | Required Notification Methods (Phone call, push notification, or SMS) |
Must include phone | Required Notification Methods (Phone call) / Notification Timing (Delay between notifications) |
今回は "Never miss a page (BEST PRACTICE)" を選択し次のページに進みます
Search and Filter
Search and Filter のページでは、 Readiness Profile で設定した項目に対する現在の状況を確認することが出来ます
必要に応じて確認対象のチームを選択してください
確認が終わったら Notify Users に進みましょう
Notify Users
Notify Users では、 Readiness Profile で選択した Profile に対して未設定のユーザーに PagerDuty の設定を行うようにメール送信を行うことが出来ます
送信内容は変更出来ませんが、送信者を PagerDuty か 自身の名前かを選択することが出来ます
最後に
今回は、PagerDuty の On-Call Readiness Report について記載しました
障害は発生して欲しい事象ではありませんが、通知設定が適切に行われているか確認することでもしもの時に迅速な対応を行うことが出来るように準備出来る物は準備しておきたいですね
References