PagerDutyのIncident傾向把握、分析・改善はされていますか?
Incidentの分析として、下記3つの指標を確認されることが多いです。
1. Incident件数
2. MTTA (Mean Time to Acknowledge) ‐ Incident認識(Acknowledge)までの時間
3. MTTR (Mean Time to Resolve) ‐ Incident解決(Resolved)までの時間
この3つはそれぞれ以下のポイントが確認できる重要な指標です。
1.Incident件数
- インシデントが多い場合...システム/インフラに重大な問題がある、モニタリングの設定ミス、または調整が必要
- インシデントが少ない場合...正しい状態!! ...もしくは、モニタリングが十分出では無い?!
2.MTTA
- チームがインシデントに対して、オーナーシップを持ち対応できているか?
- 作業を開始するまでにかかる時間は適切か?
3.MTTR
- チームがインシデントに対応できているのか?
- 動員や問題解決の速さは適切か?
- ダウンタイムを最小化し、顧客と収益への影響を最小限に抑える事ができているか?
これらの指標は、AnalyticsのInsightsで確認することができます!
現在のPagerDuty利用状況を可視化し、
インシデントの解決時間を短縮やデータドリブンの意思決定を強化するために、
今すぐInsightsを使って確認してみましょう!!!
【アクセス方法】
Analytics > Insightsからアクセスします
【Insights画面】
【Insightsに関する記事】
詳しくはこちらの記事をご覧ください
https://support.pagerduty.com/lang-ja/docs/insights