この「検知編」では、監視ツールから送られるアラート(イベント)1とPagerDutyのサービスを紐付ける設定を行います。
「動員編」と「検知編」の設定が完了すれば、監視ツールが異常を検知した際、紐付けられたサービスでインシデントを自動起票し、すぐに適切な担当者に通知できるようになります。
設定の順番としては、「動員編」>「検知編」>「トリアージ編」の順に進めることをおすすめします。
「検知編」を完了すると、できるようになること
- 監視ツール等からPagerDutyにアラートを送り、インシデントを自動起票できる
- PagerDutyと連携できる外部ツールと、その連携方法を調べることができる
PagerDutyにEventを送る方法
PagerDuty自体には「監視」の機能はありません。
しかし、監視機能を持つあらゆるツールと連携し、それらから受け取るアラートを元にインシデントを検知することができます。
PagerDutyにアラートを送る方法は、APIとEmailの2つの方法があります。
API - Events API v2
APIによる連携が準備されている3rd Partyツールは、Integration Libraryで調べることができます。700以上のツールとの連携が用意されています。
監視ツールは、PagerDutyが発行するIntegration Keyを付与して、アラートをAPIエンドポイントにPOSTします。
APIによる連携が用意されていない場合は、アラートの情報をEmailでPagerDutyに送ることで、インシデントを起票できます。
Rate-limiting/流量制限
Events API/Emailともに、1分間あたりに送信できるアラートの量が制限されています。
- Events API: 120 calls/分 per Integration Key
- Email: 60 emails/分 per 送信先Emailアドレス
Integration Keyまたは送信先Emailアドレス毎の制限になります。Integration Key/Emailアドレスは複数発行できるため、複数のIntegration Key/Emailアドレスを用意し、分散して送ることで制限を回避できます。
参考: developer.pagerduty.com - Rate Limiting
設定の流れ
- PagerDutyでIntegration-Keyを発行する
- 発行したIntegration-Keyを使って、監視ツール側でPagerDutyにアラートを送る設定をする
Global Integration と Service Integration
Integration Key(送信先Emailアドレス)を発行する方法は2つあります:
- Service Integration: サービスに紐づくIntegration Keyを発行
- Global Integration: サービスに紐づかないIntegration Keyを発行し、Routing Rulesを使って各サービスに振り分ける
どちらの方法でもIntegration-Keyを発行できますが、一般にはGlobal Integrationを推奨しています。
詳細はトリアージ編で説明しますが、Global IntegrationではGlobal Orchestration Rulesが利用でき、さらにEmailで送られたアラートも同様のルールで制御できるためです。
以降ではIntegration-Keyを発行する方法と、監視ツール側の設定について説明します。
PagerDuty設定ガイド 目次
検知編 | トリアージ編 | 動員編 | 解決編 | 学習編
- [PagerDutyにアラートを送る方法] << イマココ
- Global Integrationの設定
- Service Integrationの設定
- 監視ツールの設定
参考リソース
- PagerDuty Integration Library - PagerDutyと連携できるツール・連携方法のドキュメント
- PagerDuty Events API v2
- システム障害を未然に防ぐ「インシデント管理・対応」とは
- PagerDuty - 14日間 無料トライアル