PrometheuでWindowsのSQLServerのサービス状態を監視する手順となります。
++++++++++++++++++++++++++++++++
[環境]
prometheus : Ver.2.23.0
prometheus-alertmanager : Ver.0.15.3
++++++++++++++++++++++++++++++++
監視ルールを設定するymlファイル(デフォルトではrules.yml)にSQLserverのサービス監視のルールを記載します。
今回はSQLServerサービスの状態が "起動" 以外の場合にアラートを出すという設定を記載します。
- alert: SQLServer-ServiceDown
expr: windows_service_state{job="[ジョブ名]", name="[対象のインスタンスのサービス名]", state="running"} == 0 #1はrunning 0はrunning以外
for: 7m #この時間を超えたらアラートWarningからCriticalに変更します。 s(秒) m(分)
labels:
AlertGp: [アラートグループ名] #ここの名前は任意です。アラートに任意のグループラベルを設定できます。このラベルはalertmanager.ymlで利用することができます。
参考:
https://github.com/prometheus-community/windows_exporter/blob/master/docs/collector.service.md