PRTGでトラブったのでメモを残します
PRTG(監視システム)をWindowsサーバ上で運用中、OSが突然ハングアップ。
設計に漏れがあったため、簡単に記録を残しておきます。
そもそもPRTGとは
PRTG Network Monitor
ドイツに本社を構える Paessler AG社 によって開発された、
ネットワーク監視ソフトウェアです。
日本語対応しており、UIは直感的。
Zabbixと比較して、設計・構築に苦労することなくネットワーク・サーバの
監視システムを立ち上げることができます。
センサーとは
監視対象ノードの監視対象部位のこと
PRTGでは監視対象の「部位」ごとに1センサーを消費する、
という考えになっており、これはPRTGのライセンスを選択する際に重要となります。
例)
サーバAのPing監視 ⇒ 1センサー消費
サーバAのCPU使用率監視 ⇒ 1センサー消費
サーバBのPing監視 ⇒ 1センサー消費
サーバBのCPU使用率監視 ⇒ 1センサー消費
PRTGフリー版では100センサーまで監視可能です。
ライセンスは、センサー数︓500/1000/2500/5000/無制限 から選択可能です。
Cドライブが真っ赤に
ある日OSが不安定になっていることに気づき、
確認を進めるとCドライブの使用量がとんでもないことに…。
どうやらPRTGのセンサーログ(監視ログ)がドライブを逼迫していたご様子。
PRTGではセンサーログ(過去の監視データや統計情報等)のDBファイルを
デフォルトで以下の場所に格納します。
C:¥ProgramData¥Paessler¥PRTG Network Monitor¥Monitoring Database
センサー数が多いと、このフォルダサイズがあっという間に肥大化します。
デフォルト設定では365日間、センサーログを保存する設定となっているため
センサーログのローテーション設計を考える必要があります(ありました。)
センサーログの肥大率は正直読めないので、1ヶ月運用してみてどれだけのサイズになったか観察しながら保存期間をチューニングしていくしか無いと思います。
なお、デフォルトだと366日以上古いセンサーログはローテションにより自動削除されるため、1年以上前の監視データは参照できなくなる ということです。
要件に、過去の監視データ保存要件 がある場合は要注意。
センサーログ保存期間の変更
ということで、PRTG管理画面上でセンサーログ保存期間を365日から適切な日数に変更します。
設定箇所は以下の通り。
PRTG WebGUIの設定タブ
User Interface
Core & Probes
データパージ制限
センサーデータ履歴
経過観察的に、まずは半年 に変更を行い様子を見ることとしました。
PRTGサービス再起動をすると、すぐにセンサーログが削除された(気がします。)