こんにちは。
今回は、現場で利用している監視ツールのMUNINを自宅のPC環境に導入してみました。インストール方法と簡単に監視項目を備忘録として残します。
インストール方法
① 必要なコンポーネントをインストールします
sudo apt update
sudo apt install munin munin-node apache2
munin: データを収集しグラフを生成する「親機(マスター)」
munin-node: データを収集される「子機(ノード)」
apache2: グラフをWebページで表示するためのサーバー
②Munin用のApache設定を有効化、反映
sudo a2enconf munin
sudo systemctl restart apache2
③Muninノードの再起動
念のため、監視対象となる munin-node サービスも再起動しておきます。
sudo systemctl restart munin-node
⚠️ 焦らずに5〜10分待ってください
Munin(マスター)は、デフォルトで5分に1回、cronという仕組みで自動実行されます。
実行されると、munin-node からデータを収集し、グラフの元となるRRDファイルを作成・更新します。
10分ほど待った後、同じUbuntu PCのWebブラウザを開き、以下のアドレスにアクセスしてください。
http://localhost/munin/
(または http://(PCのIPアドレス)/munin/ )
デイリーチェックリスト
| 優先度 | カテゴリ | グラフ名 | チェック項目(色) | 判定基準(正常な状態) | 異常時の判断 |
|---|---|---|---|---|---|
| 最優先 | 死活/異常 | network errors |
errors (線) |
常に「0」 | 0以外なら物理故障やケーブル不良の疑いあり |
| 最優先 | 容量 | disk usage |
usage (線) |
90%未満 | 100%に近づく、または急増していたら要注意 |
| 最優先 | メモリ | swap |
swap in/out |
グラフが平坦 (0) | 激しく上下していたらメモリ不足 |
| 注意 | 負荷 | load average |
load (線) |
CPUコア数以下 | 常時コア数を超えていたら高負荷 |
| 注意 | CPU | cpu usage |
iowait (赤) |
面積が小さい | 赤い面積が大きい場合、ディスク速度がボトルネック |
| 注意 | ディスク | disk latency |
average (線) |
低い数値 | 秒単位(1.0s以上)のスパイク連発は危険 |
| 参考 | プロセス | processes |
zombie (赤) |
ほぼ0 | 増え続けていたらプログラムのバグの可能性 |
異常時の対応検討
1. Network Errors が出ている場合
- 原因: LANケーブル、ハブ/スイッチのポート、NIC(LANカード)の故障など物理的な要因が多い。
- 対応: ケーブルの交換、ポートの変更を試す。
2. Disk Usage が高い場合
- 原因: ログファイルの肥大化、バックアップファイルの蓄積。
-
対応:
/var/logなどの肥大化したファイルを特定し、削除または退避する。
3. Swap が発生している場合
- 原因: 物理メモリが足りておらず、遅いディスクをメモリ代わりに使っている。
-
対応:
topコマンドなどでメモリを消費しているプロセスを特定。不要なら停止、必要ならメモリ増設を検討。