いつの間にか crond が死んでいました..。
Linux OOM Killerに殺されたのか、なにか他に原因があったのかは定かではありません。
そのせいで、let's encrypt の自動更新がされず、証明書が期限切れを起こしました。
これはいかん。
zabbixでcrondが死んだら警告を出さねば!
....アイテムがねぇ...orz
作ればいいんだろ、作ればよ〜。
とりあえず zabbix server で新規テンプレート Crond を作ります。
アイテムに crond を keyが proc.num[crond] で。
これでおおよそ大丈夫のはずですが、まれに
proc.num[crond] が取れていないzabbix-agentが...
そういった場合は、agent側から死活をサーバーに通知します。
crondの死活は status で確認できます。
/etc/rc.d/init.d/crond status
runningという文字があれば正常。なければ異常。
runningをカウントすることで確認できます。
/etc/rc.d/init.d/crond status|grep -e running |wc -l
その結果を zabbix-agent から出力します。
zabbix_agentd.conf
UserParameter=crond,/etc/rc.d/init.d/crond status|grep -e running |wc -l
Zabbixサーバー側でcrondをアイテムに追加し、トリガーを設定します。
監視中の数十あるzabbix-agentにコツコツ追加すればいいんだろ?クソがぁ!