#SNMP非対応の御家庭向け機器を可視化したい
逸般のご家庭ではSNMPに対応したルーターを使う事が多いとおもいますが、
残念ながらわが家で利用しているASUSのWiFiルーターRT-AC87UはSNMPに対応していません。
でもやっぱりZabbixマスターとしては、ネットワーク機器は可視化したいですよね!
幸いな事にASUS RT-AC87U はSSHログインに対応しています。
そして、起動logを見る限りBusyboxで動作しています。
となれば、使うしか無いじゃないですか! ZabbixのSSHエージェントを!
ということで、Zabbix ssh エージェントでネットワーク機器のリソース情報を可視化した方法をお伝えします。
#SSHエージェント
ZabixにはSSHエージェントという機能があります。
Agentが導入できないSNMPにも対応していないというような機器に対して、SSHで実際にログインをして、指定されたコマンドの結果を取得してくる機能がSSHエージェントの役割です。
設定項目
アイテム名:任意
アイテムタイプ:SSHエージェント
アイテムキー:ssh.run[任意の一意文字列]
認証方式:パスワード認証か公開鍵認証かを選択
ユーザー名:ssh ユーザー名
パスワード:パスワード認証方式の場合に入力
秘密鍵ファイル:公開鍵認証方式の場合にzabbix_server.confのSSHKeyLocation= に指定されたディレクトリ内の秘密鍵ファイル名を入力
公開鍵ファイル:公開鍵認証方式の場合にzabbix_server.confのSSHKeyLocation= に指定されたディレクトリ内の公開鍵ファイル名を入力
パスフレーズ:秘密鍵にパスフレーズが設定されている場合に入力
実行するスクリプト:ログイン後に実行するコマンドを入力します。
##実際の設定
今回はRT-AC87Uに合わせてパスワード方式を選択しテンプレートを公開しても良いように、ID/PWは直接入力せずに、テンプレートマクロとして設定を行いました。
スクリプトは10秒毎にtopコマンドを実行し、その結果をテキスト形式で取得しています。
今回はこのテキスト形式で取得してきているのが肝だったりします。
#値の前処理と依存アイテム
SSHコマンドは対象に対象に対してログインを行うためあまり頻繁に実施したくはありません。
そこで、今回の監視では10秒毎に1回ログインをしてTOPコマンドの結果を取得しそのデータをパースして各種データを可視化するようにしています。
これが依存アイテムの役割になります。
##値の前処理
TOPコマンドでは以下のような結果が返ってきます。
このままでは値を取り出しにくいので値の前処理でCPU使用率の行だけを取り出しています。
Zabbix 3.4 以降では値の前処理として正規表現が利用できるようになっています。
このためわざわざawk等でスクリプトのワンライナーを書かなくても、Zabbix上で簡単に値を取り出す事ができるようになりました。
正規表現でCPU:.*
を指定してCPU使用率の行だけを取り出します。
値の前処理でTOPコマンドの結果からCPU使用率のデータだけを取り出すことができました。
そして、このTOPコマンドの結果は依存アイテムの処理に利用するだけですので、
ヒストリの保存期間をヒストリを保存しない
に設定しています。
これにより中間の文字列データをDBに保存しないため、無駄な保存容量の消費を避ける事ができます。
##依存アイテム
取得してきた別のアイテムの値をパースして個別のアイテムとして保存する機能を依存アイテムといいます。
先ほどのTOPコマンドを結果を取得していくるSSHエージェントアイテムをマスターアイテムとして、そこからidleやsystem など個別のCPU使用率を取得するアイテムを依存アイテムとして作成します。
###設定項目
アイテム名:任意
アイテムタイプ:依存アイテム
アイテムキー:任意の文字列
マスターアイテム:既存のアイテムを選択します。
###値の前処理
マスターアイテムを選択するだけでは、同じ内容をコピーしてデータ型や単位を変えるだけになってしまいますので、値をパースするためにここでも値の前処理を設定します。
複雑な正規表現を書ける人であれば1つの正規表現にまとめる事も可能かもしれませんが、
Zabbixの値の前処理では処理を多段で実行することができるため1つ1つは単純な処理としてそれを繰り返すことで、複雑化させずに設定をシンプルにすることができます。
この正規表現では1つめの処理でidle
の文字列を含む値をパースし
2つめの正規表現で数値だけを取り出す処理を行っています。
#結果
1つのマスターアイテムから複数の依存アイテムを作成することができるので、TOPコマンドの結果から7項目のCPU使用率アイテムを生成することができました。
値さえ取得できればあとはAgentによるサーバー監視やSNMPによる機器監視と同じなので
CPU使用率やCPUとPing性能の複合グラフを作成して性能を可視化することができるようになります。
#まとめ
SSHエージェントと依存アイテム、値の前処理を組み合わせることでSNMPに対応していない一般の御家庭向けWiFiルーターでもルーター負荷を可視化することができるようになりました。
インターネットがなんとなく遅いなというときに実は帯域の問題ではなくルーターのCPUがいっぱいになりパケ詰まりを起こしているなどを判断する事ができるようになります。
これで回線契約を見直す前にルーターを新しくしようという判断ができるようになります。
適切なサービスや製品を選ぶためにも自宅Zabbixは有効ですね。
ASUSルーターをご利用の方はSampleとしてこのテンプレートをご利用いただけます。
https://share.zabbix.com/network_devices/asus-rt-ac87u