概要
前回 Splunkで VMware環境を監視するためのセットアップ編 を書きましたので、ここでは利用編として、どんな事ができるのか見ていきたいと思います。
1) Splunk SAIとは?
その前に今回利用したのは Splunk App for Infrastructure (SAI) と呼ばれるアプリになります。これはログだけでなくメトリック情報も見やすくしたツールであり、オンプレやクラウド、コンテナなどマルチ環境に対応したアプリになります。
Splunkに無償でアプリを追加して利用できますが、VMware / AWS を利用する際には ITSI という追加ライセンスが必要になります。
ITSIは SAIだけでなく、機械学習を用いた予測や異常検知が行えたり、KPIベースでの監視が可能になったりするプレミアムサービスになります。
https://www.splunk.com/ja_jp/software/it-service-intelligence.html
今回は、VMware の監視に特化したいので ITSIの話は別の機会ということで。。
2) どんなデータが取り込めたか? Indexデータを確認してみる。
それでは、まずはいきなりSAIの画面に入る前に、 前回取り込んだデータがどんなものか確認してみたいと思います。
Index を確認してみると、以下の Index が自動的に作成されております。
vmware-perf-metrics は、 metric データなので、後回しにして他の4つを見てみます。
2-1) vmware-inv
vCenter APIとやりとりして、 inventory情報を取得したデータが保管されているようです。
VMware環境の全体像を知るには非常に重要な情報ですね。
vmware-inv に関連する sourcetypeをみると4つあります。
これは VMwareが提供している APIを利用してとってきているオブジェクトであり、これ以外のオブジェクトには対応していないので注意が必要です。
実際にどんなデータを取ってこれるのかは、こちらの vSphere API Referenceで確認できます。
左上の[Managed Object Types] をクリックして、沢山あるオブジェクトの中から対象のものを見つけてクリックすると、右側に確認できるFieldが表示されます。
2-2) vmware-taskevent
vCenter APIとやりとりして、VMware イベントとタスク情報を取得しているようです。
vCenter上での活動履歴などがわかるので、こちらも重要なデータとなりそうです。
vmware-taskevent に関連する sourcetypeを見ると、予想通り taskと eventの2つがありました。
[vmware:events]
INDEXED_EXTRACTIONS = JSON
KV_MODE = none
[vmware:tasks]
INDEXED_EXTRACTIONS = JSON
KV_MODE = none
ただし、今回の私の環境だと spath しないと field抽出できませんでした。このままだと少し問題あるので、以下のように local/props.confを新規作成しました。
[vmware:events]
DATETIME_CONFIG =
INDEXED_EXTRACTIONS = none
LINE_BREAKER = ([\r\n]+)
NO_BINARY_CHECK = true
disabled = false
KV_MODE = json
[vmware:tasks]
DATETIME_CONFIG =
INDEXED_EXTRACTIONS = none
LINE_BREAKER = ([\r\n]+)
NO_BINARY_CHECK = true
disabled = false
KV_MODE = json
以下のように spathなしで Fieldが抽出できていればOKです。
2-3) vmware-vclog
vCenter の syslog データを保管しております。
今回は TCP:514 で受信してますが、受け取った後にログの中身によってソースタイプを複数に分けております。
どういう振り分け方法かは、 props.conf と transforms.conf で確認できます。(詳細は省略させていただきます)
2-4) vmware-esxilog
ESXi ホストの syslogデータを保管しております。
こちらも vCenterと同じく、vmw-syslog で受け取ってから、ログの中身に応じて他の2つのソースタイプも適用されます。
2-5) ダッシュボードは?
SAIには、VMware用のダッシュボードがないので、上記のログから自分で作る必要があります。
3) SAI を触ってみる
お待たせしました。それではようやく、SAIが提供している画面をみてみましょう。
その前に、vCenterから取得したメトリックデータは、Indexの vmware-perf-metrics に格納されます。
メトリックデータは、利用できる SPLが通常と異なっており、限られた SPLを使う必要があります。
そこで SAIを使って、簡単にメトリックデータを扱うようにするのです。
3-1) Entity 画面
SAIのAppを開いて、一番左の「調査」画面を見ると、対象のvSphere のエンティティのリストと、それぞれ確認できるメトリック情報(Dimension)が確認できます。
対象のエンティティが増えてきたら、サーチでフィルターをかけてグループ作成しておくといいです。
3-2) Overview 画面
左側の CPUやメモリーなどを押すと、その他のメトリックなどが確認できます。
3-3) 分析画面
先ほどの画面は Overviewのため、さっと確認したいときに便利ですが、メトリック情報は他にも沢山あり、トラブル時などはこの情報だけではたりません。
そこで、上の方にある「分析」タブを開くと、他のメトリックや好きなメトリックを並べて確認することができます。
確認したいメトリックを並べて表示 ( cpu.usage , memory.consumed, datastore.totalReadLatency )
仮想マシン毎に比較
右の「分割基準」から、name を選択すると、仮想マシン名毎に表示してくれます。また topN 表示により、仮想マシン数が多くても制限して表示してくれます。
過去のデータと比較
複製された画面で、「タイムシフト」から比較したい過去の時間を選択します。
すると、過去のデータとグラフが重なり比較ができます。(色が薄くて見辛いですが、点線で過去データが表示されております)
時間指定 & 自動更新
ログデータと一緒に比較
下記のように、メトリックデータと一緒にイベントログの出力数を一緒に表示できます。表示されているイベントの種類はソースタイプになります。
さらに、ログのグラフの右上にある、「パネルの最大化」を押すと、実際のログの中身を表示できます。
トラブルシューティングの時などは非常に便利ですよね。
アラート作成、サーチ画面や、ダッシュボード保存、CSV保存、PNG保存 などなど
さらに、グラフの右上をクリックすると、他にも色々と機能があります。 おー、お腹いっぱい。
3-4) ダッシュボード
個別グラフをダッシュボードに追加できますし、まとめて追加も可能です。普段の運用でもみたいメトリックやイベントだけをみたい場合など便利です。
これにより、通常のダッシュボードにメトリック情報も含めて確認することが可能です。
3-5) アラート
最後に、アラート機能を紹介しておきます。
グラフの右上から、アラート設定ができましたが、実際のデータをみながら閾値などを設定したり、アラートアクションなどを選択できます。
アラートアクションは、「設定」画面で予め設定しておく必要があります。
4) その他
Setup編でもご紹介しましたが、OS内の情報は、今回のVMwareモジュールだけでは取れないので、別途OS上に UFなどを入れて取得する必要があります。メトリック情報もcollectdなどを使いSAIで管理できるため統合運用を試しては如何でしょうか?
こちらは Linux環境を SAIに取り込むための参考記事です。 (by saeoshi さん)
https://qiita.com/saeoshi/items/ba05da112b17ae893709
まとめ
VMware専用のダッシュボードがないため、従来の App for VMwareと比べると物足りなく感じますが、VMwareだけでなく、他のクラウド環境や OS/Appまで含めた統合管理ができると考えると非常に便利です。
またメトリック情報は通常のSplunkだと扱いにくいのですが、SAIだと簡単に可視化できていいですね。