はじめに
このシリーズでは、IBM CloudのBere Metal Servers for VPC上に構成されたVMware vSphereの環境をZabbixで監視する方法について複数の記事に分けて紹介しています。
- IBM CloudのBare Metal Servers for VPC上に構成されたVMware vSphere環境をZabbixで監視する(環境構築編)
- IBM CloudのBare Metal Servers for VPC上に構成されたVMware vSphere環境をZabbixで監視する(テンプレート編) -> この記事
- IBM CloudのBare Metal Servers for VPC上に構成されたVMware vSphere環境をZabbixで監視する(SNMP Trap編)
- IBM CloudのBare Metal Servers for VPC上に構成されたVMware vSphere環境をZabbixで監視する(SSHチェック編)
この記事では、監視方法の検討や考慮点、Zabbixでのテンプレート適用における設定方法について書いていきます。
Zabbixでの監視方法
Zabbixでは、監視対象であるデバイスのことを「ホスト」と呼び、様々な方法を用いてホストからデータを収集することができます。また、ホストから収集する個々の監視メトリックのことを「アイテム」と呼び、ホストにアイテムを追加することで実際の監視データが収集されます。
アイテムには18種類のデータ収集方法が用意されています。エージェントをホストにインストールするだけではなく、例えばホストからのSNMP Trapを受信したり、IPMIからハードウェア情報を確認したり、SSH接続を確立してコマンドを定期実行したり、特定のURLにリクエストを送信したりすることで様々なメトリックを収集することが可能です。かなり自由度の高い設計が可能であるため、監視を実施する前に、サービスを継続するためにはどのような項目を監視する必要があり、障害を検知した場合にどのようなプロセスで対応するかといった要件定義を適切に行う必要があると思います。
監視対象
今回はホストとしてESXiとvCenter Server Applianceを対象としています。また、上記で記載したような詳細な要件定義は行っていません。 このシリーズでは、それぞれの方法でESXiとvCSAからどのようなデータを取得することができるかを確認し、IBM Cloudを実運用する上で必要となる監視項目と、その取得方法を検討することをゴールとしたいと思います。
監視の実施
ではZabbixで環境を監視していきます。個別にアイテムを設定する前にまずはZabbixで用意されているテンプレートを適用することを検討します。
vSphere上のVMとして稼働しているLinuxやWindows等の通常のサーバーを監視対象とする場合、Zabbix Agentの導入を最初に考えることが一般的だと思います。しかし今回は監視対象がESXiとvCenterであるため、エージェントの導入はサポートされていません。
テンプレートの適用
Zabbixにはテンプレートという概念があります。複数のアイテムやトリガー、グラフ等の監視設定がセットになったもので、ホストに適用することで複数のホストの監視設定を一元的に管理することが可能となります。
テンプレートは自分自身で新規作成することも可能ですが、Zabbix側であらかじめ用意されているテンプレートを活用することができます。ZabbixのUIで「設定」->「テンプレート」からテンプレートの一覧を確認することができます。VMware環境に適用することのできるテンプレートには下記のようなものがあります。
「VMware Guest」はvSphere上の仮想マシンに、「VMware Hypervisor」はESXiに適用するためのテンプレートです。(後述しますが、実際はこの2つのテンプレートは手動で適用することはしません。)また、「VMware」テンプレートにはディスカバリルールが含まれており、テンプレートを適用することで自動的にESXiとESXi上の仮想マシンを検出し、ホストとして追加してくれます。
Zabbix Serverの設定ファイルの変更
テンプレートを適用する前に、Zabbix側でVMwareの監視を実施するように設定ファイルを変更する必要があります。/usr/local/etc/zabbix_server.conf
を開き、VMware Collectorsの値を変更します。
### Option: StartVMwareCollectors
# Number of pre-forked vmware collector instances.
#
# Mandatory: no
# Range: 0-250
# Default:
StartVMwareCollectors=2
VMware Collectorsの数については監視対象のVMwareサービスの数に依存します。下記を参考にしてください。
変更後にZabbix Serverを再起動します。
vSphere環境の監視を実施するにはZabbixでlibcurlとlibxml2モジュールが有効化されている必要があります。libcurlとlibxml2をサーバーにインストールし、Zabbixをコンパイルする際に--with-libcurl
と--with-libxml2
オプションを付与してください。
VMwareテンプレートの適用
テンプレートを適用するためのホストを作成し、そのホストにテンプレートを適用します。
手順については下記の記事を参考にしました。
Zabbixのメニューから「設定」->「ホスト」を選択します。
このホストは特定のデバイスではなく、VMware vSphereサービス全体を対象としているため、ホスト名には「VMware vSphere」等と入力します。また、テンプレートとして「Templates」ホストグループの中の「VMware」テンプレートを選択し、グループを「VMware」に設定します。
インターフェースに関しては「追加」->「エージェント」と選択して1つ追加し、デフォルトの設定のままで問題ありません。
「マクロ」タブで「継承したマクロとホストマクロ」を選択します。それぞれの項目に対して「変更」をクリックし、下記のように値を変更します。
- {$VMWARE.PASSWORD} → vCenterのログインパスワード
- {$VMWARE.URL} → vCenterのSDK URL(
https://<vCenter_IP_or_FQDN>/sdk
) - {$VMWARE.USERNAME} → vCenterのログインユーザ
入力が完了したら「追加」をクリックし、ホストを追加します。ディスカバリールールの監視間隔が1時間になっているため、各ホストの検出には最大1時間かかります。
正しくホストが検出されると、ESXiやその上の仮想マシンがホストに自動的に登録されます。
監視項目の詳細
検出されたホストにおいて、どのような項目が監視される設定となっているか確認していきます。
ESXi
まずはESXiに関して、前述した通りVMware Hypervisorというテンプレートが自動的に適用されています。「アイテム」から監視メトリックを確認することができます。
クラスターやデータセンターの名称、サーバーのモデルといった構成に関する概要レベルの情報から、CPUやメモリの使用率やpingによる死活監視といったリソースの状況まで、様々な項目を取得することができています。
Overall statusではESXiのステータスを監視しています。ESXiのアラームと連動してGreen、Yellow、Redの3段階で状態を確認することができ、ホストの大まかな状態を把握することができます。
また、Hypervisor pingは定期的にpingを実行するいわゆる死活監視をおこなっています。トリガーが設定されており、ホストにpingが到達しなかった場合にトリガーが発射されるように設定されています。
Get sensorsというアイテムではセンサーデータを監視できるようですが、VMwareではセンサーデータをIPMIから取得しており、かつIBM CloudのBMS for VPCではIPMIへの通信が許可されていないため、情報は表示されていません。
また、これらのアイテムは全てVMwareのvSphere APIに対するシンプルチェックを用いて監視が行われており、エージェントを導入することなく監視を実施しています。
vCenter Server Appliance
続いて、vCenterに対してどのような項目が設定されているか確認します。vCenterにはVMware Guestという仮想マシン用のテンプレートが適用されています。
vCenterでは、より多くの種類の監視メトリックが定義されています。ESXiと同様の情報に加えて、Network Interfaceに対するパケットの送受信量やハードディスクに対する読み書きのリクエスト数、ファイルシステムの空き容量などといった統計情報を確認することができます。
テンプレートの適用により監視できる項目
以上より、テンプレートの適用によって主に リソースの使用状況を監視できる ことがわかりました。 ESXiのステータスの監視 やシンプルな 死活監視 は実施されていますが、実運用を考慮すると障害の発生箇所を特定するためにより詳細な項目が監視できると良いと感じました。
あとがき
今回は監視を始めるにあたって、vSphere環境全体を検出することのできるテンプレートを適用しました。次回はより詳細なデータを取得することのできそうなSNMP Trapによる監視を実施します。
次の記事はこちら