こんにちは!
今回はTencent Cloudの監視サービスである、CloudMonitorの検証を行いました。
システムを運用していく上で、必須のサービスにもなるので
設定方法、アラームの通知方法など、Cloud Monitorで出来ることをまとめてみました!
1.構成
Cloud Monitor(以下CM)の概要は、各項目の監視指標とユーザーがカスタマイズで設定した
レポート用の監視指標の表示や収集、アラームの設定が可能になっています。
ドキュメント:https://intl.cloud.tencent.com/products/cm
今回はCVMの死活監視を設定してみます。
2.設定方法
2.1 通知テンプレートの作成
「Cloud Monitor」→「Notification Template」→「Create」より通知テンプレートを作成します。
New Notification Templateの設定項目は以下の通りです。
項目 | 設定値 | |
---|---|---|
Basic Info | Template Name | テンプレート名 |
Notification Template | 以下より選択(複数選択可能) ・Alarm Trigger ・Alarm Recovery |
|
Notification Language | 以下より選択 ・Chinese ・English |
|
Notifications →User Notification |
Recipient Object | 以下より選択 ・User ・User Group ※新規で作成する場合はAdd User(Add User Group)を押下 |
Notification cycle | 通知を行う曜日を選択します | |
Notification Period | 通知期間を設定 | |
Receiving Channel | 以下より選択(複数選択可能) ・SMS |
|
Notifications →API Callback |
Notification cycle | 通知期間を設定 |
Notification Period | 通知期間を設定 | |
Notifications | Ship to CLS | 有効/無効 ※有効にした場合は、ログセットやログトピックを選択 |
2.2 アラームポリシーの作成
「Cloud Monitor」→「Alarm Configuration」→「Alarm Policy」→「Create」よりアラームポリシーを作成します。
※デフォルトでいくつかAlarmが設定されています。
Create Alarm Policyの設定項目は以下の通りです。
項目 | 設定値 | |
---|---|---|
Basic Info | Policy Name | ポリシー名を入力 |
Remarks | 備考 | |
Monitoring Type | 「Cloud product Monitoring」が固定値で設定されている | |
Policy Type | 「Cloud Load Balancer」や「NAT Gateway」などが選択可能 ※今回は「Cloud Virtual Machine」を選択 |
|
Project | プロジェクトを選択 | |
Alarm Policy | Alarm Object | 以下より選択 ・Instance ID ・Tag ・Instance Group ・All Objects |
Trigger Condition | 以下より選択 ・Select template ・Configure manually ※「Configure manually」を選択した場合は「Use preset trigger conditions」の有効 / 無効を選択 ※今回は「Configure manually」を選択し「Use preset trigger conditions」は無効 |
|
Metric Alarm | CPUやメモリの使用率など、メトリックス関連のアラートを選択 ※今回は利用しません |
|
Event Alarm | PingやNVMeなどのイベント関連のアラートを選択選択 ※今回は「PingUnreachable」を選択 |
|
Configure Alarm Notification | Notification Template | 通知テンプレートを選択 |
Advanced Configuration | Auto Scaling | 有効 / 無効 ※有効にした場合はオートスケーリングの設定を行います |
※MetricAlarmの種類
Basic CPU Usage
MemoryUtilization
MemoryUsage
DiskUtilization
DiskReadTraffic
DiskWriteTraffic
DiskIOAwait
PrivatePacketsIn
PrivatePacketsOut
PublicBandwidthIn
PublicBandwidthOut
PublicPacketsIn
PublicPacketsOut
PublicBandwidthUtilization
tcp current establish
PrivateBandwidthIn
PrivateBandwidthOut
CPULoadAvg1m
CPULoadAvg5m
CPULoadAvg15m
time_offset
※eventAlarmの種類
DiskReadonly
GuestCoreError
GuestOom
PingUnreachable
GuestReboot
PacketDroppedByQosWanOutBandwidth
PacketDroppedByQosConnectionSession
CVMNvmeDeviceError
GuestScheduledToRestart_HostMaintanance
GuestRestarted_HostFailure
3.動作確認
3.1 アラームの発生
監視対象に選択したCVMを停止し通知が行われることを確認します。
以下のようなアラートメールを受信しました。
3.2 復旧
停止したCVMを起動し復旧の通知が行われることを確認します。
以下のようなメールを受信しました。
4.その他
今回は、Cloud Monitorについて検証を行ってみました。
プロセス監視や外形監視などには対応していないため、独自で対応する必要があるものの基本的な監視については問題なく、実施できるかと思います!
また、最近はPrometheus、Grafanaをマネージドでサポートしているソリューションもリリースされたので、そちらも活用しながら運用していくことができます。
Prometheus:https://intl.cloud.tencent.com/jp/products/tmp
Grafana:https://intl.cloud.tencent.com/jp/products/tcmg
引き続き、Tencent Cloudの紹介を行っていきます!