LoginSignup
0
0

More than 1 year has passed since last update.

cloud monitoring でlogを監視する方法

Posted at

はじめに

業務でcloud monitoringを使うようになり、見よう見まねで進めていたらハマったので、
ここでまとめようかと思います。
こちらの記事で紹介するのは、cloud loggningからの指標をcloud monitoringで監視、アラートする内容になります。

cloud monitoringとは

クラウドサービスのインフラストラクチャリソースやアプリケーションのパフォーマンスを監視する Google Cloud の監視ツールのサービスになります。

リソースを監視することで、トラブルシューティングやパフォーマンスを向上させるために設計されており、カスタム指標、分析情報、アラート通知、稼働時間チェック、カスタム ダッシュボードなど様々な方法でリソース監視の設定をすることができます。

私は上記で、アラート通知の設定をしました。

アラート通知

今回はcloud loggningからの指標を取ってくるので、loggingでの指標作成を行います。

指標作成手順

  1. GCP>logging>ログベースの指標>指標の作成
  2. 指標タイプはCounterを選択
    1. Counterは対象ログをカウントする
    2. Distributionは対象ログの発生率を見る
  3. 詳細の設定
    1. nameを指定する(required)
    2. 指標の説明を入れる(任意)
    3. 単位はメトリック値が報告される単位を設定(任意)
      1. 参考
  4. 対象のログを抽出する際のフィルタを指定
    1. 参考
  5. 指標を作成

アラートポリシー作成手順

  1. monitoring>アラート>create policy
  2. new conditionで先ほど作成した指標を選択
    1. ローリングウィンドウは監視時間の間隔を指定する
    2. ローリングウィンドウ関数は検知されたログの計算方法を指定する
      1. 例:ローリングウィンドウ5分、関数sum >>> 5分間に検知されたログの件数の合計値
  3. トリガーの設定を行う
    1. condition typeを指定する
      1. thresholdは閾値を設定が設定でき、それを超えると発火する
        1. 例:閾値5で、5分間に検知されたログの件数の合計値が5件を超えた場合検知
      2. metric absenceはログの不在を検知でき、それを超えると発火する
        1. 例:不在5分で、5分間に検知されたログの件数の合計値が0件だった場合検知
  4. 通知と名前は任意のものをつける
  5. ポリシーの作成

※複数条件のアラートポリシーを作成したい場合は、add alert conditionボタンで指標を増やす
複数条件の例:条件Aのログが5件を超え、条件Bのログが0件だった場合は発火

上記でも実現できなそうな条件のアラートポリシーを作成したい場合、MQL
を試してみるのも良いかもしれません。
参考

まとめ

今回はcloud loggingとcloud monitoringを使用したアラートポリシーの作成方法について、
紹介させていただきました。
GCPで使用中のリソースが増えるにつれて全体の管理が難しく、アラートポリシーの必要性が増してくるなと感じました。
バグの発生おきにログを追っている方などは、アラートを取り入れるのも悪くないかもしてません。

参考文献

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0