New Relic Advent Calendar 2023 シリーズ3の25日目の記事です。メリークリスマス🎅
対象者
- 監視やオブザーバビリティのことはなんとなく知ってる
- 今まであまり監視に触れてこなかった
- なんとなく監視してる
わかること
- 監視とオブザーバビリティの違い
- なんちゃって監視の危険性
- New Relicで監視する時のポイント
監視とオブザーバビリティ
監視
システムにおいて特定または複数の視点であらかじめ想定された事象を検知し、通知すること。
オブザーバビリティ(可観測性)
システムの全容をどれくらい把握し、問題の予防や事象の根本原因を特定できるようにしているかを表す尺度。「O11y」と省略される。
監視は取り組みであり、オブザーバビリティを向上させるための1つの方法と言えるでしょう。
New Relic
New Relicはオブザーバビリティを向上させるための機能を揃えたプラットフォームサービスです。
概要はウェビナーのアーカイブ動画をご覧ください。
New Relic はじめの一歩
監視運用上の問題
監視の基本的な構築プロセスはざっくり以下のフローになるかと思います。
ここで以下の問題に直面することがあります。
上記は適当に作成したアラートをそのまま放置したり、対応ノウハウを蓄積・アウトプットしないことが原因で発生したと考えられます。
そのため
- 監視運用開始後、定期的にアラートの内容を見直すこと
- アラート内容に対応ノウハウを含めること
により問題を回避することができます。
New Relicでは Alert & AI で通知する内容をカスタマイズすることで対応できます。
- まずはアラートを作成・運用して対応ノウハウを蓄積していきましょう
- 最初から一般的な解決方法を通知内容に含めてもOK(ページリンク、生成AI)
- 次にアラートの対応方法を整理して通知内容に含めましょう
- 対応方法を記載したドキュメントのページリンクもOK
- アラートの対応方法を通知内容に含められないようであれば、アラートの削除かデータや閾値の見直しを検討しましょう
アラート通知内容のカスタマイズ及び任意の通知先に飛ばす方法
カスタムインシデント
AWS EventBridgeとの連携によるインシデント対応の効率化(架電編)
さいごに
今回はNew Relicを導入して実際に直面した問題を取り上げてみました。
すでに監視に携わっている、またはこれから監視を始める方のご参考になれば幸いです。