tl;dr
- DataDog Advent Calendar 2023の3日目の記事です
- 難しいことは他の人がやってくれると思うので、せっかくのアドカレを初学者の人にも楽しんでもらいたく、簡単なことを書くことにしました
- 組織で DataDog を活用していて利用者が増えると、管理されていない監視リソースが増えます
- なので、いずれ整理が必要になると思います
- 個人的にこの整理を治安維持活動と名付けていて、通常時運用における改善活動の一環として、具体的な作業内容、方法の確立と知見の言語化をすすめています
- というわけで Monitor Summary Widget をダッシュボードに置いておきましょう
Monitor Summary Widget とは
- モニターの概要を表示するウィジェットです
- ダッシュボードではウィジェットリストの下のほうにあります
- ノートブックでは表示できません(SLO Summary は表示できるのにね)
- OK 以外のステータスのモニターを正していくことで治安維持に繋がります
- Monitors ページのこの部分と一致するべきだと思うんだけど、トリガーの状態によって常に変化するので必ずしも一致、とはいかないらしい(サマリーだしね)
- じゃあ Monitors ページ見たほうがいいじゃん?って言われたらそれはそう(それはそれこれはこれ)
設定
- 画像のように設定しておくと見やすいです
治安維持活動メモ
- OK 以外のステータスのモニターを確認して必要な措置をとる(通常の監視運用)
- 単一のインスタンスやリソースを確認しているようなモニターを改善する(高度な監視設計)
- モニターの優先度、閾値、通知先、担当者などを確認してコード化を推進する(IaC)
- 活用されていないモニターの削除は積極的に行う
まとめ
- というわけで Monitor Summary Widget をダッシュボードに置いておきましょう