はじめに
オライリーの「入門 監視 モダンなモニタリングのためのデザインパターン」を読んでみた。今回はその中の第Ⅰ部 監視の原則についての要約と感想を書きたい。
要約
第Ⅰ部 監視の原則の構成は1章監視のアンチパターン、2章監視のデザインパターン、3章アラート、オンコール、インシデント管理、4章統計入門となっている。
1章監視のアンチパターン
そもそもアンチパターンとは
「ソフトウエア開発が失敗に陥る際に多く見られる、間違ったソリューション(解決策)をパターンとして整理し、さらには失敗を避けるにはどうしたらいいのかを示してくれるもの」https://thinkit.co.jp/article/929/1
監視におけるよくない例を示している。
・ツール依存をしすぎてはいけない。
・監視とは他の仕組みと複雑と複雑に組み合わさった運用のため、全員がやるべき仕事であり、チームや部署内での役割ではない。
・監視するだけで壊れたものは直せない。
・手順書が単に手順を追って解決できるものであれば、その手順を自動化できないか検討すべき。
2章監視のデザインパターン
・リスクヘッジ等を考えて組み合わせ可能な監視の仕組みにした方が良い。
・ユーザー視点に立って監視の可視化を考える
・監視の仕組みを作るのではなくSaaSを使うことを考えるべき
・仕組みを作ったら終わりではなく、改善し続けよう
3章アラート、オンコール、インシデント管理
・効果的な監視システムの管理について言及されていた
4章統計入門
・ データに対してどんなアプローチが最適なのかを見つけるためには、統計分野で多くの作業が必要である。統計的手法を解説してあり、どのデータの場合うまく適用できるのかまとめてあった
詳しい内容については本を参照してください。
この本の主な対象者
入門とだけあって、「監視に興味がある人、多少監視の知識・経験はあるが体系的に学びたい人」におすすめ。
逆に監視に詳しい人はこんな事はすでに知っているという内容が大半だと思うので、上記の要約で特に読む必要がないと感じたら、ソフトウェアエンジニアのためのITインフラ監視[実践]入門など別の本がよいかもしれません。
まとめ
基本的に監視は複雑なシステムの塊なので、幅広い知識が必要で色々な人とコミュニケーションを取らなければいけない。監視というと狭い分野だと思われるが、全てのシステムで行われている運用であり、様々な可能性を考える必要があるとこの本を見て気づけた。
また監視頼みにしてシステム自体の変更を行わなかったり、一度監視体制を作成したら終わりではいけない。常にPDCAをして改善し続ける必要がある。
どのITの分野でも言えるかもしれないが、コミュニケーションやPDCAを回して改善することの大切さに改めて気付かせてくれる一冊であった。