IaCを入れてみたけど、リリースのたびにまだ何か起きる。インフラをコードで管理しているはずなのに、担当者しか触れない。
ツールを変えただけでは、運用の本質的な問題は解決しません。
本書は、AWS CDKの使い方を教えるだけでなく、なぜリリース事故が起きるのか・障害対応が遅れるのかという根本に向き合い、実例を通じて改善の道筋を示しています。
AWS CDK入門――IaCによる安全・効率的なWebアプリ運用
失敗事例から始まる構成が刺さる
本書の特徴は、「よかった話」から入らないことです。本番リリース時に問題が起きるのはなぜか、ECS構築でどんなトラブルが待っているか、AWSの設定構築の落とし穴はどこにあるか——こういった現実から始まるので、読み始めてすぐに「自分の話だ」と感じやすいです。
第2章でCDKの導入による問題解決に入るまでに、現状の課題が丁寧に掘り下げられているため、CDKを「なぜ使うか」の理解が先に固まります。
運用改善の視野が広がる内容
障害対応の遅れを防ぐためのログ分析の使い方、アラートのオオカミ少年問題とアラート設計の基本、属人化を生む構造と暗黙知を減らすアプローチ、ポストモーテムの実施方法——SREや運用担当が日常的に直面する問題が、CDKによる構成管理の話と並走する形で展開されます。
また、CDKコードの育て方・アンチパターン、CloudFormationのサービス仕様の制約、ISO/IEC 27017対応といった踏み込んだ内容まであり、長く参照できる一冊になっています。
運用を任されている人が変われたこと
- 「テストが通ったのになぜ本番で落ちるのか」に答えられるようになり、次のリリース準備の粒度が変わった
- アラートが無視される状態を「オオカミ少年問題」として整理できたことで、チームへの改善提案がしやすくなった
- ポストモーテムの章は、事後対応を責任追及でなく改善の記録にするための具体的な進め方があり、即使えた
- CDKのアンチパターンを先に知れたことで、後になって大きなリファクタリングが必要になるコードを書かずに済んだ
- ISO/IEC 27017対応の章で、セキュリティ規格とIaCの利便性をどう両立するかという視点が得られた
「使えるIaC」を目指す人に
CDKの文法よりも、CDKで何を解決するかを先に理解したい方に向いた一冊です。SREや運用担当として、リリースや障害対応の属人化に課題を感じているなら、ぜひ手元で実際の運用と照らし合わせながら読み進めてみてください。読み終えた後、何から手をつけるかが見えてくるはずです。
AWS上のIaCをTerraformで検討している方には、こちらも合わせてどうぞ。
Terraformを雰囲気で触っている段階から、チームで運用できるIaCへ進みたい人の入門書