概要
下記にWEB上で公開されている
http://landing.google.com/sre/book/index.html
内容
- Table of Contents 目次
- Foreword 序文
- Preface 序文
Part I - Introduction
- Chapter 1 - Introduction 導入
- Chapter 2 - The Production Environment at Google, from the Viewpoint of an SRE
SRE視点からのGoogleの本番環境
Part II - Principles 原則
- Chapter 3 - Embracing Risk リスクを受け入れる
- Chapter 4 - Service Level Objectives サービスレベル目標
- Chapter 5 - Eliminating Toil 骨折り損をなくす
- Chapter 6 - Monitoring Distributed Systems 分散システムの監視
- Chapter 7 - The Evolution of Automation at Google グーグルにおける自動化の進化
- Chapter 8 - Release Engineering リリースエンジニアリング
- Chapter 9 - Simplicity シンプルさ
Part III - Practices 実践
- Chapter 10 - Practical Alerting 実践的な警告
- Chapter 11 - Being On-Call オンコールになる
- Chapter 12 - Effective Troubleshooting 効果的なトラブルシューティング
- Chapter 13 - Emergency Response 緊急対応
- Chapter 14 - Managing Incidents インシデントの管理
- Chapter 15 - Postmortem Culture: Learning from Failure 死後の文化:失敗から学ぶ
- Chapter 16 - Tracking Outages トラッキングの停止
- Chapter 17 - Testing for Reliability 信頼性のテスト
- Chapter 18 - Software Engineering in SRE SREにおけるソフトウェアエンジニアリング
- Chapter 19 - Load Balancing at the Frontend フロントエンドでの負荷分散
- Chapter 20 - Load Balancing in the Datacenter データセンターでの負荷分散
- Chapter 21 - Handling Overload 過負荷の処理
- Chapter 22 - Addressing Cascading Failures カスケード障害の解決
- Chapter 23 - Managing Critical State: Distributed Consensus for Reliability クリティカルステートの管理:信頼性のための分散コンセンサス
- Chapter 24 - Distributed Periodic Scheduling with Cron Cronによる分散型定期スケジュール
- Chapter 25 - Data Processing Pipelines データ処理パイプライン
- Chapter 26 - Data Integrity: What You Read Is What You Wrote データの完全性:あなたが読んだことはあなたが書いたものです
- Chapter 27 - Reliable Product Launches at Scale 信頼できる製品のスケールでのローンチ
Part IV - Management
- Chapter 28 - Accelerating SREs to On-Call and Beyond SREのオンコールへの加速と超越
- Chapter 29 - Dealing with Interrupts 割り込み処理
- Chapter 30 - Embedding an SRE to Recover from Operational Overload 運用の過負荷から回復するためのSREの組み込み
- Chapter 31 - Communication and Collaboration in SRE SREにおけるコミュニケーションとコラボレーション
- Chapter 32 - The Evolving SRE Engagement Model 進化するAREエンゲージメントモデル
Part V - Conclusions
- Chapter 33 - Lessons Learned from Other Industries 他の産業から学んだ教訓
- Chapter 34 - Conclusion 結論
付録
- Appendix A - Availability Table
- Appendix B - A Collection of Best Practices for Production Services
- Appendix C - Example Incident State Document
- Appendix D - Example Postmortem
- Appendix E - Launch Coordination Checklist
- Appendix F - Bibliography