LoginSignup
0
2

More than 5 years have passed since last update.

Site Reliability Engineering(SRE)を読む

Last updated at Posted at 2017-02-13

概要

下記にWEB上で公開されている
http://landing.google.com/sre/book/index.html

内容

  • Table of Contents 目次
  • Foreword 序文
  • Preface 序文

Part I - Introduction

  • Chapter 1 - Introduction 導入
  • Chapter 2 - The Production Environment at Google, from the Viewpoint of an SRE
    SRE視点からのGoogleの本番環境

Part II - Principles 原則

  • Chapter 3 - Embracing Risk リスクを受け入れる
  • Chapter 4 - Service Level Objectives サービスレベル目標
  • Chapter 5 - Eliminating Toil 骨折り損をなくす
  • Chapter 6 - Monitoring Distributed Systems 分散システムの監視
  • Chapter 7 - The Evolution of Automation at Google グーグルにおける自動化の進化
  • Chapter 8 - Release Engineering リリースエンジニアリング
  • Chapter 9 - Simplicity シンプルさ

Part III - Practices 実践

  • Chapter 10 - Practical Alerting 実践的な警告
  • Chapter 11 - Being On-Call オンコールになる
  • Chapter 12 - Effective Troubleshooting 効果的なトラブルシューティング
  • Chapter 13 - Emergency Response 緊急対応
  • Chapter 14 - Managing Incidents インシデントの管理
  • Chapter 15 - Postmortem Culture: Learning from Failure 死後の文化:失敗から学ぶ
  • Chapter 16 - Tracking Outages トラッキングの停止
  • Chapter 17 - Testing for Reliability 信頼性のテスト
  • Chapter 18 - Software Engineering in SRE SREにおけるソフトウェアエンジニアリング
  • Chapter 19 - Load Balancing at the Frontend フロントエンドでの負荷分散
  • Chapter 20 - Load Balancing in the Datacenter データセンターでの負荷分散
  • Chapter 21 - Handling Overload 過負荷の処理
  • Chapter 22 - Addressing Cascading Failures カスケード障害の解決
  • Chapter 23 - Managing Critical State: Distributed Consensus for Reliability クリティカルステートの管理:信頼性のための分散コンセンサス
  • Chapter 24 - Distributed Periodic Scheduling with Cron Cronによる分散型定期スケジュール
  • Chapter 25 - Data Processing Pipelines データ処理パイプライン
  • Chapter 26 - Data Integrity: What You Read Is What You Wrote データの完全性:あなたが読んだことはあなたが書いたものです
  • Chapter 27 - Reliable Product Launches at Scale 信頼できる製品のスケールでのローンチ

Part IV - Management

  • Chapter 28 - Accelerating SREs to On-Call and Beyond SREのオンコールへの加速と超越
  • Chapter 29 - Dealing with Interrupts 割り込み処理
  • Chapter 30 - Embedding an SRE to Recover from Operational Overload 運用の過負荷から回復するためのSREの組み込み
  • Chapter 31 - Communication and Collaboration in SRE SREにおけるコミュニケーションとコラボレーション
  • Chapter 32 - The Evolving SRE Engagement Model 進化するAREエンゲージメントモデル

Part V - Conclusions

  • Chapter 33 - Lessons Learned from Other Industries 他の産業から学んだ教訓
  • Chapter 34 - Conclusion 結論

付録

  • Appendix A - Availability Table
  • Appendix B - A Collection of Best Practices for Production Services
  • Appendix C - Example Incident State Document
  • Appendix D - Example Postmortem
  • Appendix E - Launch Coordination Checklist
  • Appendix F - Bibliography
0
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
2