5
7

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

SRE本まとめ(4章 SLO)

Last updated at Posted at 2017-10-01

自分の理解を深めるためにまとめてみました。3章の続きです。

4章 SLO

用語

  • SLI:指標。例:リクエストのレイテンシ、エラー率、システムスループット、可用性。
  • SLO:目標。
  • SLA:アグリーメント。契約に関する話なのでSLAの取り決めのSREが直接関わることはない。ただSLO違反のSLAにならないようにSREがチェックしたほうがいい。

SLI

  • サーバーシステム:可用性、レイテンシ、スループット
  • ストレージシステム:レイテンシ、可用性、耐久性
  • ビッグデータシステム:スループット、レイテンシ

全てのシステムで正確性は重要。

収集

サーバサイドでやるのが通常だが、クライアントサイドでやらないといけにあケースもある。

集計

平均値を取ってしまうと重要な細部をぼかしてしまう可能性があるため、分布を取る方がよい。パーセンタイルをみてみるのもよい。

SLO

ターゲットの選択

  • 現在のパフォーマンスに基づいてターゲットを選択してはならない
  • シンプルさを保つ
  • 「絶対」は避ける
  • SLOは最小限にとどめる
  • 最初から完璧でなくてもよい

期待の設定

  • 安全マージンを確保する:対外的なSLOと内部的なSLOの間にマージンを置くことで、メンテナンスのためのバッファが確保できる。
  • 過剰達成を避ける:意図的にメンテンナンスを設けることもあり。

5章に続く)

5
7
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
7

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?