おことわり
そこかしこに汚い表現があります、ごめんなさい
先日、お腹の調子が悪い日がありまして
収まったと思って油断して外出したらビッグウェーブが来てひどい目にあいました
なんとかギリギリで間に合い事なきを得ました
そこで、最近サービスの可用性についていろいろ調べていたせいか
肛門は1回のミスも許されないから大変だなあなどと考えてしまいました
(人体にはもっとエラーが許されない器官がたくさんありますが…)
そこで(?)、今回は肛門のSLI/SLOを定義してみようと思います
サービスに求められるもの
本来であれば違うんでしょうけど、この流れなので
うんこを漏らさない
これが肛門というサービスに求められるものとします
「うんこを漏らす」とは
これは考え方が分かれると思います
- トイレ以外で出すこと
- 草むらに駆け込むのはアウト
- 自分の意志に反して出ること
- 草むらに駆け込むのはセーフ
- でも諦めるのはアウトなのでは
- 特殊な例外の考慮
- 漏れるのを覚悟でバラムツを食べた
このあたりが考慮事項として挙げられます
草むらNGなどの要件は肛門のユーザーによって変わってくると思います
ただし草むらをNGとすると、草むらチャンスがあってもひたすらトイレを目指すことになり、大惨事に発展する可能性がありますので、慎重に話し合いをすべきです
インシデントに重みを付けて草むらは点数を軽く…などとする考えもあるかもしれませんが、SLI定義はシンプルに保つべき(SRE本より)ですのであまり良くないでし__
今回は一番シンプルな「トイレ以外で出すこと」を「うんこを漏らす」の定義とします
つまり、私の肛門に求められることは、__トイレ以外でうんこを出さないこと__です
計測方法
うんこを漏らさない率を測定するために、計測する単位を決めましょう
- デイリー
- 1日を単位として、何日うんこを漏らさなかったかを計測します
- 1日に複数回漏らした場合の考慮ができなく、1回漏らしたらその日はいくら漏らしてもサービス稼働率が下がることはないので注意が必要です
- 時間
- デイリーの弱点を補うため、うんこを漏らしている時間で計測します
- 漏らしてから処理が終わるまでの時間、ということになるでしょか
- しかしそれは「肛門の稼働」から離れているような気がします
- 時間の長短で漏らしたダメージがそこまで増減するのか、という疑問もあります
- 機会
- 防御機会に対するセーブ成功率、と考えるのは良さそうな気がしますが、その場合は「防御機会」を定義する必要がありそうです
- お腹がグルっとしてヤバい、となったのを1回とするパターン
- 一般的な肛門の危機は、小さな波や大きな波が複数押し寄せて、それを耐えてトイレ到着で解決。というのが一連の流れになるので、そのひとまとまりを1回とするパターン
- これは例外が結構ありそうです
- 防御機会に対するセーブ成功率、と考えるのは良さそうな気がしますが、その場合は「防御機会」を定義する必要がありそうです
今回は一番シンプルなデイリーにしようと思います
1日に複数回漏らした場合はどうするの、という部分は残したままですが、毒を食らわば皿までの精神で(?)
SLO
目標値はどうしましょう
そりゃあ100%でしょう…と言いたいでしょうけど、100%は目指すなとSRE本に書いてあったので考えてみましょう
単位が1日なのでかなりざっくりとした値になります
- 100日に1回漏らす = 99/100 = 99%
- 1年に1回漏らす = 364/365 ≒ 99.72%
- 2年に1回漏らす = 769/770 ≒ 99.87%
- 3年に1回漏らす = 1094/1095 ≒ 99.91%
うーん、1年に1回が妥当なところですかね
3年に1回はちょっと厳しい気がしますし、100日に1回は漏らしすぎな気がします
これは私の個人的な感覚によるものです、各々体質もあるでしょうし
冒頭では1回でも許されないと言いましたが…
ところで2年を超えてくるともうほとんどパーセンテージ変わらないんですね
私の肛門のSLI/SLO
トイレ以外でうんこを出してしまう日を1年で1回に抑える
1回漏らしてもらったらその後1年は絶対に漏らさないように対策をし、危ない橋は絶対に渡りません
逆に、本来のSLOの考え方で行くと、1年に1回は出してもいい(エラーバジェット)、ということになります
直近1年うんこ漏らしてないからちょっとお腹の調子悪くてもガンガン電車に乗ってこ!という考え方です
いやー、それはさすがにちょっとないですね、すいません
ほんとに
すいませんでした