こんにちは。もともとはフロントエンドをやってましたが、最近はSREに足を踏み入れたとよしーです。
以前、ポストモーテムはじめてみたという記事を書きましたが、
恥ずかしながらまだまだSREがどういうマインドで、どういうことをやっていくのか不明瞭な状態です。
そんな状況なので少しでもSREとはなんなのかを明らかにするために、
SRE関連の文献をチームで輪読会をしようと企画しました。
なぜ輪読会をやるのか?
端的に背景を伝えると、SREの知識がほとんどない状態で、チームでSREの役割を担うことになったからです。
「SRE」といっても、メンバーそれぞれが思い描いているイメージが違うとやるべきことがまとまらない可能性があります。
また、SREのプラクティスだけを真似ても良い動きができるわけではなさそうと思い、原則をチーム全体でインプットした方が今後やるべきことが見えやすくなるのでは...と仮説を立てたのもあります。
何を読むのか?
SREエンタープライズロードマップ - Google - Site Reliability Engineering
を読んでいます。
全部で64ページと軽量な文献なので、なるべく短い時間でSREについての学習と共通認識をもたせられそうと考え、こちらを選びました。
やり方
1時間で1章ごとのペースで読み進めています。
1ブロックごとにメンバーを交代して読んでいくようにしています。
また、1ブロックごとに
- このブロックの内容の要約
- 感想・気になる点があるか
をメンバーに問いかけつつ、Miroでボードに付箋を貼っていきました。
やってみてどうだったか?
(1)
読み進めつつ1ブロックごとにメンバー同士で対話を行ったので、
SREとは何なのかがパズルのピースのように理解が進みました。
また、自分達の現状の組織とあてはめて、SREらしい動きができている or アンチパターンに陥っていることも客観視できたことは良い点でした。
(2)
横文字が多いかつ日本語訳の文章なので「なるほどわからん」となる部分もあったが、
原文と読み比べると伝えたいことがわかるシーンがありました。
理解するのに時間がかかったときは、原文と読み比べることも選択肢にいれよう。
(3)
やってみてからひとつ懸念し始めたことは、SREについて知ることで「自分はSREでやりたいことはない」というメンバーが出てくるかもしれないことです。
有志で集まったチームではないので、そうなった場合チームのあり方を考える必要がありそうです。
ここらへんはTeam Topologiesなども参考にしつつ、組織にあったSREのあり方を探求していく柔軟な姿勢で臨みたいと思います。