はじめに
こんにちは!うるるの技術戦略課の古賀と申します!
今回はQiita Engineer Festa 2023の一環で、
SRE導入のモデルケースを作るために
うるる社内でSRE委員会を立ち上げたえんフォト事業部のエピソードと、
成功後である現在の委員会の活動について、ご紹介させていただきます。
SREを導入したくて勉強もしているけど、
日々忙しかったり、ビジネスサイドや、他の開発メンバーに対して、
「SREやろうぜ!」といっても中々踏み切れない方に対して、
この記事が参考になればと思います。
【この記事で取り扱うこと】
・「SRE委員会」の設立について
・どんなことを提案したか
【取り扱わないこと】
具体的なSREの実現方法、効果については、
えんフォトにSREを導入した経験と具体的な実践方法を大公開!!
をご覧ください。
委員会の設立経緯について
他社のSREと同じだと思いますが、
規模が大きくなったシステムはシステムの信頼性を向上させることが重要な課題となっています。
うるるでは、成熟してきたシステムが増えてきており、
立ち上げ段階のシステム開発とは違うシステム信頼性の向上を視野に入れた開発が必要なステージに当時はなっていました。
そこで。信頼性を向上させる一つの手段として、信頼性を維持する仕組みである、SREを用いていきたいと考えている
大きく分けて上記3点となります。
体制について
SRE委員会は、うるるのSREを推進すべく、
特定の部署に限らず、
うるるのSREを横串で推進すべく、集まった横断組織です。
私の所属する技術戦略課だけでなく、
当事者のえんフォト事業部、NJSS事業部などなど、
別々の部署からメンバーが集まっております!
なぜ「委員会」という形を取ったのか
SRE導入をよりスピーディーで効果的に行うためです。
えんフォト事業部のメンバーだけでなく、
他部署の知見のあるエンジニアや、VPoEも一丸となって効果的に進めることができ、
導入以降は、横串でSRE未導入の部署に導入できるようにすることが狙いです。
導入にあたって
SREを導入するにしても当然時間も運用する可視化ツールなどにお金もかかってくるので、
まずは委員会でプレゼンの資料を作成することにしました。
どんな観点から説得のための資料作りをしたのか、書いていこうと思います。
(内的な情報もあるため、具体的な内容は一部伏せさせて頂きます。)
[主にプレゼンした内容]
・まずSREってなに?(今回は割愛します)
・SREを推進する理由-なぜ今なのか、何を解決してくれるのか-
・こんな副次的な効果もあります!
・委員会活動をするうえでのお約束
SREを推進する理由-なぜ今なのか、何を解決してくれるのか-
・開発チームの規模感はちょうどいい。
・開発を進める中で技術負債と開発スピードのバランスが徐々に崩れている。
・サービス拡大につれて保守作業の量が増えて来ている。
(ここで当時メンバーに取った保守作業やトイルに関するアンケートを開示)
などなど、
当時のえんフォト事業部は成長フェイズだったため、
サービスの成長に伴って技術負債や保守作業・トイルの量が徐々に増えてきていました。
なので、サービスをこれからも成長させていくためには、
SREの導入が最適だと主張をしました。
なので、これからSREを導入していきたいと考えている方は、
なぜ今なのか、
やらないとこの先どうなるのか、
今現場はどんな状態なのか、
それらはどうやったら解決できるのか
を伝えることが大事だと思います。
また、
具体的にサービス品質が保証されていると、どのくらいビジネスへ影響を与えるか、
試算でも具体的に数字を見せると、より効果的です!
月間5分のダウンタイムによる平均ビジネス損失 = XXX円
月間20分のダウンタイムによる平均ビジネス損失 = XXX円
◯◯という保守作業を自動化することで、毎週新機能開発時間がXX時間確保できる。
などなど...
(まだまだありますが、開示できない情報も多いのでこのあたりで...)
こんな副次的な効果もあります!
例えば...
・SREの実現には多くの技術ノウハウが必要となるため、うるるの技術レベルも上がる。
(自動化に関する、サービス品質やセキュリティのコントロール)
・SREをテーマにして、記事、社外勉強会や外部イベント登壇する事で、
うるるの知名度、採用のしやすさにも繋がるでしょう
(まさに今やっていること)
などなど、SREはサービスの品質向上だけではないことを存分にアピールしました。
委員会活動をするうえでのお約束
①SREの導入と推進を目指すという、共有目的を持ったメンバーが自主的に活動している委員会です。
②本業務に影響を及ばされないように、上長の許可をとった上で活動をおこなっています。
要するに
本業に影響を与えないように頑張ります!
というお約束です。
現在の活動について
その後、
委員会の設立に至り、無事うるるにおけるSRE導入のモデルケースとなりました。
一定の成果を得ることができ、無事委員会存続中。
めでたしめでたし。
現在の活動としては、
・これからのうるるSREのさらなる発展のためには。
・最近のSREに関するトピックの報告・共有。
・未導入の部署へのサポート・質疑応答。
・導入ナレッジのまとめをすることで、スムーズに導入できるようにする。
・イベント参加による、うるるSREの広報。
などを行っております!
最後に
今回はQiita Engineer Festa 2023にてSRE委員会の紹介をさせていただきました。
もしお読みいただいた方の会社で、
別部署同士でも、「SREやりたいよね〜」なんて話が出ていたら
こういった形で実現してはいかがでしょうか。
少しでもこの記事がお役立ちできたら幸いでございます。