PagerDuty Advent Calendarの8日目!
今日はOps Guidesのお話です。
うちはこうだけど、他はどうやってるんだろう?
普段から運用に関わっていると、ふとした瞬間に「そういえば他の会社ではどういう運用をやっているんだろう?」と気になること、ありませんか?
そのきっかけは「本当になんとなく」といったものから「上手くいかない運用にフラストレーションが溜まって」というどす黒いものまで色々あると思いますが、いずれにせよ「他の会社の良いところを取り入れて、自分たちの運用を改善したい」という気持ちから来ているのは間違いないでしょう。
だからこそ、いろんなミートアップに参加して発表を聞いたり、懇親会で話してみたり、Xに垂れ流されているいろんなポストを読んで事例を学ぶわけです。
ベストプラクティスを学びたい!
このような取り組みはとても良いことですし、是非とも継続して情報収集してもらいなと思います。ただ一方、時間効率の観点ではあまり効率がよくありません。情報収集は大事なんだけど、本当に運用で切羽詰まっているときにそれをやるのは難しい。
でも、情報収集できないから運用の改善ができず、ずっと忙しいまま・・・ジレンマですね。
そんなときに役立つのが、「ベストプラクティス」です。実績に裏付けされた、よく整理され体系化された考え方を学ぶことで、効率よくノウハウを吸収することができます。「巨人の肩の上に立つ」とも形容されますね。
普段から忙しい、運用に携わる方全員に対してPagerDutyが提供したい「巨人の肩の上に立つ方法」 それが、Ops Guidesなのです。
Ops Guidesとは
Ops Guidesとは、PagerDutyが公開している、リアルタイム運用のベストプラクティスです。
長年にわたりPagerDutyがシステム運用していく中で得られた知見。それらがPagerDuty社内にはたくさん蓄えられています。これを整理して公開しているものが、このOps Guidesです。
2023年現在、以下の12のガイドが公開されています。
- Incident Response
- Full Service Ownership
- Auto Remediation
- Best Practices for On Call Teams
- Postmortems
- Retrospectives
- Operational Reviews
- DevSecOps
- Security Training
- Internal Stakeholder Communications
- Customer Service Operations
- Business Incident Response
いずれも運用においては重要になってくる要素ばかりですね。
インシデントレスポンスや自動修復は当然として、内部ステークホルダーとのコミュニケーションの話や、カスタマーサービス運用までもが解説されているのは、網羅的でとても良いなと思っています。確かに、自分が運用をやっていたときはそのあたりに悩まされたなぁ・・・と。
ちなみに、運用に携わる全ての人に参考にして貰えるよう、PagerDutyのプロダクトの有無に関わらず読めるような構成になっています。
日本語のガイドはないの?
PagerDuty公式のガイドはいまのところ英語のみになっています。いずれも日本語であればもっと役にたてるのになぁと思う内容ばかりなので、日本語化頑張りたいですね🇯🇵
Incident Responseのガイドに関しては、有志が日本語化したものが存在します。これ単体でものすごく役に立つので、是非参考にしていただければと思います。
その他関連情報
PagerDutyではブログも積極的に公開しています。
例えばオンコールのチーム作りとして重要なことを記したこういう記事もあります。
こういった情報も、豊富なOps Guidesの知見があるからこそ発信できるものだと思っています。
Blog、 Ops Guidesともに積極的に参照していただき、みなさまの組織内に持ち帰って独自の運用ルールに発展させてもらえると嬉しいです。
では!