2020/01/25 に行われた SRE Next の資料まとめです。
資料が公開され次第、内容を更新します。
- 分散アプリケーションの信頼性観測技術に関する研究
- 40000 コンテナを動かす SRE チームに至るまでの道
- タクシーxAIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて
- 絶え間なく変化するメルカリ・メルペイにおけるSREの組織と成長
- パフォーマンスを最大化するための SRE のオンボーディング事例
- 計画的に負荷リスクを排除するためのキャパシティプランニング
- 成長を続ける広告配信プラットフォームのモニタリングを改善してきた話
- freee のエンジニアは障害から何を学び、どう改善しているのか?
- グループウォレットアプリ、6gramの運用をはじめてみた
- delyにおける安定性とアジリティ両立に向けたアプローチ
- Practices for Making Alerts Actionable
- 日経電子版SREチーム立ち上げ中
- 冗長性と生産性を高めるハイブリッドクラウド環境の実現
- SLO Review
- 100万回線のIoT通信を支えるソラコムにおけるOpsDevの実践
- 急成長するPairsと共に変化・成長し続けてきたエウレカのSRE戦略
- New RelicのSREに学ぶSREのためのNew Relic活用法
- スクラムを1年回してSREと開発組織がどう変わったのか
- Blue-Green デプロイメントを採用したデプロイの仕組みを実装して共通基盤として導入した話
- SREがセキュアなWebシステムを構築、維持するためにやれることはなにか
- ZOZO MLOps のチームリーディングとSRE(Engineering)
- Designing fault-tolerant microservices with SRE and circuit breaker centric architecture
- サイト信頼性エンジニアリングの原則 (記事)
- SRE Practices in Mercari Microservices
- 実践Observability
- Webサービスを1日10回デプロイするための取り組み