DevOpsの「継続的な学習と実験の技術的実践」について読んだ内容のメモ
以下のことを通じて、安全性の工場と継続的な改善、学習を支える実践を根づかせていく
- 安全を実現するジャストあるチャーを確立する
- 本番環境にエラーを注入してシステムの回復力を鍛える
- ローカルな発見をグローバルな改善につなげる
- 組織的な改善と学習のための時間を確保する
日常業務での学習の実現と日常業うへの学習の注入
- 公正なラーニングカルチャーを確立する
- 事故が起きたあとに非難なしのポストモーテムを開く
- できる限り広い範囲にポストモーテムを公表する
- 従来よりも弱い失敗の兆候を見つけるためにインシデントの境界線を引き下げる
- 失敗の意味を捉え直して計算されたリスクていくの奨励する
- 回復力と学習を生み出すために、本番環境にエラーを注入する
- エラーのリハーサルのために試合日を設ける
事故が起きたあとに非難なしのポストモーテムを開く
非難なしのポストモーテムでは以下のことをする
- 誤りを犯した人を罰しないようにしながら、様々な視点から障害の詳細な事実を集めてタイムラインを描く
- 自分が障害の発生にどのように関わったかについて詳細を設営できる場を設けて、すべてのエンジニアに安全性工場のための意識を与える
- 将来同じ過ちを繰り返さないための方法を社内の他の人々に数えるエキスパートになるように、誤りを犯した人々を励ます
- 人にはアクションを起こすか田舎は判断する裁量の余地が必ずあり、その判断のよしあしの判定はあと知恵だということを認める。
- 将来、同じような事故が起きないようにするために対応策を提案し、期限とフォローアップ責任者を決めてその対応策の実施記録を必ず作る
ポストモーテムには以下の人に参加してもらう
- 問題発生につながったかもしれない判断を下した人々
- 問題を見つけた人々
- 問題に対処した人々
- 問題を診断した人々
- 問題の影響を受けた人々
- その他会議に出席したいと思っているすべての人々
一部門の発見を全社的な進歩につなげる
- チャットルームとチャットボットで組織的な知識を自動的にキャッチする
- 標準化されたプロセスを再利用のためにソフトウェアにまとめて自動化する
- 組織全体で1つの共有ソースコードリポジトリーを作る
- ドキュメントとしての自動テストとコミュニティを使って知識を拡散する
- 非機能要件を体系化して運用に優しい設計を実現する
- 再利用可能な運用ユーザーストーリーを開発に組みこむ
- 組織の目標を達成するために役立つ技術を選ぶ
組織的な学習と改善を生み出すための時間を確保する
- 技術的負債を返済するための儀式を制度化する
- 全員が教え、学べるようにする
- DevOpsカンファレンスで自分の経験を共有する
- 実践を広めるために社内にコンサルティングとコーチング組織を作る