AWS のトラブルシューティングにおいて、より早く解決に導くための自分なりのメモをざっと残す。そして、
事実確認
まずは、どこまで処理が進んだか、どこでエラーが起こったのか等を把握することが大事。
- ログ、エラーメッセージ等を見る (エラーメッセージやログは、飛ばさずにすべて読む)
- API 実行履歴を確認する (AWSだと、CloudTrailで確認できる)
全体把握
- 構成を確認する
- ネットワーク経路を確認する
調査
- 問題の切り分け
- アプリケーション側で発生しているのか
- AWS側で発生しているのか
- 再現性はあるのか
- いつ、どれくらいの頻度で発生するのか
- 何がわからないのか明確にする
- わからないことは、すべて調べてノートにまとめる
- 理解を焦らない。理解にじっくり時間をかける