Edited at

障害はおきてなくても、障害はおきている?

More than 3 years have passed since last update.

お世話になります。

AWSキッチンのシェフです。

みなさんはサーバ(インスタンス)の冗長化はされていますか?

AWSの各サービスの稼働状況

http://status.aws.amazon.com/

上記がAWSのサービスの状況ですが、上記に問題がなくとも自分のインスタンスだけは、AWSの仮想サーバホストの問題によって接続が一時的にできなくなってしまうことなどはおこります。

(RDSのリードレプリカも夜中に1台勝手に再起動されていたこともありましたが、AWSの基準では障害ではないようだったので、自分たちの設定した監視にのみ障害として記録されました。)


対策

1.AWSとはいえ、やはりサービスを守りたい場合冗長構成をとる必要はあるとおもいます。


AWS側になにかあるのではと疑わしい時は

1.AWSの仮想ホストサーバ障害の場合、EC2はStop/Start(Rebootではなく)を実施することで、Start 時に別の仮想サーバホストが割り当てられるそうです。

2.AWSのサポートに聞けば、何か起きてた場合は聞けば教えてくれます。(聞くときは、インスタンスIDや日本時間の何時であるかを伝えるといいと思います)


まとめ

システムに障害がおこる前提での設計が必要だと思います。