Qiita初投稿です。
自らのインプットのために"サーバ/インフラを支える技術"を読み、ある程度まとめてみました。
今回は第一章の"冗長化の基本"をメモしました。
なかなかざっくりなのでわかりにくかったらすみません。
用語
冗長化(Redundancy)
障害が発生しても予備機材でシステムの機能を継続させるようにすること。
コールドスタンバイ(Cold Standby)
予備機は普段可動せず現用機が故障したら予備機を接続する運用体制。
ホットスタンバイ(Hot Standby)
両方のサーバを常に可動させておき、常に同じ状態に保っておく運用体制。
フェイルオーバ(Failover)
現用機に障害が発生した際に、自動的に処理を予備機に引き継ぐこと。
VIP(Virtual IP Address)
仮想IPアドレス
ヘルスチェック(Health Check)
正常にフェイルオーバするために現用機で障害が発生していることを検出する仕組み。
ICMP(Internet Control Message Protocol)
異常発生時に、エラーとエラー情報を通知。
冗長化の本質
1.障害を想定する
冗長化の第一歩は障害を想定すること、まずは以下の図のようなシンプルな構成で考えてみます。
以下の図にて想定される障害は
- ルータが故障してサービスが停止
- サーバが故障してサービスが停止
2.障害に備えて予備の機材を準備する
次に、故障に備えて予備機を準備してみます。
ここでは予備機たちはネットワーク接続していません。
3.障害が発生した際に呼びの機材に切り替えられる運用体制を整備する
ここでは様々な構成や対応を考えていきます。
ルータが故障した場合の対応
- コールドスタンバイ
ここで注意しなければならないのは、現用機と予備機の設定を同じにするという点。
Webサーバが故障した場合の対応
- ホットスタンバイ
コールドスタンバイと比較して、Webサーバの予備機が常に電源がはいっているため、即座に切り替えが可能。
現用機の更新の際は予備機も同じ更新がかかります。
IPアドレスの引き継ぎ
サーバをフェイルオーバするには"VIP"と"IPアドレスの引き継ぎ"を行います。
現用機に障害が発生した際には予備機がVIPを引き継ぎます。
これにより利用者は予備機であるWeb2へアクセスするようになります。
障害を検出する
正常にフェイルオーバするためには現用機で障害が発生していることを検出する仕組みが必要で、ヘルスチェックといいます。
ヘルスチェックには様々な種類があります。
ICMP監視(レイヤ3)
ネットワーク上の場所を特定するネットワークまたは IP アドレスを使用します。ネットワークアドレスは場所を特定し、物理アドレスはデバイスを特定します。場所は、LAN ワークステーション、コンピュータのメモリ内、またはネットワークを通じて移動するデータのパケットのこともあります。
ポート監視(レイヤ4)
どのアプリケーションプロトコル (HTTP、SNTP、FTPなど)が各パケットに含まれているかを識別し、適切な上位層のソフトウェアにパケットを引き渡すために、その情報を使用します。レイヤ4スイッチは、MAC アドレスおよび IP アドレスだけではなく、パケットが属するアプリケーションに基づいてパケットの送信決定を行います。
サービス監視(レイヤ7)
実際にHTTPリクエストなどを発行し、正常な応答が帰ってくるかをチェックする。
ほとんどの異常を検知可能だが、場合によってはサーバに負荷を掛けてしまうこともある
要点
- システムは、障害がいつ起こってもいいように設計しなければならない
- そのためには、ルータ、ロードバランサ、サーバ、全てを冗長化する必要がある
- 冗長化した際に大切なことは、
- 障害の検出(ヘルスチェック)
- スムーズな切り替え(IPアドレスの引き継ぎ)
参考
以上になります。結構ざっくりとしたまとめですみません笑