#はじめに
システム障害は怖いです、サービスを止めてはいけない。
エンジニアにとって『障害』は耳をふさぎたい言葉です。
そして何か起きたらネットワークが最初に疑われます。
ということで、、
今回は障害が起きてもサービスを継続させるための『冗長化技術』を紹介したいと思います。
#Stack(スタック)
L2スイッチやL3スイッチで使う筐体冗長化の技術です。
複数台のスイッチを専用ケーブル等で接続し、仮想的に1台のスイッチとして機能させます。
基本的には、同機種・同OSのスイッチを使います。
1台として機能させるので、コンフィグは1台分になります。
インターフェースだけ構成台数と合わせて拡張されていくイメージです。
ポート割り当てを複数台に分散した設計を組めば、スイッチが1台壊れたとしても
サービスへの影響を抑えることができます。
大体2~3台の機器でstack構成を組むことが多いですが、サーバ周りのスイッチでは
ポート収容数を拡張する為、8台とか多段で組んだりします。
(当然ながら幅取ります、、stack構成が可能な台数はメーカによるので事前に確認を。)
Ciscoスイッチでは、電源もstack構成内で共有する技術があったりします。
#Link Aggregation(リンクアグリゲーション)
帯域拡張やリンクの冗長化技術です。LAG(ラグ)と略されることが多いです。
物理的なケーブルを複数束ねて1本のリンクとして機能させます。
ケーブルやポート障害で一部のリンクが切れたとしても、残っているリンクで通信を継続することができます。束ねることができる数は機器によりけりですが、大体8本くらい可能です。
基本的には、同一筐体でしかLAGを構成することはできませんが、各メーカーが独自の技術を提供しており、別筐体でもLAGを構成することが可能な機器もあります。
以下はメーカの独自技術の参考です。
参考:Cisco(virtual PortChannel)
https://www.infraexpert.com/study/nexus6.html
参考:APRESIA(Multi-Chassis Link-Aggregation)
https://www.apresia.jp/products/ent/configuration/mlag/
リンクの冗長化に加え、通信量が多いポイントでは複数束ねることで利用帯域を拡張することができます。
<LAG構成>
stack構成の図にもあったLANケーブルを覆う輪っか部分がLAGを表してます。
#VRRP(ブィ・アール・アール・ピー)
正式名称は「Virtual Router Redundancy Protocol」で、デフォルトゲートウェイの冗長化技術です。これも略称で呼ぶことが多いです。総称「FHRP(First Hop Redundancy Protocol)」もあるようですが、あまり使ってないです。
Cisco独自の技術では、「HSRP(Hot Standby Redundancy Protocol)」というのもあります。
L3機器(ルータ、L3スイッチ等)は、各セグメントのゲートウェイとしてやインターネット網の出入口に配置されますが、通信の要となるのでハードウェア面でも大体冗長化されてます。
VRRPは、複数台のL3機器を仮想的に1台に見せることができます。
構成する機器同士で常時監視し、通常時は1台が優先的に通信を処理、障害時には自動的に切り替わって、もう片方の機器が通信を処理するようになります。
構成する機器で共通の仮想IPアドレスを持ち、これを周辺機器等のゲートウェイに設定します。
万が一、L3機器の障害が起きても通信は止まることはありません。(切り替わりで瞬断程度)
注意点としては、VRRPを設定するインターフェースでフィルタリングする際、VRRPの監視パケットを破棄しないようにすることです。監視パケットを機器間でやり取りできないと、VRRPの構成が崩れてしまいます。
以上、普段よく使っている冗長化技術の紹介でした。
ではまた次の機会に。