「ネットワーク」というと身近なものはIP/Ethernetがほとんどですが、電話やWANなどのテレコム系と呼ばれるものもあります。
通信会社でも担当部署の人でないとなかなか知ることのない技術もあるのでIP系とテレコム系でL2/L3あたりの違いをまとめてみました。
そもそも用途が異なるネットワークですので「こんなものがあるんだ」くらいの気持ちで読んでいただけたらと思います。
☆☆☆ いいわけ ☆☆☆
少々古い情報に基づいて書いていますので現在でも活用されているかは各自確認下さい。
と言ってもテレコム系の情報は一般には出回りにくいので
通信会社のテレコム部門の人
通信機器メーカのテレコム部門の人
テレコム機器を扱う商社の人
辺りを捕まえて話を聞いてみるのが確実です。
かなり希少な人種なので探すのが大変かもしれません。
IP系に関してはネットに情報が溢れているのでざっくりとした説明にしています。
詳しくはググってみてください。
アーキテクチャ
IPネットワーク
データに特化したパケット交換網
回線中をデータが流れたり流れなかったりするためデータ量によって遅延、揺らぎが発生する
規格はIETF(IP)とIEEE(Ethernet)が主体
テレコムネットワーク
音声から始まった回線交換網
一対一の通信が回線を占有するので、中を流れるデータの遅延、揺らぎは常に一定
止まってはいけない所謂「キャリアグレード」やISDNと言えばこちらの世界の話
伝送(SDH/SONET/WDM)、交換、端末に分けられる
規格はITU-TとBellcoreが主体。国内はTTC(と総務省)
パケット交換網と回線交換網
の違いをあたまに入れながら以下に進んでください
物理線冗長
IP
Link Aggregation(LAG)
複数のEthernet線を束ねて一本に見せる技術
冗長とともに帯域増強を目的とすることが多い
Equal Cost Multipath(ECMP)
これもLAG同様、冗長よりも帯域増強を目的にしていることが多い
テレコム
Automatic Protection Switching(APS)
二本の回線に同じデータを流し、回線断時には受信側で切り替える
使っている方をWorking、使っていないほうをProtecionと呼ぶ
ネットワーク系で耳にする「50msec」という数字はこのWorking/Protection切替時間の規格
日本のSDHでは受信側でフレームをバッファリングしており回線障害でも無瞬断(ダウンタイムゼロ)を実現している
回線断が起きてもテレビ映像が途切れないのはこれのおかげ
RingProtection
リング状で組み、回線断時には逆方向に回線に切り替える
Ethernerで実装しているベンダがある(がいまいち流行っていない)
コントロールプレーン
「コントロール」の意味が「シグナリング」と「オペレーション」の二つあることをあたまに入れておいてください
IP
事業領域で異なる
キャリア/ISP/大規模DC
インバンドとともにアウトバンドを用意
ルーティングやSTPなどのシグナリングがインバンド、障害やオペレーションミスなどでノードが孤立してもアクセスできるよう監視用アウトバンドネットワークを別途用意することがほとんど
自宅ラック勢はこちら?
企業/個人向け
インバンド構成がほとんど
遠隔監視サービスでLTEなどの無線通信でアウトバンドの通信手段を実装することもある
テレコム
伝送系はフレームヘッダでシグナリングが行われるのでインバンド。交換系はアウトバンドの制御網が二つある(A/B面)
オペレーション用の制御端末はVT100やWebブラウザなど一般のPCを利用することが多く、IPネットワークに属することがほとんどなのでオペレーションはアウトバンド
WDMなどL1に近い機器で制御用の波長をインバンドで用意することがある(厳密にはアウトバンド)
回線障害検知
IP
Ethernetはデータが流れないことがあるので原則物理リンクの状態を検知する
一部KeepAliveや片方向異常検知(UDLD)を実装している機器もある
ルータではルーティグプロトコル上のHelloなどで検知、FWやLBではICMPやTCPのトラッキングで断検知をするものがある
各レイヤで障害検知の手法が異なるのでシステム全体としてどうまとめるかがキモ
テレコム
基本的にデータ(フレーム)が流れているので
物理断(LOS/Loss of signal)
フレーム異常(LOF/Loss of frame、LOP/Loss of Pointer)
を検知する
また警報転送機能により中間ノードでの障害を末端まで通知する仕組みがる
同機能がEthenetOAMとして規格されている(が流行らない)
ハード障害検知
IP
WatchDogによる各デバイスの応答による検知
CPU障害は冗長系はStandby側からの死活監視、Box型などCPUが一つのものは再起動か対向のリンクダウンを期待(=あきらめる)
テレコム
WatchDogはIP同様
交換機ではBusを含めた冗長系を一日一回強制的に切り替えてStandby側の故障検知を行なっている
NetflixのChaosMonkeyのハードウェア版と理解してもらえばいいかと
特殊なのは二重化されたメモリをAct/Sbyで照合とか(ECCでも救えない障害の検知用)
システム冗長
IP
大型機器ではエンジン部分の二重化が行われているが多くはノード単位ではなくネットワークシステムとしてルーティングプロトコルやSTPなどのソフトウェアで冗長化を実現し機器単体での高信頼性は過度に求めない
シンプルな構成にした分が価格に反映
テレコム
ハードウェア二重化、多重化が当たり前
CPUは多重化、メモリ/Busなどが二重化されている。
CPUが停止しても動作を継続するなどデータ系と制御系がシステム的に分離しているものがほとんどなので、サービスの停止無しにソフトウェアのアップデートが可能(Hitless Upgrade)
バグ修正もオンラインで直接メモリを書き換えることもある
おわりに
IP系とテレコム系ではそもそもの設計思想として
止まることを許容するか否か
という違いがあるので良い悪いを比べる意味はありません。
機器のMTBFやネットワークのSLA、エンドの価格もそれぞれ異なります。
テレコムで利用するコンピュータも加入者DBなどでは無停止サーバ(FT/Fault Tolerance)を利用していますが、移動体の5Gになると汎用サーバでの実装が出てきているのでテレコムでもここまでの信頼性は必要なくなっていくのかもしれません。
無停止アップグレードや活線挿抜などサービスを停止させない仕組みは大型IP機器の一部に実装されていますが、ミドルレンジのIP機器までにはコスト的に届かないようです。