背景
自分はau回線を使ってなかったけど、ニュースを見る限りかなり大規模な障害であった。
単純な興味から今回の事件について少し調べてみた。
また、通信系に使われてる技術や用語を知っておきたいなと思った。
基本的には記事のまとめという感じで軽めに読んでもらえれば。
事故原因
障害原因のきっかけとなったのは、全国中継網におけるルーターの定期メンテナンス作業。
ルーターを同一機種の新しいものへ変更したところ、ルーターに何らかの不具合があり、
音声通信の一部が約15分間不通になった。この問題への対応として音声トラフィックの切り戻しを行ったが、
切り戻し後のアクセス集中により、VoLTE交換機で輻輳が発生した。[1]
原因はメンテナンス時の機器交換の失敗。またその切り戻し対応後のアクセス集中による輻輳
※輻輳(ふくそう)は、トラフィックが集中することにより処理が混雑すること。輻輳は混雑な状態のため、一切通信が出来なくなったわけではなく、誰かが抜けたらすぐ誰から入るという状態をイメージするとわかりやすい。
どうやら切り戻し後にアクセスが集中してしまったらしい。深夜2時頃に作業完了しており、メンテ後すぐのアクセスのようです。
メンテ終了後にアクセスが集中することは予想できるが、今回だけ大規模障害になるほどのアクセス集中なのだろうかと腑に落ちない。
と思って別の記事を見たら、もう少し詳細原因が記載してあった。
KDDI髙橋社長が「au通信障害」謝罪、現時点で判明している経緯とは
中の記事を見てなるほどとなった部分がある。
一時的に接続がつながらなくなったことでセッションや情報を扱うデータベース上の中身が変な状態になっていたようだ。
こういうトラブル時でも耐えうるデータ設計は必要だが、実際にできているかは評価しづらいし多分ほとんどのエンジニアはきちんとできていないと思う。(多分私もできていない)
後、大規模システムだと関連するシステムが多すぎて見切れないというのもある。
後は勝手な憶測としてメンテナンス時の事故があったんじゃないか。
普段行わないオペレーションをやるとなった時に、何か間違えた作業でデータを破壊してしまいその復旧がうまくできなかったとか。
明らかなミスにより起こしてしまった場合はなるべく外に出したくない情報なので、うまく言い訳をするとかは全然ありえそう。
最初の不完全な情報だけでたてた憶測なので取り消し線にしておきます。
VoLTE及び通信規格
今回機器交換したものはVoLTE交換機というものらしい。
VoLTEとは、データ通信で使用される高速モバイル通信網(LTE)でパケット交換をして、音声通話も処理するという仕組みのことで、「Voice Over LTE」の略称です。日ごろスマホでサイト閲覧などをしている通信と同じところに通話のデータも乗ってくるといった意味になり、LINEやSkypeなどと同じようなIP電話と同じような仕組みになります。ただ、IP電話のデータよりもVoLTEのデータのほうが優遇されており、IP電話のデータとVoLTEのデータが同時に来たら、VoLTEを先に通すという決まりがあります。
VoLTEの技術がなかった3G回線の時代は、データ通信のネットワークと音声通信のネットワークに分かれてやりとりされていました。もっと詳しく言うと、音声は0と1で構成されるデータで音声専用のネットワーク、データは「パケット」と呼ばれるデータでデータ通信専用のネットワークを通っていたということになります。[2]
昔あったLTE回線のことだろうか。調べてみると
VoLTE(ボルテ)とLTEの違いは「音声通話用の規格かデータ通信用の規格か」です。 VoLTE(ボルテ)は音声通話用、LTEはデータ通信用の規格になります。どちらも、使っている回線自体は変わらず用途が違うだけです。[3]
VoLTEは音声通話では今の5G時代でもスタンダードな規格のようです。現在はVoNR(Voice over New Radio)という新たな規格を実証実験中だとか。
通信回線の規格は以下が参考になりました。
Wi-Biz通信Vol.62 【ニュース&トピックス】
上記サイトの図表4を見ると、どの周波数を使用するかをメーカー毎に決めているんですね。全然知らなかった。
引用元
1:au通信障害、原因は通信設備の故障による輻輳 通信規制で対処中【修正あり】
2:「VoLTE交換機」や「トラヒックの輻輳」の仕組みとは?設備障害は今後も起こる?!
3:VoLTE(ボルテ)とは?意味やLTEの違い・通話方法などをまとめて解説!
もう少し具体的な仕組み(追記)
具体的にどういう処理になっているのか、以下のツイートが分かりやすかったです。
https://twitter.com/Tsutomu_eng/status/1543436693558411264