Microsoft Teams 障害を ThousandEyes 上で観測してみた
7/21(木)に発生した Microsoft Teams の障害について、ThousandEyes で観測できたのでメモしておきます。
社内から「仕事にならない!!」と声を多数聞きながら、Dashbord を見ながらニンマリしてたのは秘密です・・・🤫
Enterprise Agents
Raspberry Pi 4 上で稼働している Enterprise Agent からの通信を確認してみます。
宛先 URL を指定し、5 分間隔で監視しています。
ダッシュボードを確認してみます。
HTTP Server からの応答を確認してみると、7/21(木) 10:20 - 10:25 JST の時間帯から HTTP Server からの応答がなくなっていることがわかります。
Network 経路情報を確認してみます。
障害発生時刻にパケットロスや経路障害は検出されていないことがわかります。
パケットロスが起きた場合はグラフのカウントが上がったり、障害を検知した箇所が経路上に赤く表示されます。
Endpoint Agents
2 台の PC 上で稼働している Endpoint Agents からの通信を確認します。
Enterprise Agents 同様に、宛先 URL を指定して 5 分間隔で監視しています。
HTTP Server からの応答を確認してみると、Enterprise Agents と同じように障害発生時刻以降、HTTP Server からの応答がなくなっていることがわかります。
また、Response として 500 Internal Server Error
が返されていることがわかります。
この View Headers
を選択すると、実際の HTTP Request / HTTP Response の Header 情報を確認することができます。
加えて、ローカルネットワークの問題も見られないことがわかります。
さいごに
「ThousandEyes はいいぞ!」という情報を見たり聞いたりすることはありますが、今までは「そうなんだ~」「確かに便利そうだな~」くらいの感覚でした。
今回のように実際に監視対象で障害が起きると、ネットワークが悪いのかサービスが悪いのかが GUI 上ですぐに確認することができ、製品・サービスの良さがダイレクトにわかって良いですね。
時事ネタでいい勉強になりました。