今年にあったやらかしをライトに書いていきます。
登場人物
- ルーターA(RTX1220):メインルーター(被害者)
- ルーターB(RTX1220):バックアップルーター
- スイッチ(SWX3220-16MT):同じネットワークにいるスイッチ
- 占有型インターネット回線:ルーターAに収容
- フレッツ光:ルーターBに収容
発端
とあるお客さんの一部のネットワークで、インターネットに繋がらないトラブルがありました。
たまたまお客さんは長期休暇で、施設の担当者しかおらず実際には使われていなかったのですが、こちらからの死活監視で疎通が取れないので対応しました。
ネットワーク図
2台のRTX1220ではVRRPをして冗長化をしています。
SWX3220に収容していて、SWX3220の配下はSWX2320がつながっていて、それぞれのパソコンとかに行っています。
SWX3220はL3スイッチですが、L3機能は使っていません。なんでSWX3220が入っているのかは謎です。
確認
ルーターBは疎通がとれているので、ルーターBにリモートをしてルーターBからAに対してTelnetをしてみました。
そこで、インターネット側(8.8.8.8など)に対してPingを打ったり占有型回線なのでプロバイダ側のゲートウェイに対してPingをしてみましたが疎通が取れませんでした。
やってしまったこと
確認の結果やはりダメそうなので再起動しようとしました。
しかし、何を思ったか、
Router_A# restart
とするところを
Router_A# cold start
としてしまったようです。
よく覚えてないですが、疲れてしまってたみたいです。
やったときは自覚がないといいますか、正直なんも考えてなかったので記憶がないです。
判明まで
最初は再起動したつもりだったので、Pingを打ちつつ起動を待っていましたが全く返って来ませんでした。
しばらくして、ARPに192.168.100.1が現れたので不思議に思っていましたが、MACアドレスがルーターAのものだったのでハッとなりました。
対処
いかないといけないかな…?って思って準備してましたが、よくよく考えてみました。
初期化したことが確かなら、初期IPアドレスが"192.168.100.1"になるのでTelnetをします。
無事Telnetができたら設定を入れていきます。幸いにもバックアップを取っていたので一行づつ入れていきます。
その間確認しつつ入れましたが設定的には問題なさそう。
全て入れ直したあとに保存をしました。
なんでインターネット繋がらなかったの?
どうも、回線業者側でメンテナンスがあったらしく、そのメンテナンスの開始時刻から繋がらない状態になっていたようで、メンテナンスが終わってもなお繋がらない状態でした。
そのため、担当者に連絡してメディアコンバータを再起動してもらうとつながるようになりました。
教訓
- コマンドを入れるときはきちんと確認しましょう
- そもそも確認だけなら基本的に管理者モードに入る必要はないよね?ユーザーモードでやりましょう
- (nslookupとか管理者じゃないと出来ないのどうにかならないのかな…)
- 基礎知識として初期値を知っておくのは大事だと思いました。初期状態でTelnetができること、IPアドレスは"192.168.100.1"であること、初期ユーザーは「admin」であること。を知らないと対処できなかったように思います
- 機器のMACアドレスとかネットワーク図とか、その施設の基礎的な情報は知っておく必要があると思います。対応するにあたってなにが武器になるかはわかりませんので
- メンテナンス情報は知っておく必要があったと思いますが、回線事業者によっては情報が行き渡らないようになっている(ホームページなどで確認ができない・そもそも連絡しない・契約者しか見られないマイページでの公開など)場合もあります
- 1人で対応しないのも大事です
以上です