この記事を書いた理由
トラブル発生時に何をやるべきなのか、基本的なところをあまり悩まず見て動く事が出来るようにする自分用のメモです。
※作業中、Hyper-V仮想マシンでトラブルが発生して、その時の自分の対応があまりにもヘタレだったので、少しでも改善したいと思い、これを書きました。
Hyper-V仮想マシンじゃなくても、他の仮想環境や物理サーバ環境であっても、今回のやる事リストである程度は共通して実施出来ると思います。
想定トラブル(私の場合は実際に作業中で起きた事)
Hyper-V仮想マシンにパッチを適用、再起動実施したら「再起動します。。。」のようなメッセージが画面に表示されたまま、仮想マシンの画面が動かなくなった。
Hyper-V管理コンソールから、仮想マシンの停止やシャットダウンを実施してみたが、すべて効果無。
一度仮想マシンのコンソール画面を閉じて開き直すと、真黒な画面が表示されるのみ。
やる事リスト~確認する
まず第一に、大きく息を吸って、頭を冷やして冷静になる事!
これ一番大事だと思います。
焦ってしまうと大事な事を見落としたり、普段ならやらないような危険な事をやってしまって
取り返しがつかない状況になってしまう事があるので、焦りは禁物です。
その後に。。。
- 仮想マシンへPing実行
- RDP接続が可能か確認
- 別のユーザでログイン可能かどうか確認
- (ドメイン環境でAD配下の仮想マシンの場合)同じドメイン参加のサーバ上から、対象仮想マシンのイベントログを確認してみる
- その仮想マシン上で動かしているサービスが利用可能か確認する
- 対象仮想マシンのOSバージョンや仮想マシンの設定(特にHyper-Vの場合、統合サービス周り)の確認
やる事リスト~確認後の対処
■ネットワークがつながっていて、仮想マシン上で動いているサービスが利用可能な場合
・ユーザが使っている可能性が高い場合は下手な事は出来ないので、再度色々実施出来る時間帯まで待つ。
待っている間に状況が変わる場合もあります。
(プロセスがタイムアウトしたり等)
★イベントログが確認出来た場合、ログに記載されていた内容について調べる。
↑
これは必ず実施。何が発生しているのかが分からないと、対処のしようがないので。
■ネットワークはつながっているが、仮想マシン上で動いているサービスが利用不可の場合
・NICを外す等を行い、ネットワーク接続を切ってみる。
・(可能であれば)仮想マシンが稼働しているホストごと再起動実施
実際に起きたトラブルの原因について
私の周りで実際に発生したトラブルの原因は、どうやら仮想マシンの古いOS(この時はWin2008 R2)が持つバグだったようです。
ずっと稼働しっぱなしだったサーバに接続した後、ログアウト出来なくなる事があるとの事で、
その場合はNICを切断し、タイムアウトになるのを待つのが一番早い解消方法だとか。
OS再起動を行った時にログアウトが出来ず、ずっと待ち状態になったままというのが、今回直面したトラブルで発生した出来事でした。
目の前で発生した時は何が起きたか分からず、顧客の本番環境で発生したトラブルという事もあり、どうしよー!?!と焦りまくって胃が痛かった。。。