構築する中でハマった件について、原因と対処が見つかるたびに更新する予定。
仮想スイッチ構成が合っていない
WindowsServer2016を用いたクラスタ環境で発生確認。ライブマイグレーション/クイックマイグレーション時に失敗した。
マイグレーションしようとした仮想マシンでは"internal"という名前仮想スイッチを使っているが、マイグレーション先のノードにこの仮想スイッチがなかった。
- Hyper-Vマネージャーにて仮想スイッチを作成し、マイグレーション先と元のノードで同じ構成にする
- マイグレーションを再実施
元ノードと先ノードで時刻がズレている
WindowsServer2016を用いたクラスタ環境で発生確認。ライブマイグレーション時に失敗した。クイックマイグレーションでも起きるかどうかは未検証。
クラスター環境では全ノードがクラスター用ADに参加しているが、元ノードと先ノードで時刻同期が正常に行われておらず、結果として大幅な時刻ズレが起きていた。
WindowsServer2016はWindows10 1607ベースなので、SecureTime問題に引っかかったのであろうと想定。
- SecureTimeを無効化する
- 時刻同期を再実施し、時刻がマイグレーション先と元で同じになるようにする(NTP同期先も違っていた場合)
w32tm /config /syncfromflags:manual /manualpeerlist:<クラスタ用ADサーバー> /update
w32tm /resync /nowait
w32tm /query /status
- ライブマイグレーションを再実施
マイグレーションする仮想マシンに別ドメインのリソースがマウントされている
WindowsServer2016を用いたクラスタ環境で発生確認。ライブマイグレーション時に失敗した。クイックマイグレーションは動作する。
OSインストールのために、NASに置いてあるISOイメージを仮想マシンにマウントしていたが、OSインストール後もマウントさせっぱなしにしていた。
恐らくネットワークアクセス権絡みで失敗していたと推測。
- 別ドメイン(NASなど)上のリソースをマウントを解除
- ライブマイグレーションを再実施
クラスターネットワークがオフラインになっている
WindowsServer2016を用いたクラスタ環境で発生確認。ライブマイグレーション時に失敗した。クイックマイグレーションは動作する。
クラスターのネットワークを確認すると、クラスターネットワークがオフラインになっていた。原因は不明。
- ノードサーバーのNICを無効/有効
- クラスターネットワークがオンラインになったことを確認
- ライブマイグレーションを再実施