近況
久しぶりの投稿となりました、コンニャクンしゅうペーです。
※改名しました。
先日、AWSの認定資格試験AWS Certified Security - Specialtyに落ちました。
原因は単純な勉強不足でした。2週間後に受けられるようになるので、再挑戦します。
やっぱり触ったことないサービスは特にイメージがつかず、理解しきれていないなあと実感しました。
頑張ります。
今回の経緯
業務の中で、お客さん先の現行環境のHWサポートが切れるとのことなので、現行Simplivityから新規Simplivityにサーバ移行するプロジェクトに参画しました。
移行に使う製品として、Veeamが採用されました。(Veeamのレプリケーション機能を使用しての移行)
自社のvSphere環境や他のお客さんの環境でも何度か経験したのでそれほど気にしてませんでしたが、
実際の移行試験でレプリケーションやフェールオーバーをやってみると、なぜか遅い。
差分がほとんどない状況でもレプリケーションジョブやフェールオーバーに時間が異様にかかってる。。。
誤差といえないほどの時間差だったので、いくつか調査をしたところ、Simplivity特有の現象だったようで、記事にしてみました。
そもそもSimplivityとは
HPEから出ているHCI(ハイパーコンバージドインフラ)です。
HCIとはサーバー機器、SANスイッチ、ストレージの3tier構成を一台の機器にまとめたものです。
DellからもVxRailが出ています。
今回の原因
原因はSimplivityのボリュームがNFS v3だったことにありました。
VMware社のkbのよると、以下の現象が確認されているようです。
「NFSv3 を使用して NFS データストアをマウントし、ホットアド方式を使用する VADP 対応バックアップ ソリューションを使用すると、次の症状が発生します。」
【症状】
・スナップショットの作成または削除操作中に、NFS ストレージ上に存在する仮想マシンが応答しなくなり、同時に ESXi ホストも応答しなくなることが観察されます。
・バックアップ アプリケーションを使用して NFS データストアに存在する仮想マシンをバックアップした後にスナップショットを削除すると、仮想マシンが約 30 秒間応答しなくなります。
・NFS データストア上にある仮想マシンをバックアップした後にスナップショットを削除すると、完了までに時間がかかります。
※この問題は、ターゲット仮想マシンのディスクがバックアップ/リストア操作のためにホットアドされた場合に発生します。
VeeamはVADPを使用していろいろな処理をしているので、これですね。
同じような内容がVeeam社のkbからも出てました。
詳しくはkbを参考にして下さい。
対処法
SimplivityではいまだにNFS v4に対応していないようなので、Veeam側で対応します。
対処法①
Veeamには転送モードをVeeam Backup Proxyの設定で変更することができますが、そこを変更します。
デフォルトの設定で、Veeam社推奨の「仮想アプライアンス(ホットアド)」から「ネットワークモード」に変更します。
(よく見たらVeeamドキュメント内の要件に「NFS v3の場合」と記載ありました、気づかなかった)
対処法②
移行元マシンが乗っているホストそれぞれにVeeam Backup Proxyを立てて、それぞれに以下のレジストリ値を作成する。
Key Location: HKLM\Software\Veeam\Veeam Backup and Replication
Value Name: EnableSameHostHotaddMode
Value Type: DWORD (32-Bit) Value
Value Data:
Value Dataは1か2を指定します。値による差は以下の画像の通りです。
さいごに
製品の特性や組み合わせで、思った通りに動作しないといったことはよくありますが、何とか原因がわかってよかったです。
質問があればコメントしていただければと思います。
それではまたどこかで。