先に予告していた通り、ハイパーコンバージドインフラであるNutanixを試用しました。
まずは、ハイパーバイザとしてVMware ESXiを使うパターンです(Acropolisは時間があれば試用する予定)。
なお、今回試用した環境のハードウェアはLenovoのHX3500でした。NutanixオリジナルのSupermicroではありません。
Lenovo HX 3500ハードウェア
IBM時代からのSystem X、x3650M5そのままです(2Uラックマウント)。特に変わったところはありません。
ちなみに、1筐体に複数ノード入るシャシーのものは、Lenovoになってから発売されたモデルです。
VMware vShpere 6.0
Nutanix用のドライバ等が入ったESXiのイメージがインストールされていたようですが、見た目は全く普通のVMwareです。
というわけで、vCenterの画面等は割愛します。
管理用の仮想マシン(CVM)
Nutanixでは、ホストノード1台に1つずつ、CVM(管理用の仮想マシン)がインストールされます。
Prismも、この上で動いています。
Nutanixバイブルを読むと詳しいことがわかりますが、色々なOSSをベースとしたソフトウェアを組み合わせて動作しているようです。
管理ツール(Prism)
Nutanixの環境を管理するツールです。
ストレージボリュームの切り出し等はこのツールで行います。
管理画面ですが、VxRailと比較すると、直観的で見やすい/わかりやすい気がします(パッと見でリンクがどこにあるのかは少しわかりにくいですが)。
表示は英語ですが、まもなく日本語対応されるそうです(すでに簡体字中国語には対応しているみたいですが…)。
また、ハイパーバイザとしてVMware ESXiを使う場合、現在はPrismからは簡単な情報しか見ることができませんが、今後、Prismでの管理性を向上させていくらしいです。
SDS(ソフトウェア制御のストレージ)
VxRail(VSAN)とは違い、仮想マシンが存在するノード上にデータが優先的に配置されるようです。
また、ハイブリッドストレージを積むタイプも、SSDはキャッシュとしての利用のみではなく、キャッシュやクラスタ管理等に使う以外の領域をデータ保存用として使えます。
固定的な割り付けもできるそうですので、RDBMSのテーブル領域はSSDの中に固定的に配置し、HDDに追い出さない、ということが(容量が足りていれば)可能です。
性能について
VxRailの試用記のときにも触れましたが、公表するのは問題がありそうなので割愛します。
ノード停止試験
VxRail(VSAN)のときと同様、ネットワークケーブルを抜いてノード(ホスト)を停止してみました。
(アクティブになっていない側の)ケーブルを1本だけ抜いたときには、Prism上にアラートが表示されることはなく、2本とも抜いたときにアラートが表示され、ノード停止が認識されました。
異常も復旧も、Prism側よりvCenter側が先に検知してきているように見えるのですが、CVMが仮想マシンとして動いている以上、仕方がないのかなと思います。このあたりは、オンプレミスの非SDx(SDS)環境で慣れてしまっていると、少し戸惑うかもしれません。
但し、挙動自体はVxRailのときと違い、特にパケットロス等の変な動きはありませんでした。
HAの切り替わりは、非SDS環境に比べ、少し時間が掛かるような気がします。状況にもよると思いますが、VMware本体に統合されているVxRail(VSAN)と比較しても、多少時間が掛かるようです。
なお、停止から30分以内であれば、ノードはそのまま復帰しますが、それを超えると再組込みが必要らしいです。
試用してみた印象
個人的な感想では、(先に評価した時点での)VxRailよりはイケると思います。
うまく表現できませんが、やはり、VxRail(VSAN)とは歴史の長さが違う分、差があるような気がします。
但し、元々あまり多くない台数のオンプレミス環境を統合するのであれば、ありがたみは薄いかもしれません。
数十台を3~4台に統合、というケースでは、結構使える気がします。
但し、ノード障害⇒VMware HAによる仮想マシン再起動の所要時間なども含め、性能試験はきちんと行った上で導入を決定したほうが良いでしょう。
おまけ/ハードウェアの選択について
名古屋のような地方都市では、東京との間に、ハードウェア保守対応の「格差」があることが多いです。それは、主に
・保守作業員=「人」の格差(数・スキルレベル)
・保守部品=「モノ」の格差(種類・数)
に分けられます。
多くの外資系メーカーの場合、「人」の面はユニアデックスのような専門業者に委託するのでそれほど心配する必要がないのですが(逆に、関連企業で保守を行う国内メーカーのほうが困ることがあります)、「モノ」については、近場にストックがない/足りないことが原因で、東京や大阪から取り寄せることになり、その分修理開始が遅れてしまうことがよくあります(外資/国内メーカー問わず)。
Nutanixの日本法人がまだ小規模なのに対し、LenovoはIBMの保守網を(部品のストック体制を含め)そのまま継続して利用できる状況です(いつまで続くかはわかりませんが)。
また、Prismで管理できないハードウェアのHealth情報を、他社ハードウェアでは専用のツールで管理できる場合もあります。
Lenovoの場合(IAサーバなので精度は高くはないと思いますが)障害の事前検知を行い、ノード停止⇒HA動作が走る前に、仮想マシンのvMotionを行う機能も利用できます。
というわけで、場合によってはNutanixオリジナル以外のハードウェアとの組み合わせも、検討対象になるのでは?と思います。