#はじめに
これまでもLife Cycle Manager(以下、LCM)についてご紹介したことがあるのですが、今回はLCMを使ったFirmware更新の話をしたいと思います。
先日LCM 2.3.2.19448というバージョンがリリースされた後、PRISMからLCMを見てみたところ、LCMの画面の感じが少し変わったのと合わせて、更新できるFirmwareが存在していることに気づきました。
過去のLCMのバージョン(2.1)時代にFirmware Updateを試してみた際には、搭載されているパーツの一部のFirmwareだけしか更新されず、LCMからのFirmware更新はまだまだ厳しいなというのが印象でしたが、現バージョンの2.3.2(2020年7月末現在の最新)でどこまで進化したかを見きわめるべく試してみた結果をここで紹介したいと思います。
NutanixのLCMではSoftware(例えばAHVやFoundation、Files等)の更新もできるわけなのですが、今回はFirmwareの更新の話に絞ってお話したいと思います。
また今回利用するハードウェアは、NXシリーズではありません。
Dell EMCのXC CoreというPowerEdgeサーバーがベースとなっているNutanix専用モデルを使用しています。
使用する機種・ハードウェアによってLCMの操作が変わることはないと思いますが、表示される項目が異なったり、ハードウェアに特異な部分があると思いますので、その点をご認識の上読んでいただければと思います。
使用するハードウェアによる差異についてはNutanix社のサポートサイトのLife Cycle Managerの箇所に色々記載があるので、事前によく内容を読んでから手を付けるようにしましょう。
#環境
■ハードウェア
・Dell EMC XC640 Core × 3台
■ソフトウェアとバージョン
・Hypervisor AHV el7.nutanix.20190916.231
・AOS 5.17.1.1
・LCM 2.3.2
・Foundation 4.5.3.1
・NCC 3.9.5
■Firmwareバージョン
Before とAfterを比較しながら見たほうが分かりやすいと思いますので、本編の内容にて触れたいと思います。
■その他補足事項
利用した環境はインターネットに接続している環境なので、各種Updateファイルは自動で入手ができる状態にあります。
#事前確認
①PRISMからハードウェアを確認してみたいと思います。プルダウンメニューからHardwareを選択します。
今回はこの3台のうち、1台だけFirmware更新をしたいと思いますが、対象はホスト名が__NTNT-78TQxxx-A__という名前のホストにしたいと思います。
②特にエラーもなく3台とも動作してることが確認できます。今回の更新対象はリスト表示された一番上のホストになります。
③IPMI(以下、iDRACと記載)にもログインし、ハードウェアの状態を見てみましょう。
システム:正常と表示されている通り、正常に動作していることが分かります。
④適用されているファームウェアの情報も見てみましょう。"システム" - "インベントリ"と辿るとファームウェアインベントリという項目が表示されます。
LCMで更新をした後にここに表示されているバージョンが変わるかを確認したいと思います。
⑤再びPRISMの画面に戻ってきました。プルダウンメニューからLCMを選択します。
⑥画面左のInventoryを押します。クラスタやノードの情報が表示されます。
ここで[Perform Inventory]というボタンが気になるかと思いますが、LCM自体のバージョンアップをする場合は、このボタンを押します。
バージョンアップによって新しいUpdateファイルが入手され、LCMを使って適用が可能になります。
今回は事前にこのボタンを押してLCMのバージョンアップは完了した状態からのスタートとなります。
#LCMによるFirmware更新作業
事前確認の流れでPRISMの画面を見て進めていきます。
①LCMの左のメニューからFirmwareを押します。Firmwareの文字の右横に⑨という文字が出ていますが、何か更新対象があることが分かります。
全3台のホストで1台あたり3件のFirmware更新対象があるので、合計9個更新があることになるため⑨と表示されています。
②更新対象のホストを選択して更新対象のFirmwareを見てみましょう。各Firmwareのバージョン(Update To:xxxxxxxxとある青字の箇所)をそれぞれ押して見ていきましょう。
Hardware Entities(AHV)
中身を見れば分かる通り、Hardware EntitiesというFirmwareにはNICやブートデバイス、SSDやRAIDコントローラーといった各コンポーネントのFirmwareがまとめられていることが分かります。
どのパーツがどのバージョンに更新されるかはここで事前に確認することができます。(Nutanixのサポートサイトからも確認できますが、実機上で確認する場合はこちらで確認することができます。)
iSM
iSMはiDRAC Service Moduleと言われているもので、OS上でサービスとして動作します。
後述するPTAgentがiDRACと通信するための経路をこのiSMが有効化するために利用されます。
Dell Update Manager
Dell Update ManagerにはPTAgentというものが含まれます。
このPTAgentが何かというと、OS上からwsmanやredfishやracadmを介してiDRACと通信するために利用され、OS上でサービスとして起動して動作しています。
iSMと密接な関連性を持っており、ハードウェアのインベントリ情報を取得したり、Firmwareを更新する際にOS(この環境だとAHV)と通信するために利用されます。
iDRAC経由でOS上の情報が収集されているのは、iSMとPTAgentが動作していることの現れと言えます。
XCやXC CoreといったPowerEdgeサーバーをベースとしたNutanix製品でLCMを利用する上ではこのiSMとPTAgentが実はとても大事な役割を担っています。
③NCC Checkをかけます。対象のホストを選択して、[NCC Check]を押します。
④Run Check画面で[Run]を押して、NCCを実行します。
⑥再びLCMの画面のFirmwareの画面を表示します。Firmware更新対象のホストにチェックを付け、更新したいFirmwareを選択して、[Update]ボタンを押します。
今回は更新対象のホストを1台選び、Firmwareとしては全て更新したいと思いますので、3つのFirmwareすべてにチェックを入れてから[Update]ボタンを押します。
⑦Review画面が表示されます。ホスト名の下にdetail(赤線の箇所)があるので、詳細を見てみます。各Firmwareの更新前と更新後のバージョンが確認できます。
このまま更新をする場合は、[Apply 3 Update]を押して先に進みます。
⑧Updateが開始するので、しばらく待ちます。
Firmwareの更新となるため、サーバーを停止し更新を行ってから再起動が行われます。
更新するFirmwareが多い場合にはかなりの時間がかかることが予想されるため、更新作業は余裕をもって実施するようにしましょう。
更新中に仮想マシンの状態を確認してみました。今回更新対象としたホストはNTNT-78TQxxx-Aという名前のホストですが、当然ですが、更新中はNTNT-78TQxxx-Aというホスト上に仮想マシンは稼働していません。更新対象外の他のホスト上に仮想マシンが自動でマイグレーションされた上で、更新対象のホストの更新が行われます。
以下は更新の進捗状況を示した画面です。Dell Update ManagerとiSMのFirmware更新は完了し、Hardware Entitiesの更新が進行中のようです。
この状態でiDRACの仮想コンソールを開いてみて、ホストがどのような状態にあるかを見てみました。
iDRACの仮想コンソールを見る限り、AHVはまだ起動しているようです。
しばらくすると、iDRACの仮想コンソールにReconnectingと表示され、仮想コンソールやiDRACに接続できない状態となり、iDRACのFirmwareが更新が始まりました。
数分待つと、iDRACに接続できるようになりましたので、再度仮想コンソールを開きます。
勘のいい方はもしかしたらお気づきになるかもしれませんが、iDRACのFirmwareが更新されてバージョンが変わったことでiDRACの管理画面が少し変わっています。
さらに待っていると、いよいよAHVがシャットダウンされてサーバーが再起動されます。
Hardware Entitiesにある各種Firmwareが更新されていきます。
PRISMの画面に戻ってタスクの進行状況を見てみましょう。AHV上でCVMのステータスが開始待ちになっているようです。
また数分待っているとすべてのタスクが完了しました。
⑨LCMの画面を開きます。更新に必要なすべてのステップが完了したことが分かります。更新対象のFirmwareの数が9個から6個に減ったことが見て取れます。
⑩LCM上でのタスクは完了しましたが、本当にFirmwareが更新されたかを確認したいと思います。iDRACのFirmwareインベントリ画面でFirmwareバージョンを確認して、更新前と更新後のバージョンの差異を確認します。
今回更新した結果、以下のような結果が得られました。
iDRAC、NIC、BIOS、RAIDコントローラー、ブートデバイス用のRAIDコントローラー、Lifecycle ControllerについてのFirmwareが更新されていました。(赤字で示したバージョン)
#終わりに
ということで、LCMによるFirmware更新作業が終わったわけなのですが、NutanixのLCM機能は以前よりも扱いやすく確実に進化していることがよくわかりました。
今回はPRISM以外にiDRACの画面を見たり、PRISM上でも仮想マシンの状態やタスクの進捗状態を見ながら作業をしていましたが、1~2台のホストで更新をしてみて問題なくFirmware更新が終えられることが分かれば、残りのホストについては更新ボタンを押して、あとは終わるまで放っておけばいいというくらい楽な作業で済んでしまいます。
一般にFirmwareの更新は何かと手間な印象ですが、LCMだけで完結できるのであれば、自分でFirmwareを探し回って一つずつやり方を確認しながら作業をせずとも、数クリックで作業が完了するので運用上非常に強力な機能になるといえるでしょう。
Nutanix製品に限らず、他のHCI製品でもライフサイクル管理は一つの大きなテーマになっているようですので、今後も各社機能強化を進めていくことと思いますが、引き続きNutanixのLCM機能を追いかけていきたいと思います。