はじめに
本記事はHPE Serverをサーバ付属ツールを利用して監視/管理したい方向けに情報をまとめたものになります。
ここではまずは用語をまとめていきたいと思います。
一元管理のためのソフトウェア
HPE Serverを数十台以上運用する場合、それらを一元管理したくなりませんか?
そんな時に使うツールがHPE OneViewになります。
HPE OneViewの前身はHPE Systems Insight Manager (SIM) 、HPE Insight Control、HPE VCM/VCEMといったものがあります。これからHPE Serverを導入する場合はHPE OneViewの導入を検討すると良いと思います。
HPE OneView
最新版はVMイメージとして提供されています(ESXi/KVM/Hyper-V)。
ダウンロードページに最新版が上がっている、というものではないため、「HPE OneView download」で検索しダウンロードサイトを見つけてください。またドキュメントとしては「インストールガイド」「ユーザガイド」が存在します。ただし最新版の日本語ドキュメントが提供されていないことがあります。
現時点での最新版(6.0)
https://myenterpriselicense.hpe.com/cwp-ui/free-software/Z7550-63180#_in_HPE_OneView_6.0_(release,_March-2021)
インストールガイドの最新版(5.4向け)
https://h50146.www5.hpe.com/lib/products/servers/proliant/manuals/p01317-198_ja.pdf
ユーザガイドの最新版(5.4向け)
https://h50146.www5.hpe.com/lib/products/servers/proliant/manuals/p01322-198_ja.pdf
SPPについて
HPE ServerではService Pack for ProLiant (SPP) という形で各種ソフトウェアが配布されます。SPPに含まれるソフトウェアは大きく以下の3つにカテゴライズされます。
- ドライバ
- インストールしたOSでNICやRAIDコントローラーを使うための各種ドライバになります。ドライバはインストールすることを推奨しますが、実際にはインストールしなくてもNICが使えない、といったことは稀です(OSに付随する汎用ドライバで動作)。RHEL向けにはrpm形式で提供されます。
- firmware
- BIOS/iLO/RAIDコントローラー等のfirmwareになります。RHEL向けにはrpm形式で提供されますが、実際にはインストール後にバイナリを実行・サーバを再起動することでハードウェアのfirmwareが最新化されます。
- 監視/管理ソフトウェア
- Gen9以前は多くのソフトウェアが提供されていましたが、Gen10からはRAIDを操作するためのソフトウェアとAMSぐらいになりました。具体的にどういったものがインストールされるか、AMSとは何かについては後述します。
##SPPの提供形態について
サーバにDVD-ROMが付属することもありますが、最新版はHPEサイトからisoファイルのダウンロードが可能です(要ユーザ登録)。またisoリリース後の修正についてはSDR(Software Delivery Repository) と呼ばれるサイトから個別にダウンロード/インストールすることが可能です。
SDRはWEBブラウザまたはレポジトリとして登録することでyum/apt-getでアクセス可能です。
SPP:https://techlibrary.hpe.com/jp/ja/enterprise/servers/products/service_pack/spp/index.aspx
SPP(FTPサイト):https://support.hpe.com/hpesc/public/docDisplay?docId=a00078208ja_jp
SDR:https://www.hpe.com/jp/ja/servers/linux/technical/sdr-addrepo.html
#障害監視エージェント類
- HPE Integrated Lights-Out(iLO)
- サーバのマザーボードに搭載されている機能で、OSがインストールされていない状態でも使える機能になります。Gen10ではiLO5が搭載されており、ライセンスを購入することでリモートコンソールなどが使えます。OS上でIPアドレスやfirewallの設定を間違えてしまうとsshが切断されていまいますが、リモートコンソールを使える状態にしておくとコンソールから復旧することが可能になるため、できれば利用するようにしましょう。
- HP Insight Management Agent(IMA)
- Gen10では使わなくなりました。IMAはOS上にインストールし、各種情報(温度やファン、NIC故障)を収集するソフトウェアになります。収取した情報はSNMPでtrapを送信したり、SMHを通して現在のステータスを確認することができます。ソフトウェアとしてはhp-health/hp-snmp-agents/hp-smh-templatesなどが提供されていました。
- HP System Management Homepage(SMH)
- Gen10では使わなくなりました。SMHをOSにインストールすることで内部でWEBサーバが起動します。iLOで取得できない情報をIMAを通して取得し表示します。ポートはデフォルトではTCP:2381を使用します。
- HPE Agentless Management
- HPE ServerはOSにエージェントをインストールせずに各種情報を取得することが可能です(iLOを用いる)。そのことをHPE Agentless Managementと呼びます。
- HPE Agentless Management Service(AMS)
- iLOだけでは取得できない情報が一部あります(例:NICのbondig状態)。OSにAMSというソフトウェアを入れることで取得できるデータが増えます。エージェントレス、という名前ではありますが、デーモンとして起動します(RHEL7ではamsdという名前)。
- System Management Assistant (SMA)
- AMSの一機能。AMSの一部としてインストールされ、デフォルトは無効になっています。無効情報ではOSからiLOに情報が転送されます。SMAを設定することで、iLOからOSに情報が転送されます。例えばNIC故障した際にSNMP trapをOS(上のsnmpd)から送信したい場合はSMAを設定し、iLOで全てのハードウェア監視をしたい場合はSMAをoffにします。
##LinuxでSMAを使う時の設定
・snmpd.conf にmaster agentxを追記
・systemctl enable smad_rev;systemctl start smad_rev
・systemctl enable amsd_rev;systemctl start amsd_rev
#後書き
次回はSPPをさらに深掘りして解説したいと思います。また、最新のSPPではどういったものがインストールされるかを記載していきます。
参考サイト:https://www.hpe.com/jp/ja/servers/linux/technical.html