はじめに
この記事はUiPathブログ発信チャレンジ2022サマーの18日目の記事です。
昨日は@shumpeiwatanabeさんの記事、明日は@kambekinuさんの記事です。
今回はOn-Prem Orchestratorの運用設計の内、監視について説明します。
その他の記事
バックアップ編
メンテナンス編
前提
- On-Prem Orchestrator 2021.4
構成は冗長化(Active-Standby)したもの仮定します。
※シングル構成で仮定してもOKです。HA構成(Active-Active)だと構成要素が変わるため(Redisのクラスター構成が追加)、本記事より運用も複雑になります。
1. 死活監視
死活監視とは、サーバ自身の稼働状況をチェックすることです。各サーバのpingをチェックしてもよいのですが、以下、ヘルスチェック用のURLのレスポンスをチェックすることもできます。
リクエスト: GET /api/Status
レスポンス: 成功 (200)
2. リソース監視
サーバリソースの使用状況を監視します。UiPath固有の検討事項ではありませんので、一般的な設定で問題ありません。
以下は参考値です。
CPU使用率
5分間隔の平均が連続2回80%を超える
メモリ使用率
5分間隔の平均が連続3回90%を超える
ディスク使用率
5分間隔の最小が90%を超える
3. ミドルウェア監視
IISやSQL Serverのサービスの死活やパフォーマンスの監視します。これもUiPath固有の検討事項ではありませんので、一般的な設定で問題ありません。
4. ログ監視
主に以下のメッセージがイベントログに書き込まれていないかをチェックします。
ログメッセージ | 状況 |
---|---|
License expired! Starting jobs is no longer possible! | ライセンスの有効期限が切れている場合 |
The transaction log for database 'UiPath' is full | DBのトランザクションログが一杯になった場合 |
System.CompenentModel.Win32Exception: 待ち操作がタイムアウトになりました。 | SQLのタイムアウトが発生した場合 |
System.InvalidOperationException: タイムアウトに達しました。プールから接続を取得する前にタイムアウト期間が過ぎました。 | コネクションプールが枯渇した場合(ロボット接続台数が過剰に増えた状態) |
5. その他の監視
以下は任意です。
Unattendedの接続状態の監視
Unattendedが知らない間に切断などされていると、ジョブの実行に影響が出るので、接続状態を監視します。方法は以下の過去記事で紹介しています。
Unattendedジョブ起動失敗
認証エラーなどでジョブが起動できない場合、Orchestrator画面上でしか状況の確認できないので、運用管理チームへエラーを通知します。
方法は色々ありますが、過去記事ではWebhookとAWS(API Gateway、lambda)を使って通知する方法を紹介しています。
おわりに
次回は最後、「メンテナンス」についてです。
参考
v2019.10を対象としたドキュメントとなりますが、v2022.4でも十分参考になります。