クリスマスのアドベントカレンダーからいらした皆様、こちらはただの普通の記事です。毎年クリスマス感ゼロでごめんなさい。
#ステータスとは
制御室のここに表示されるやつのことです。
キューのステータスとかもありますが、今回はプロセスの処理具合のステータスのことです。
このステータスに表示される「Pending」「Running」などのステータスは、DBの「BPAStatus」テーブルにて定義されています。
これらの定義されているステータスは、実行ログに残ります。
##それぞれのステータスのだいたいの説明
###Pending
プロセスはRRに割り付け済で、スケジュール実行とか「今すぐ実行」で実行指示はされてるけど、まだ実行されてない。字がオレンジ。この状態ならまだDeleteできる(プロセス名を右クリック)。
###Running
いま実行中。字が緑。
###Terminated
例外スローされて終了した。字が黒。
###Stopped
Immediately StopとかRequest Stopとかを人間が手で指令して途中で止めたやつ。字が赤。
###Completed
ふつうに完了した。字が青。
#DBの定義にないステータス
上の「BPAStatus」テーブルに載ってないやつは、実行ログには残りません。
なんで残らないかというと、下に挙げる2個のステータスは「いまこの瞬間にRRはこのような状態です」という いまの状態の通知にすぎなく、「これが出た=対処すべき事態」とかいう話ではない から。(これが出たあと結局処理止まっとるとかそういうことはありますが、このステータスが直接の原因を示すものではない、ということです)
###Warning
有名。フォーラムやなんかで「これ何?」っていう質問が定期的に出がちなやつです。
公式の説明 What does a status of 'Warning' mean when displayed in Control Room?
ステージの「Warning threshold」とその右の「Number of minutes」で定義された時間のぶん操作が無いと出るステータスです。
「定義された時間」というのは「Warning threshold」が「System Default」だったらデフォルトの時間(5分)、ここのドロップダウン選択を「Overridden」に変えると「Number of minutes」を自分で設定できます。
####対策
たとえばリソースとかターゲットアプリケーションがそのときだけ一時的に激重になってるとか、意図的に500秒の超長いSleepを入れているとか、原因がわかってて、待ってて大丈夫なら、待ってると操作が再開されて「Running」に戻ったりすることもあります。
そうじゃなければオブジェクトのつくり(やたら長く待機してないかとか、ハイライトするところが意図する箇所と違ってないかとか、ターゲットアプリケーションからの応答がなかったら待ってないで終わるようにするとか)をチェックしたほうがいいかもしれません。
###Not Responding
先日初めて見ました。(これがこの記事を書いておこうと思ったきっかけです)
しばらく放置していたら「Running」に戻りました。当該処理は正常終了しました。
また出たときは、今度は「Running」に戻らず「Not Responding」のままで動いている様子もなく、Immediately Stopをかけてもガン無視状態でどうしようもなく、仕方なくRRに人間がサインインして再起動しました。こんな腕ずくな方法で正しい対処かどうかはわかりませんが……。
これは何だろうと検索しても情報も資料も出てこなく、公式コミュニティでも「これが出た、教えて」と言っている人はいますが回答がついてないので、ほんとにレアケースなのかもしれません。
調べてわからなかったらサポートチケットで公式に質問するのが早いので質問してみました。
返ってきた回答は
- ターゲットアプリケーションとRR間の通信が失われたときに出るステータス(永遠に失われたんじゃなくて「そのときに通信してない」っていう意味)
- Blue Prismからではなく、環境的なところで発生している
- ターゲットアプリケーションを実行するのに Windows OS リソース(CPU、RAMなど)が不十分な場合
- ターゲットアプリケーションが過負荷になっている場合 など
なので、Blue Prismのログとかでなく、当該RRのWindowsイベントビューアを確認するほうが原因がわかるとのことです。
Windowsで発生したことを確認できるWindowsイベントログを解説する
これが何でどうやって何を見るとかのお話はBlue PrismでなくてWindowsのお話になってしまうので、別に書きます。
※イベントログを眺めていて、たぶんこれじゃないかと思われるものを自分用にここに貼っておきます。
Windows10 1809 DistributedCOM エラー 10016 SecurityCenter がらみの解消
Windows 10の イベントID 10016 を解消する方法
こんなログが出てたから…… これイベントID10016っていうコレよね?
アプリケーション固有 のアクセス許可の設定では、CLSID
{-}
および APPID
{-}
の COM サーバー アプリケーションに対するローカルアクティブ化のアクセス許可を、アプリケーション コンテナー 利用不可 SID (利用不可) で実行中のアドレス LocalHost (LRPC 使用) のユーザー NT AUTHORITY\SYSTEM SID (S-1-5-18) に与えることはできません。このセキュリティ アクセス許可は、コンポーネント サービス管理ツールを使って変更できます。
####対策
頻発しちゃったら、Windowsイベントビューアとかタスクマネージャとかで原因を探すのが根本解決ですが
端的に言ってRRがターゲットアプリを扱うのにいっぱいいっぱいになってるってことなので
たとえばたくさんダウンロード処理をさせる処理の場合だと
「ブラウザでファイルをダウンロードするときにメモリを占有する→占有されたメモリが解放されずにまたすぐダウンロード→さらにメモリ占有……」
でメモリが食われちゃってるとか的な感じ?
なので
- 定期的に(日次とか)RRを再起動する
- プロセスは、使ったアプリは使い終わったらちゃんとみんな閉じるとか、DBとかのコネクションとかcreateしたインスタンスとかもちゃんと終わるように作る習慣をつける
- アプリでめっちゃいっぱい何かを繰り返す処理の場合は、アプリを立ち上げ直すなどの手順を入れてメモリが食われ続けないようにしてみる
みたいな地味な対策がいいのかしら……
※あと「環境ロックはちゃんと解除」とかも思ったんですが、それは6.5でBlue Prismがよろしくやってくれる仕様に変わったようです。解除しなかった人が多かったんだろうなあ…… 6.5より前のVerをお使いの場合はちゃんと明示的に解除したほうがいいと思います。
そのときだけたまたま出たのなら、たとえばネット見てて「なんかインターネット重いかも……超ラグい……」とか思う時と同じ感じで、たまたま重かっただけ、という可能性もあります。
#とりあえず終わりです
Blue Prismのサポートに質問したところ、上記で挙げたもの以外のステータスは無いそうです。
やっぱり、わかんないことがあるときは、ひとりでわかんないままにしたり、SNSでエアリプして神が釣れるのを待つとかするよりは、サポートチケットに投げて教えてくださいーってやるほうが的確だし効率がいいなと思いました。
サポートに投げたらお返事をくれるだけじゃなくて、必要ならチャットしてくれたりリモートで画面やプロセスを見てくれたりしてマジ親切対応なのでオススメです。
このお話もサポートチケットに投げてまだいろいろ聞いている最中なので、良いことを教わったらこの記事に随時追記します。