概要
この記事では、AIOps の動向と学習のため、各社の AIOps について調べたことを記録しています。
今回は OpsRamp社の AIOps について調べてみました。
OpsRamp を一言でいうと
SaaS 型 IT 運用管理プラットフォーム
できること一覧
- 異常検知
- 予測検知
- アラートの相関
- 定期的なアラートの抑制
- 自動修復
- インシデントの自動ルーティング
1. 異常検知
最近の傾向から突然の変化を検出した場合にアラートを生成します
2. 予測検知
しきい値に違反するまでの予測時間に基づいてアラートを生成します
3. アラートの相関
機械学習により、過去のアラートの発生パターンから相関関係にあるアラートをグループ化します。
その結果、アラートの数を削減して、根本原因を特定します。
4. 定期的なアラートの抑制
定期的に発生して自然解消するアラートを自動的に抑制します。例えば、毎週土曜の夜にジョブを実行するので一時的に負荷が上がるといったケース。
その結果、メール通知やインシデントの数を削減します。
5. 自動修復
アラートをトリガーにしてスクリプトを呼び出し、自動修復アクションを実行します。
6. インシデントの自動ルーティング
アラートをトリガーにインシデントを自動作成する際に、過去のアラート、インシデント、および通知データに基づいた学習パターン(担当者グループ、問題のカテゴリ、優先度、ナレッジベースなど)を使用して、さまざまなタイプのアラートのインシデント割り当てをルーティングします。
参考資料
https://www.opsramp.com/solutions/service-centric-aiops/?lang=ja
https://info.opsramp.com/service-centric-aiops-white-paper