「Instanaって、(障害発生時の解析だけじゃなくて)監視に使えるんですか?」
こんな質問をお客様から頂く事もありまして、思ったよりもInstanaの機能って知られていないな、と思うこともあったりする2023年。
せっかくなので、締めくくりにSmart Alert(以後、スマート・アラート)が使われるように、紹介をしてみようと思います。
Instanaで監視をする方法
Instanaで監視をする方法は以下があります。
- (従来の)アラート
- スマート・アラート
私はトラブルシュートを依頼されることが多く、システムの仕様を把握していない状況で、Instanaを使った監視、解析を始めるケースが多いです。
そのような状況では、まずはスマート・アラートを適用します。
これが思ったよりも役に立つことが多く、
- アクセスが集中した際に発生する応答時間の悪化を検出
トレースを参照して原因究明を行い、短期間でサービスの質を向上させることに成功。 - 外部サービスで不適に発生するエラーによって引き起こさせる応答時間の悪化を検出。
そのままトレースを参照して原因を究明。
と便利さを実感しています。
で、そのスマート・アラートですが、以下のような監視が可能です。
1. 応答時間の劣化
2. エラーの発生率
3. HTTPステータスコード
HTTP状況コードって耳慣れないですね。
こういう所の翻訳、、、うまく調整したいものです。
それはともかく、画像の通り5xx等のステータスコードを指定して、発生数の急増を監視することが出来ます。
4. 呼び出し回数の想定外の減少
何らかの理由によって、システムの利用量が減少したことを検知します。
5. 呼び出し回数の想定外の増加
SNSで話題になったり、攻撃を受けたりした場合のリクエストの急増を検知します。
お奨めの使い方
1. まずは全体(グローバル)に適用
私のお奨めの使い方ですが、なんと!
「細かい設定は後にして、まずはしきい値のタイプに適応を選択できる、「応答時間の劣化」と「HTTPステータスコード」と「呼び出し回数の想定外の増加」を適用してみる。」
です。
スマート・アラートには「グローバル」と「非グローバル」がありまして、その名の通り、グローバルはそのInstanaの監視中の全てのアプリケーションに対して適用されます。
これを使って全体を一挙に監視します。
細かい条件などは後から考えます。
作るとこんな感じになります。
この際、以下に気をつけてください。
ここでの説明は割愛しますが、アラートチャネルの指定は忘れないでください。
これでInstanaを使った監視を始めることになります。
沢山アラートが飛んでくるか、少ないかは、システムの特性によります。
2. 慣れてきたらカスタマイズ
慣れてきたらカスタマイズをしましょう。
検出が敏感/鈍感すぎると思ったらしきい値を変更します。
あるいは特定のAPIだけ監視したい場合は、対象を絞り込んだアラートを新規作成します。
(この辺りを書き始めると長くなるので、また今度で。)
さいごに
どうでしょうか?
カンタンに始められて、効果を実感できる機能だと思います。
このカンタンさがInstanaの魅力だと思います。
Instanaを使っていても、スマート・アラートを使っていないという方は、ぜひとも使ってみて下さい。
今まで見過ごしていたことに、気づきを得られるかも知れません。