LoginSignup
15
7

More than 3 years have passed since last update.

DatadogのDashboard(Timeboard)が便利!

Last updated at Posted at 2019-07-18

概要

Datadogは柔軟にダッシュボードを作成することができますが、
ダッシュボードを作成しようとすると選択肢が2つ出てきます。

スクリーンショット 2019-07-18 14.12.35.png

最初はこの2つの違いをよく理解できていないかったので、どっちを使えばいいだ?ってなってましたが、
使ってるうちにTimeboard 便利やん!」となったのでご紹介です。

ダッシュボードの概要

Screenboardについて

For status boards and sharing data とあるようにサービスのステータスがパッと一目で把握できるためのダッシュボードとして使っています。
例えば、各プロダクトごとのSLOの達成状況や外形監視(Synthetics)の結果、レスポンスタイム、エラーレイトといった値を可視化し、パッと見ただけでサービスの異常がざっくりと分かる作りにしています。

少し話がそれますが、最近SLOの機能がリリースされたので、このSLOの達成状況をダッシュボードで表示してたりします。

例 SLO)
スクリーンショット 2019-07-18 14.58.42.png

Timeboardについて

For troubleshooting and correlation とあるように主にトラブルシューティング時のダッシュボードとして使用しています。
AWSをDatadogで監視している場合、ALB、EC2、RDSのメトリクスを取っているかと思いますが、それをこのTimeboard上に配置してます。

例 EC2のメトリクス)
スクリーンショット 2019-07-18 14.28.53.png

Timeboardの何がうれしいか

ここがいいなと思ったところなんですが、Datadog上で発生したイベントの発生時刻をTimeboard上の各種メトリクスにオーバーレイすることができます。

例えば、Dagtadogで設定した「Response Time」のアラートが発生した場合、そのアラートを検索窓で検索することで各種メトリクス上に発生時刻をオーバーレイします。

例 検索窓)
スクリーンショット 2019-07-18 14.39.35.png

例 Response Timeの検索結果)
スクリーンショット 2019-07-18 14.42.27.png

この例だと、左のピンク線がアラート発生時刻で、右のピンクの線がアラート復旧時刻となります。
このTimeboard上にEC2やRDSといった関連しそうなメトリクスを配置しておけば、アラート発生・復旧時刻と各種メトリクスがオーバーレイされ、相関が可視化できるため、トラブルシューティング時に役に立つことがあります。

まとめ

今まであるようでなかったこの機能、トラブルシューティングにとても役に立ちます。
トラブルシューティング時に役に立ったメトリクスをどんどん追加して、育てていく感じで徐々にブラッシュアップしていくことをオススメします。

15
7
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
15
7