Datadog APMを学ぶなかで、
APMでのデータの流れのわかる図が公式ドキュメントにあったので、各フェーズに該当するドキュメントリンクと簡単な説明を整理してみました。理解が薄い項目もあるので今後加筆する可能性もあります。
前提知識
以下の用語だけ理解していれば流れは追えると思います。
-
トレース:1つのリクエスト/トランザクション全体を表し、複数のスパンで構成される
- 例:
- スパン:特定の期間における分散システムの論理的な作業単位
- 例:
-
メトリクス:環境に関するあらゆる情報を時系列で追跡できる数値
- 例:レイテンシー、リソース利用量/利用率、エラー発生数/率
参考
Datadog::用語集
Datadog::APM の用語と概念
Datadog::APM::トレースビュー
全体の流れ
https://docs.datadoghq.com/ja/tracing/trace_pipeline/ の図に対して番号をつけています。
① Your instrumented applications
https://docs.datadoghq.com/ja/tracing/trace_collection/
アプリからDataDogへのデータ送信
エージェントをインストールしたり、トレーシングライブラリを利用することでアプリからDatadogへデータ送信する。
② Ingestion Sampling rules
https://docs.datadoghq.com/ja/tracing/trace_pipeline/ingestion_mechanisms/
アプリから送られてきたもののうちどれを取り込むかルールに従ってサンプリングを行う。
デフォルトのルール(ヘッドベースサンプリング)が用意されているが、エージェントやトレーシングライブラリのオプションでサンプリング方法はカスタムできる。
③ 15mins Live Search
取り込まれた全てのスパンは15分間利用可能
④ Metrics from Span
スパンからメトリクスを生成する
https://docs.datadoghq.com/ja/tracing/trace_pipeline/generate_metrics/
⑤ Retention filters
どのスパンをインデックス化して保持するか
https://docs.datadoghq.com/ja/tracing/trace_pipeline/trace_retention/
⑥ 15 days Indexed Search
⑦ Trace Analytics monitors Dashboards, Notebooks
トレースデータの視覚化、解析をするためのツールやサービス、レポートについて記載
https://docs.datadoghq.com/ja/tracing/services/