オブザーバビリティ
可観測性:外部からシステムがどれくらい観測可能か
情報を収集する Logs
Kubernetesの標準機能にもあるが、これだとPodがNodeから消えると見られなくなってしまう。
クラウドベンダーのKubernetes環境を使う時、クラウドベンダーのログ保存、検索を使うとKubernetes以外の環境でもみれるようになる
OSSの例:Grafana Loki、Fluented,Fluentbit
測定値を処理する Metrics
測定値の集合。統計的な処理や傾向を見るときに使う。
例えばログインの数を数える時、Logで表示してから一つずつ数えるのは現実的ではない。
メトリクスもログ同様、クラウドベンダー標準機能を使える
OSS:Prometheus
通信追跡 Traces(分散トレーシング)
コンテナが複数存在する状態で環境以上が発生した時、どのユーザーのリクエストがどのコンテナを経由したかを調べる時に使う
正確に通信を追跡するにはリクエストの通るミウィ全てにTracesとSpanを設定しないといけないので実装のハードルはちょっと高い。
OSS:OpenTelemetry
Traceを収集するOSS:Jaeger,Grafana tmepo
モニタリング
ダッシュボード
MetricsやTraceはある一点だけをみても何もわからない。可視化するためにダッシュボードを作る必要がある。障害調査、性能劣化、異常の発見に使える。
OSS:Grafana
アラート
異常が出たらわかるように、アラートにはMetricsを使う。
OSS:Prometheus内部にAlertManagerというのがある