はじめに
2025年10月に開催された Observability Conference Tokyo 2025 に参加しました。
このカンファレンスは、国内外のオブザーバビリティ実践者・ツールベンダー・開発者が一堂に会し、「これからの観測と改善のあり方」を議論する非常に実りあるイベントでした。
運営・登壇者の皆様に深く感謝します。特に基調講演で登壇された Honeycomb Field CTO Liz Fong-Jones 氏 の講演は、現場のエンジニアとしての視座を揺さぶる素晴らしい内容でした。
この記事ではその講演の要点と学んだ内容を共有させていただきます。
基調講演のテーマ
「Affordable Observability: Strategy to Implementation」
1. ツール中心主義からの脱却
近年、ログ・メトリクス・トレースを「とにかく全部集める」傾向があります。
しかしLiz氏は明確に警鐘を鳴らしました。
「データを集めることが目的になった瞬間、チームは盲目になる。」
❌ 悪い事例
- すべてのリクエストをフルログで残し、ストレージコストが爆発。
- ログに文脈(user_idやtrace_id)がなく、原因調査に10倍の時間。
- エラーログとメトリクスが別ツールで分断され、相互参照が困難。
✅ 良い事例
- 1トランザクション=1レコード(構造化JSON) としてログを設計。
-
trace_idやuser_contextを必ず含め、アプリ層・API層・DB層の関連を一貫して追える。 - ログとトレースを一元化(例:HoneycombやOpenTelemetry Collectorで統合)。
2. “マーブル”モデル:イベント中心の観測
Liz氏が用いた印象的な比喩が「Marble(ビー玉)」です。
1つのリクエスト(=ビー玉)がシステムを転がるように移動し、その中に全ての情報(ユーザー、リクエスト内容、遅延、結果)を内包する。
「1粒のビー玉の中に、あなたのシステム全体の理解が詰まっている。」
これにより、
- 部分的なログではなく全体的なユーザー体験を線で追える。
- どこで遅延が発生したか、“体験の変化点”を特定できる。
3. 内製ではなく「理解の最適化」へ
「Observability Stack を作るのではなく、Understanding Loop を作れ」
近年多いのが、OpenTelemetryやClickHouseを使ってフル自作するケース。
しかしLiz氏は、それが目的化してはいけないと強調しました。
❌ 悪い例
- 自前でOtel CollectorやGrafana Tempoを構築するが、誰もクエリを書かない。
- 膨大なデータを貯めること自体が「成果」と誤解される。
✅ 良い例
- SaaSやマネージドOtelを活用し、可視化・探索・改善サイクルを高速化。
- アラートや検証をリリースごとに自動化(例:Honeycomb’s RefineryやeBPF活用)。
- チーム全体で**「観測結果を意思決定に使う文化」**を醸成。
4. データスプロールと「Reduce / Reuse / Recycle」戦略
Liz氏はデータ増大問題に対し、環境保全のような考え方を提案。
| 方針 | 内容 |
|---|---|
| Reduce | 本当に必要なイベントだけを残す(サンプリング・集約) |
| Reuse | 一貫したスキーマを定義して再利用可能に |
| Recycle | 集約・要約データを分析やMLに再利用 |
→ これにより「意味のある少量のデータ」でより良い理解を得ることができる。
5. オブザーバビリティ文化の醸成
最も重要なのはツールではなく、チーム文化。
「Observability is a team sport.」
- チーム全員が「何を観測すべきか」を理解し、開発段階から埋め込む(Shift Left O11y)
- インシデント時に「責任を探す」より「理解を深める」文化を
- 成功指標は「アラート数」ではなく、「理解速度(Time to Learn)」
まとめ:2025年のオブザーバビリティの指針
| 観点 | これまで | これから |
|---|---|---|
| 目的 | 可視化すること | 理解して改善すること |
| データ | 量を増やす | 意味のある構造化データに絞る |
| 組織 | SRE / Platformチーム中心 | 全員がO11yに責任を持つ |
| 成果 | ダッシュボード数 | 問題解決までの時間短縮 |
| ツール | 自作・個別管理 | 統合・活用・文化化 |
感想
今回の講演を通じて、**「オブザーバビリティ=目的ではなく、ユーザー体験を理解し改善するための手段」**ということが心に残りました。
可視化やログ収集の仕組み作りに没頭しがちなテーマについて、「何を理解するために観測するのか?」という問いを突きつけられた時間でした。
この気づきを、これからのシステム運用・改善に活かしていきたいと思います。
関連リンク
💬 本記事が、オブザーバビリティを“文化として根付かせる”きっかけになれば幸いです。