本記事は2023年のオブザーバビリティ予測レポートに関するものです。最新のレポートに関する記事は以下を参照ください。
オブザーバビリティ予測レポートとは?
オブザーバビリティ予測レポートは、企業におけるオブザーバビリティの実践状況や成果、組織の抱える課題、未来の展望などについての調査結果をまとめたレポートで、New Relicが調査機関(Enterprise Technology Research)とパートナーを組んで調査した結果を年次で公開しているものです。日本を含むグローバルの様々な業種や規模の企業における実務担当者とITDM(意思決定者)が調査対象者となっており、世界的な傾向に加え、国別・業種別の傾向も把握できるものになっています。2023年版は1700人が調査対象となっています。
今回は、2023年のオブザーバビリティ予測レポートから読み取れる動向についてざっくり解説していきます!!
オブザーバビリティは拡大!
2023年もオブザーバビリティは広がっています。下のグラフはオブザーバビリティ関連機能別の導入状況です。実際、2022年の調査と比較して多くの機能の導入が増えていることがわかりました。これを踏まえると、多くの企業がシステムの観測範囲を拡大してオブザーバビリティを実現しようとしていることが伺えます。
一方で、サーバーレス、k8s関連はまだまだこれからという状況です。これは技術自体の成熟度・浸透度とも相関しているようですので、今後導入が拡大していくことが予想されます。
日本はシステム停止の頻度が低いがダウンタイムが長い
本レポートの興味深い結果の1つに、日本は他国と比べてビジネスに影響するようなシステム停止の頻度が低いという調査結果がありました。その反面、ダウンタイムが他国よりも長く、一旦システム停止が発生すると、その検知や解決までに長い時間がかかっているという結果も出ています。
一つの仮説として、ウォーターフォール的な開発でシステムの信頼性を初期のリリース前に確保していて障害の発生頻度自体は低いものの、レジリエンスやそれを支えるオブザーバビリティが欠如しているためリリース後の問題の検知や回復に時間がかかっているところが日本では依然として多い、という実態を表していることが考えられます。
グローバル全体のデータと比べると日本はシステム停止をクレームやサポートへのインシデントチケットで検知している割合が多いことも調査結果からわかっています。ユーザー体験の悪化などシステム停止まで至らない問題も含めてユーザー視点・サービス視点で問題をいち早く捉えてプロアクティブに対応していくことが日本では目下の課題であると言えそうです。
日本は海外に比べてログの依存が高い!?
もう一つ、日本ならではの面白い調査結果です。下のグラフはオブザーバビリティ関連機能ごとの導入状況ですが、ほぼ全ての機能でグローバルに対して日本での導入割合が低いものの、唯一「ログ管理」だけがグローバルを上回る結果となりました。このデータは一つ前の調査結果である、日本はシステム停止の検知や回復が遅くダウンタイムが長い、という結果と強い関連があると考えられます。
ログファーストからの脱却が必要!?
つまり、兎にも角にもログを保管し、何か問題が起きたら膨大なログを総力戦で時間をかけて調査する、こういうログファーストのアプローチが日本ではまだ多いと予想されます。まず、膨大な量のログを見にいくようなログファーストのアプローチの場合、問題の根本原因の把握に時間がかかったり、そもそも原因がわからなかったり、ログを調査する「ログ職人」が必要なためスケールしなかったり、ということになりシステム停止の回復の遅れに繋がります。また、ログの文言にアラートを仕掛けるような監視も従前からありますが、アラートノイズになって忙殺されるか無視されたり、ユーザーに影響があるかの判断ができなかったりするため、結果としてシステムの問題検知が遅れるということがあります。
ユーザーに近いところからシステムを見ていくこと、トレース・メトリクス・ログ(MLT)をうまく組み合わせることが重要ですので、その辺りのアプローチがさらに浸透していけば、来年以降の調査では、ログ中心の傾向からグローバルの傾向に近くなっていくかもしれません。
チームやロールを超えた情報の共有/コミュニケーションも課題!?
ダッシュボードの導入が海外と比べて著しく低い割合であることも注目すべきポイントです。"ダッシュボード"という手段/機能が大事という話ではなく、組織内の異なるチームやロール間でデータが共有されるような文化の醸成ができていないことが本質的な問題である可能性があります。問題の解決の際に各チームが異なるデータやツールを見ていたり、伝言ゲームになっているのであれば、結果として問題解決に時間がかかるのでダウンタイムが長くなるという前述の調査結果と整合が取れます。
また、例えばビジネスとエンジニアなど、デジタルサービスに関わる異なるロールの人同士が一方の都合で意思決定をしても良いサービスの改善には繋がりませんから、同じゴールに向かって共通認識の下で意思決定がなされるためにも情報が共有された状態でコミュニケーションすることが大事と考えられます。
この点も、オブザーバビリティの浸透と共に来年以降の調査で活用が進んでいくかもしれません。
オブザーバビリティの効果は様々
オブザーバビリティはシステムやエンジニアに観測する能力を与えますので、そのメリットは多岐に渡り、下のグラフのように実際の調査結果でも多様なメリットが挙げられています。システムの信頼性向上や運用効率の向上など、従来監視ツールがメインターゲットとしている運用者のメリットはもちろんの事、エンジニアのトイルや障害調査の割り込みなどをなくすことで開発生産性の向上にも繋がります。また、ユーザー体験を向上したり、ビジネス視点での分析も可能になるため収益向上に繋げていくことも可能です。どのようなメリットを享受するかは各企業の組織構造や運用体制、プロセス、システム構成などによりますが、いずれにしても実際にオブザーバビリティを実践している企業自身が挙げているこれらのメリットは無視できないでしょう。
定量的な価値に換算すると、オブザーバビリティへの投資に対して得られる価値の中央値は、年間で投資額の2倍となっています。つまりオブザーバビリティへの投資から2倍のリターンを年間で得ていることになります。
特に、フルスタックオブザーバビリティを実現している企業の場合は、より高い効果を発揮しているようです。フルスタックオブザーバビリティを実現していない場合と比較して、一貫してシステム停止が少なく、平均検出時間(MTTD)と平均復旧時間(MTTR)が短く、またシステム停止に伴うコストが低く、年間ROIの中央値が高くなっています。以下のグラフは、フルスタックオブザーバビリティの実現有無が企業が得られる効果にどう影響するかを表しています。システムの部分しか観測できていなかったり、多数のツールを組み合わせて活用することの非効率さを考えると、この結果は想像に容易いものかもしれません。
オブザーバビリティの今後と課題
2023年、オブザーバビリティが拡大していることは冒頭で示しましたが、この勢いは今後もさらに加速することがデータからわかってきました。下のグラフは、各企業が今後どのオブザーバビリティ関連機能を導入予定かを示したものですが、大部分の企業がほぼ全ての機能をここ数年で導入予定と回答しています。
オブザーバビリティの実践における今後の課題としては、人材教育やサイロになっているツールの統合などが挙げられています。また、オブザーバビリティの実現にあたっては単にツールを導入して終わりではなく、組織やカルチャーの変革なども合わせていくことでその効果は最大化していくことができます。
また、この結果を踏まえるとオブザーバビリティソリューションとしては、エンジニアによる導入・活用のハードルを下げるような機能のリリースやサポート体制、サイロを無くすための機能カバレッジの拡充が求められてきそうです。
まとめ
2023年版のオブザーバビリティ予測レポートを読み解き、特筆すべき特徴をいくつか挙げてみましたが、いかがでしたでしょうか?オブザーバビリティは加速していますが、日本はまだまだ伸び代がありそうですね。来年のオブザーバビリティ予測レポートではこの状況がどう変化しているか楽しみでなりません。
オブザーバビリティ予測レポート本体ではより詳細な解説をしていますので、是非レポートもご覧ください。以下のページから参照できます。
無料のアカウントで試してみよう!
New Relic フリープランで始めるオブザーバビリティ!
New Relic株式会社のQiita Organizationでは、
新機能を含む活用方法を公開していますので、ぜひフォローをお願いします。