New Relicが調査機関とパートナーを組んで公開している年次のオブザーバビリティ予測レポートの2024年版を読み解き、いくつかトピックをピックアップして紹介します。
オブザーバビリティ予測レポートとは?
オブザーバビリティ予測レポートは、企業におけるオブザーバビリティの実践状況や成果、組織の抱える課題、未来の展望などについての調査結果をまとめたレポートで、New Relicが調査機関(Enterprise Technology Research)とパートナーを組んで調査した結果を年次で公開しているものです。日本を含むグローバルの様々な業種や規模の企業における実務担当者とITDM(意思決定者)が調査対象者となっており、世界的な傾向に加え、国別・業種別の傾向も把握できるものになっています。
2024年版は全世界16カ国1700人の実務担当者(65%)とIT意思決定者(35%)が調査対象となっています。今回は、2024年のオブザーバビリティ予測レポートからいくつかトピックをピックアップしてご紹介します。
システム障害とビジネス影響は益々大きく
オブザーバビリティの話に入る前に、現在のシステム障害やその影響の大きさについてです。調査結果によれば、ビジネス影響の大きな重大障害はどの組織でも依然として多く、ダウンタイムや障害によって生じるコストも非常に大きくなっています。
- 重大障害が週1回以上発生: 38%
- 年間のダウンタイム(中央値): 77時間
- 障害による年間のコスト/損失(中央値): 1億4,600万ドル
重大障害が週1回以上発生している割合は昨年は31.9% でしたが、今年は38% に上がっており数値だけ見ると悪化しています。ITシステムがビジネスの中核となっている今、ビジネスのスピードに応えるために新たな機能追加やシステムの複雑化が進み、品質確保や迅速な問題解決が益々難しくなっている状況を表していると考えられます。
エンジニアへの生産性への影響
システム障害やその影響は大きいことは上記の通りですが、それはエンジニアの生産性にも大きな影響を与えています。
今回の調査によれば、 エンジニアが障害対応に費やしている時間の中央値は業務時間の30% だそうです。一週間の業務時間を40時間とすると、約12時間を障害対応に費やしていることになります。また、業務時間の半分以上を障害対応に費やしているエンジニアはなんと29%にも及んでいます。組織によって大小はあると思いますが、仮にそのぐらい時間が障害対応に取られているとすると、開発や改善など本来注力したい業務に十分時間を使えているとは到底言えないでしょう。
上流での品質作り込みやプロアクティブな改善、トラブルシュートの効率化によってエンジニアが時間を浪費されることを避けること(つまりは、オブザーバビリティの向上で後述のメリットを享受すること)は必至の課題と言えます。
オブザーバビリティのメリット
システムのオブザーバビリティを向上することで様々なメリットを享受できますが、調査によれば回答者は以下のような項目でのメリットを感じているようです。品質向上や運用効率向上、開発者体験の向上、顧客満足度の向上、収益への向上など、守りから攻めに至るまで様々なメリットがあります。
さらに、以下が実現できている組織は特にその効果が高くなることが調査結果から明らかになっています。
- フルスタックオブザーバビリティを実現
- テレメトリーデータを統合(サイロの排除)
- より多くのオブザーバビリティ関連機能を導入
- オブザーバビリティの実現に単一のツールを使用
- ビジネス関連データをテレメトリーデータと統合
etc.
例えば、複数のツールを併用する場合に比べて単一のツールを利用している場合は、障害対応に費やす時間が50%減少しました。また、2つ以上のツールを使用している企業に比べて障害にかかるコストは45%も減少したとのことです。
また、フルスタックオブザーバビリティを実現している場合は、そうでない企業と比べてMTTRが改善したと回答する傾向が23%高くなり、年間のダウンタイムに至っては79%も削減できています。
オブザーバビリティのROIは4倍、前年比の2倍
調査結果によると、オブザーバビリティの年間支出の中央値は195万ドルです。決して安いとは言えませんが、注目すべきはそこから得られる年間の価値でその中央値は815万ドルでした。つまり、オブザーバビリティへの投資に対して4倍のリターンが得られるという結果になっています。2023年の調査結果ではROIは2倍だったことから、その効果はより顕著に出てきていると言えます。
ダウンタイムを減らし、運用効率を上げ、開発生産性を向上し、顧客体験を上げてビジネスの収益も向上する、加えてクラウド含めたインフラコストを適正化できる。オブザーバビリティによって得られるこういった諸々のメリットを考えるとこのROIが出るのは全く不思議ではありません。
オブザーバビリティの障害の1つはツールのサイロ
上記のメリットをもたらすオブザーバビリティですが、それを阻む障害ついての調査結果です。最も多かったのはツールやデータのサイロでした。ツールやデータがサイロになっており、オペレーションや組織間のコミュニケーションが分断していてはオブザーバビリティの向上は達成しにくいことは想像に易いです。
ツールの統合は加速
上記の通り、ツールの統合はオブザーバビリティをさらに向上する有効な手段の一つです。実際にどの程度の数のツールが利用されているかを表しているのが下のグラフです。
2024年のグラフの山は、2023年や2022年のグラフの山に比べて頂上が年々左にシフトしているのがわかります。これはすなわち2024年はより少ない数のツールを利用している回答者が多く、つまりはツールの統合が進んでいることを表しています。
実際、単一のツールを使っている割合は2023年の5%から2024年の6%に増加、5つ以上のツールを使っている割合は2023年の52%から2024年の45%に減っています。現在は少しずつではありますがツールの統合は今後も進んでいくと考えられます。
ビジネスデータの統合が加速
今年のレポートで新たに見られた傾向が、ビジネス関連のデータとテレメトリーデータの統合です。ビジネス関連のデータをテレメトリーデータと結びつけて活用している組織は、年間のシステム停止時間の低減などの効果を得ているという結果も出ています。
ビジネスにとって重要な指標(注文数や売上など)とそれを支えるシステムの指標(アップタイムや重要処理のパフォーマンスなどの信頼性の目標)を関連付けることで以下のようなことを実現できるのが、重要性が増している理由と考えられます。
- ビジネスのゴールに基づいてシステムのゴールを設定ができる。ビジネスとシステムの共通言語を作りインピーダンスミスマッチを解消できるとでも言えるでしょうか。
- ビジネス影響のある問題やその兆候がないかをすぐに把握でき、問題の影響や対応の優先度をビジネス上の重要度も踏まえて判断できる
サイト訪問者数、発注数、売り上げなど、今現在もビジネス関連のデータをテレメトリーデータと統合している組織はいますが、今後もその動きは加速すると調査結果が示しています。エンジニアとしては、自分の活動がどうビジネスに貢献しているかも見えるようになるのでモチベーションも上がりますね🙌
オブザーバビリティのビジネス上の重要性が増していることは他の質問に対する回答からも表れています。以下のグラフはオブザーバビリティの導入目的についての回答ですが、単なるインシデント対応や予防強化だけを導入の目的としている組織はごく一部で、むしろ中核的な事業目標の達成するための必須要素として導入している組織が多くなっているという結果が出ています。
『オブザーバビリティの応用』は、Gartnerの2023年の戦略的テクノロジのトップ・トレンドの一つとして挙げられていましたが、それが2024年になって実践され始めているということを表しているのかもしれません。
まとめ
今回は2024年のオブザーバビリティ予測レポートから読み取れる動向をいくつかピックアップしてご紹介しました。昨年に増してオブザーバビリティは浸透しており、その効果を享受している組織が多くなっていることがデータからわかりました。また、今後はツールの統合やビジネスデータの統合が注目すべき動向になりそうです。
オブザーバビリティ予測レポート本体ではより詳細な解説をしていますので、是非レポートもご覧ください。
全ての組織がオブザーバビリティのメリットを享受するにはまだ時間がかかりそうですが、来年はどうなっているでしょうか。お楽しみに👋
過去のレポートはこちら
その他
New Relicでは、新しい機能やその活用方法について、QiitaやXで発信しています!
無料でアカウント作成も可能なのでぜひお試しください!
New Relic株式会社のX(旧Twitter) や Qiita OrganizationOrganizationでは、
新機能を含む活用方法を公開していますので、ぜひフォローをお願いします。
無料のアカウントで試してみよう!
New Relic フリープランで始めるオブザーバビリティ!