AIOps
AIOps 自体は可観測性の重要な方向性の一つであり、LLM の普及とともに再び注目を集めています。現在、AIOps は多くの予測記事で大きなテーマとなっており、ここでは専門用語にこだわらず、統一して AIOps と呼びます。AIOps がカバーする範囲は非常に広いです:
- AIOps プラットフォーム:AIOps の進化は加速し、最終的にはプラットフォーム化されるでしょう。このプラットフォームは AIOps のライフサイクル全体を管理し、異常検知、根本原因分析、自動化機能を統合し、統一された AIOps ソリューションを提供します。
- AI 駆動の予測:AI による障害検知や事後分析は、AI 駆動の予測へと移行し、データ量や複雑性の増加に対応します。AI や機械学習アルゴリズムを活用して、問題が業務に影響を及ぼす前に予測し、システムのパフォーマンス向上と介入能力を強化します。
- AIOps の自動化:AIOps は ITOps の自動化レベルを大幅に向上させ、潜在的な問題を自動検出し、根本原因分析にかかる手作業の負担を軽減します。
- 自然言語インタラクション:LLM に基づく自然言語インタラクション機能により、IT 担当者が観測データをより簡単に照会できるようになります(例:Chat2PromQL、Chat2SQL など)。
- クラウド環境における AIOps の必要性:企業のクラウド移行が進み、コンテナ化や各種クラウドネイティブ製品の導入が加速する中、AIOps の能力が求められています。クラウド環境の可観測性を迅速に確保し、リソースの監視、分析、最適化を自動化することで、システムの効率的な運用を実現します。
- DevOps と AIOps の融合:DevOps と AIOps の境界は曖昧になり、統合された運用チームが形成される可能性があります。これらのチームは、AI の専門知識と従来のソフトウェア開発・IT 運用を統合し、ソフトウェアライフサイクルと AI モデルのライフサイクルを管理しながら、継続的な改善を進めます。
OpenTelemetry
OpenTelemetry は可観測性と AIOps の両方で注目されるホットな話題であり、CNCF や主要クラウドプロバイダー、独立系可観測性ベンダーの支援を受け、事実上の標準となっています。Trace、Metric、Log に加え、2024 年には Profiling 標準が導入され、可観測データのフォーマットを統一し、関連付けを確立することを目指しています。OpenTelemetry のプロトコルと OpenTelemetry Collector はベンダー非依存であるため、2025 年にはテレメトリーデータ収集の基盤としての地位を確立するでしょう。OpenTelemetry はデータフォーマットの定義と収集機能を提供するのみで、バックエンドの実装はベンダーが担うため、2025 年にはさらに多くのベンダー製ツールが登場するでしょう。
統合観測プラットフォーム
2025 年の可観測性の重要なトレンドの一つは、統合プラットフォームへの移行です。これらのプラットフォームは、Log、Trace、Metric、Event、Profile を統合し、一元的な視点を提供します。これにより、以下のメリットが得られます:
- 監視ツール間のデータのサイロ化を解消し、データ間の関連性を強化する。
- ハイブリッドクラウドやマルチクラウド環境でシームレスな可視化とトラブルシューティングが可能になる。
- 単一のインターフェースから全体的なインサイトを得ることで、根本原因分析のコストを削減する。
このトレンドの進展に伴い、Datadog、Splunk、New Relic などのベンダーが、高度に統合された効率的なソリューションを提供する方向へと舵を切っています。
右方向の観測(観測のエッジ化)
エッジコンピューティング環境向けのコンシューマーおよび産業用デバイスの数は急速に増加すると予測されており、これらのデバイスは強力なコンピューティング能力と接続性を提供し続けています。その増加に伴い、観測と監視はエッジデバイスにも拡張する必要があります。まだこの機能を提供していない観測ベンダーにとって、2025 年にこの需要へ対応することは、エッジ環境に技術スタックを拡張する顧客の要件を満たすために不可欠となるでしょう。
さらに、企業はユーザーの実際の体験に関わるフロントエンドの監視により注目するようになります。これには、エッジデバイスや端末に拡張できる監視能力が必要です。観測の対象は全体ではなく細部にシフトし、企業は全体のパーセンタイル分析ではなく、個々の顧客ごとの監視により重点を置くようになります。観測ツールのコア要件は以下の通りです:
- 軽量なデータ収集能力を持ち、リソースが限られた IoT シナリオにデプロイ可能であり、一部の処理を端末で実行可能であること。
- 高効率かつ低遅延のグローバルネットワークサポートを備え、ネットワーク高速化の機能を持つこと。
- 大規模データの低コストストレージおよび計算を可能にするデータプラットフォームのサポート。
- グローバル規模でのリアルタイムデータ統合を可能にし、データを移動せずに統一ビューを提供できること。
左方向の観測(観測のシフトレフト)
プラットフォームエンジニア、運用エンジニア、DevOps、その他のステークホルダーは、開発サイクルに観測を組み込むことの重要性を認識し始めています。特に、Kubernetes のような高度に分散・連携したサービスやアプリケーションでは、これが非常に重要です。単なるテストを超えて、スタック全体を詳細に観察し、開発サイクル全体にわたってアプリケーションとの相互作用を分析することが、観測のもう一つの重要な側面です。このアプローチは、2025 年にはさらに広く普及する見込みです。
過去数年で Profiling 技術が成熟したことで、開発者はソフトウェアの詳細な挙動を観測するために、開発の初期段階から Profile や Trace などの技術を導入できるようになりました。これにより、開発者の体験が大幅に向上し、コードの影響を可視化することで、より迅速かつコスト効率の良い最適化が可能になります。
Gartner はこのシフトレフトの流れを「観測駆動開発(ODD)」のエンジニアリング実践の一環として説明しており、観測可能なシステムを設計することで、システムの状態や動作の詳細な可視性とコンテキストを提供し、開発初期段階や本番環境において予期しない異常を容易に検出・診断・解決できるようにします。
プラットフォームエンジニアリングの次なるフロンティア:eBPF
プラットフォームチームの役割は急速に拡大しており、Grafana の観測性に関する調査では、回答者の約 25% がこの職種に属していました。プラットフォームチームの重要性が高まるにつれ、彼らの職務範囲は新しいツールや技術の採用へと広がっています。その中でも eBPF は、単なるトレンドから、現代のプラットフォームエンジニアリングの柱へと進化し、組織の観測性およびセキュリティ管理の方法を根本的に変革しつつあります。現在、eBPF は「大きな変革の瀬戸際」にあります。
eBPF の導入により、Profiling や観測の責任がアプリケーションチームからプラットフォームチームへ移行する大きな変化が予測されます。特に、OpenTelemetry Profiling プロトコルの成熟と eBPF との統合により、標準化されたプラットフォームベースの方法で観測データを収集・処理できるようになります。
次世代の観測の主力:ログ(Log)
2024 年に企業のデジタル化が過去最高に達する中、開発、セキュリティ、運用チームの連携がこれまで以上に重要になっています。この進化に伴い、AI 駆動の観測プラットフォームが急速に普及し、ログがシステム記録の重要な要素であることがより広く認識されるようになっています。2025 年には、組織の構造化・非構造化ログデータに含まれるインサイトが、従来の AI/ML 技術と生成 AI 技術によって引き出されるようになるでしょう。これにより、比類のないコンテキストとインサイトが提供され、アプリケーションやデジタルサービスの観測における長年の課題が解決される可能性があります。
さらに、ログ分析・管理ツールも大幅な技術革新を遂げるでしょう。主な進化には以下が含まれます:
- 大規模データ分析技術の向上
- 低コストのホット・コールドストレージ分離
- データレイク機能の強化
コスト効率の良い観測(Cost-Effective Observability)
システムの複雑性が増すにつれ、観測コストも上昇しており、コスト削減が可観測性の重要なトレンドとなりつつあります。2025 年には、企業は以下の戦略を採用してコストを削減するでしょう:
- スマートなデータサンプリングと保持戦略 により、ストレージコストを削減。
- 使用量ベースの従量課金モデルの Serverless 観測ツール を導入。
- 機能性とコストパフォーマンスのバランスが取れたソリューション を選択。
伝統的な運用を超えた観測
2025 年には、観測の範囲が従来のインフラ、中間層、アプリケーション監視を超えて、以下の領域に拡大するでしょう:
- ビジネスプロセスの観測性:顧客の製品利用プロセスや企業の運営効率を可視化。
- DevSecOps の観測性:安全かつ効率的なデプロイを確保。
- サステナビリティ観測性:テレメトリーによる炭素排出量の追跡・最適化。
これらの進展により、観測性の可能性と実現範囲が再定義されるでしょう。
事後回顧から事前予防へ
顧客のアプリケーション体験に対する要求が高まるにつれ、企業は観測システムに対し、サービス停止、リソース不足、パフォーマンス低下を事前に予測できることを求めるようになっています。このプロアクティブなアプローチにより、問題がエンドユーザーに影響を及ぼす前にリスクを軽減し、リソースを効果的に管理できるようになり、サービスの信頼性が向上し、計画外のダウンタイムが削減されます。
従来の AIOps のアプローチでは、コンテキストの理解が不足していたため、事前予測は難しいものでした。しかし、新世代の AI 駆動の観測プラットフォームは、システム全体の観測データを統合し、根本原因を迅速に特定し、カスケード障害を予測できるようになりました。これにより、従来の「事後回顧型」から「事前予防型」への移行が可能になります。
私たちはLeapcell、バックエンド・プロジェクトのホスティングの最適解です。
Leapcellは、Webホスティング、非同期タスク、Redis向けの次世代サーバーレスプラットフォームです:
複数言語サポート
- Node.js、Python、Go、Rustで開発できます。
無制限のプロジェクトデプロイ
- 使用量に応じて料金を支払い、リクエストがなければ料金は発生しません。
比類のないコスト効率
- 使用量に応じた支払い、アイドル時間は課金されません。
- 例: $25で6.94Mリクエスト、平均応答時間60ms。
洗練された開発者体験
- 直感的なUIで簡単に設定できます。
- 完全自動化されたCI/CDパイプラインとGitOps統合。
- 実行可能なインサイトのためのリアルタイムのメトリクスとログ。
簡単なスケーラビリティと高パフォーマンス
- 高い同時実行性を容易に処理するためのオートスケーリング。
- ゼロ運用オーバーヘッド — 構築に集中できます。
Xでフォローする:@LeapcellHQ