クラウドでのインフラ管理が成長し、さまざまなサービスが登場して多様化するにつれ、効果的な監視ツールの必要性も高まっています。組織は、適切なサービスで効果的に監視、リアルタイムで問題を診断、そしてそれを解決することが必要となってくるでしょう。ここで重要となるのは、あなたのビジネスや会社に適したモニタリング・サービス・ツールは何かということです。
以下のリストでは、クラウド監視ツールであるDatadogの代替サービスを紹介しています。ここでは、各サービスのコア機能、価格、可用性、そしてDatadogの代替サービスとなるためのポイントを説明します。
この記事で見ていくツールは以下の通りになります。
- Datadog
- New Relic
- Prometheus(オープンソース)
- MetricFire
- AWS CloudWatch
- Graphite(オープンソース)
- Dynatrace
#Datadog
Datadogは、SaaS(Software as a Service)のインフラ・アプリケーション監視ツールです。Datadogは、ネットワークからシステム、サーバーの監視まで、クラウド上で多様なツールやサービスを監視する必要がある環境で主に使用されています。Datadogは、200を超えるツールやサービスの統合機能ですべてをカバーしており、技術スタックのすべてのコンポーネントを簡単に監視することができます。
Datadogは2010年に、ダッシュボード、アラート、メトリクスの可視化を備えたクラウド・インフラストラクチャ監視サービスとしてスタートしました。クラウドの普及が進むにつれ、Datadog は急速に成長し、Amazon Web Services (AWS)、Microsoft Azure、Google Cloud Platform、Red Hat OpenShift、OpenStack などのサービスプロバイダをカバーするように製品の提供範囲を拡大しました。Datadog は最近、アプリケーション監視サービスも開始しました。
カスタマイズ可能なダッシュボードを備えたDatadogは、5台のホストまで無料で利用できます(1日分のデータ保持付き)。それ以降は月15ドル/ホストで請求されます。14日間の無料トライアルもあります。Datadogインフラの更新された価格はウェブサイトで確認できます。 ユーザーインターフェースは第一印象ではかなり良いですが、使用するのはかなり技術的であり、慣れるまでに少し時間がかかるかもしれません。PagerDutyやslackなどのアプリと連携して通知を受け取ることも可能です。
#New Relic
New Relicは、メトリクスを記録するインフラ監視機能を提供し、サーバに影響を与えるイベントをほぼリアルタイムで監視することで、Datadogに代わる強力なツールとして登場しました。また、Amazon Web Services、Microsoft Azure、Google Cloud Platform、およびそれらの統合を含む50以上のサービスの設定済みダッシュボードを提供する。
Kubernetesのモニタリング機能は、アプリケーション関連とインフラストラクチャ関連のユースケースの両方にまたがるメトリクスのトラブルシューティング、アクセス、分析機能を顧客に提供する。また、ダイナミックアラートの作成、New Relicの統合SDKを介したカスタム統合の構築、管理ツールの設定などの機能も備えています。New RelicはDataDogの強力な競合製品であることは間違いありません。しかし、New Relicの統合機能は誰もが簡単に設定できるものではなく、ある程度の技術的な理解を必要とします。ドキュメントやUIの面では、New Relicの方がはるかに優れていると言えるでしょう。
価格を比較してみると、New Relicでは最初に30日間の無料トライアルを提供しています。その後、必需品パックはユーザー1人あたり月額7.20ドル、プロパックはユーザー1人あたり月額14.40ドルとなっています。同梱されているものについての詳細は、こちらの価格ページをご覧ください。
#Prometheus
Prometheusはオープンソースの監視システムで、独自の時系列データベースのエンドツーエンドの監視ソリューションを提供することを中心に構築されています。PrometheusはCloud Native Foundationの一部であり、コミュニティからの支持を得ています。クエリ、グラフ、内蔵のアラート機能に加えて、データを受信して保存することができます。また、エフェメラルジョブやバッチジョブからメトリクスをエクスポートするためのプッシュゲートウェイが付属しており、さまざまなエクスポート機能が用意されています。Prometheusのクエリ言語(PromQL)を使用して、メトリクスを探索したり、複雑さを伴う単純なグラフを描画したりすることができます。
Prometheusは、システム監視と動的なサービス指向アーキテクチャの両方に対応するように構築されています。その設計は、信頼性、多次元データ収集、Grafana ダッシュボードによる可視化に重点を置いています。Prometheusはオープンソースで無料ですが、エンタープライズ環境でのセットアップ、設定、デプロイに時間がかかることは言うまでもなく、非常に技術的なものになります。オープンソースの Prometheus メトリクスのデフォルトの保持期間は 15 日間ですが、割り当てたストレージの量に応じて延長することができます。MetricFireが提供するHosted Prometheusでは、データを2年間以上保存することができます。
#MetricFire
MetricFireは、Grafana、Graphite、Prometheusの3つの主要なオープンソースサービスをベースに構築されたエンドツーエンドのインフラストラクチャ監視をユーザーに提供する、企業向けの監視ソリューションです。MetricFireは、これらのオープンソース・システムに技術的な改良を加え、3つのオープンソース・プロジェクトをすべて1つのホスト製品として利用できるようになっています。MetricFireは、会社の成長に合わせたスケールアップも柔軟に対応し、新興企業から大規模企業まで、あらゆる規模のチーム向けに設計されています。
MetricFire上のHosted Graphiteでは、最大3倍の冗長化ストレージを利用できます。Hosted GraphiteをRiak上で動作させることで、Graphiteの旧式のファイルベースのウィスパーストレージを置き換えることができ、クラスタベースのデータベースをシームレスに拡張することができます。MetricFireはさらに、タグ付けされたメトリクス、自動バックアップ、エンジニアによる24時間365日のサポートなどのサポートを提供しています。
一方、Hosted Prometheusは、バックエンドのすべてのユーザーデータを3倍の冗長性でバンドルし、5分と1時間の小型サンプルをサポートすることで高い耐障害性を実現しています。MetricFireによるビジネス向けPrometheus as a serviceは、エンドツーエンドのHosted PrometheusとGrafanaによるデータの可視化をパックにしたもので、月額85米ドルから提供しています。MetricFireの無料トライアルを利用すれば、Prometheusインフラストラクチャ監視ソリューションをすぐに利用することができます。
統合されているHosted Grafanaのダッシュボードは、非常に直感的なユーザーインターフェースであり、MetricFireの標準料金プランのすべてに含まれています。料金プランの詳細については、MetricFireのウェブサイトをご覧ください。
#AWS CloudWatch
AWS CloudWatchは、ログやメトリクスの収集、監視、可視化、アラート、運用上の健全性の変化に対応した自動アクションなど、幅広いクラウドリソースを網羅したツール群です。リソースはAWS上、オンプレミス、またはその両方を組み合わせて利用することができます。CloudWatchが優れたツールである理由は、監視を超えて観測性にまで踏み込むことができるからだ。
アプリケーションを実行していて、それがEC2、SNS、AWS Lambdaを使用している場合 - CloudWatchは、アプリケーションのパフォーマンスデータと、それに付随するインフラストラクチャの監視情報の両方を担当することができます。また、両方を同時に同じダッシュボードに表示することもできます。CloudWatchはメトリクスの収集、インスタンスの監視、アラート(アラームやイベント機能)、システム全体の分析を行います。CloudWatchは、競合する監視ソリューションと比較して、大量のメトリクスを処理するためのコストが大幅に膨らむ可能性があるため、従量課金制となっています。
他のオープンソースの代替製品のようにカスタマイズすることはできませんが、Amazon Web Servicesの他のサービスを監視するのには最適なツールだと思われます。ただし、Dashboardのカスタマイズはできないのは難点です。また、AWSはストレージのメトリクスを自動的に提供してくれません。CloudWatchは、より広く適用可能なインフラストラクチャ監視ツールになるために、より幅広いサービスとの統合性を向上させる必要があります。
#Graphite
Graphiteは、時系列のモニタリングとグラフ化を目的としたツールです。2006年にリリースされたときには、本当に画期的なツールでした。Graphiteは、安価なハードウェアでもクラウド・インフラストラクチャでも最高のパフォーマンスを誇り、モニタリングの分野では時代の先を行っていました。それから10年以上経った今でも、コミュニティはその安定性とパフォーマンスに忠実です。
Graphiteのドキュメントによると、Graphiteは時系列の数値データを保存し、必要に応じてそのデータをグラフ化します。そのアーキテクチャによると、Graphiteは独自にメトリクスを収集するのではなく、計測値を時系列DBに取り込むためのシンプルな方法を提供しています。StatsD のような既に利用可能なメトリクスコレクターを利用することができます。
Graphiteは、スケールやクラスタ環境で実行する際に問題があるため、ここ数年で評価が分かれています。CarbonデーモンはPythonで書かれたネイティブコードのため、常に最適なパフォーマンスを発揮することができず、UIも最高ではありません。しかし、これらの問題はMetricFireのHosted Graphiteによって解決されます。MetricFireのHosted Graphiteは、チームアカウントの追加、メトリクスコレクターエージェントの追加、ダッシュボードのきめ細かいパーミッションの追加、さらなる統合など、オープンソースのGraphiteを改良しています。
多くの企業向けツールと同等の機能を備えたオープンソースのメトリクスと可視化ツールが欲しいなら、Graphiteは試す価値がある。あなたが探しているものとは違うかもしれませんが、少しの試行錯誤で、あなたの環境に合った完全にカスタマイズされた Graphite (または Graphiteのような) デプロイメントを構築することができます。
#Dynatrace
Dynatraceのクラウドインフラエンティティは、ホストマシン、コンテナ、イベント、ログを継続的に自動検出することで、ネイティブ環境からハイブリッド環境まで、MLを活用したソリューションでユーザーにサービスを提供します。Dynatraceはまた、ユーザーが主要なインフラストラクチャの健全性指標をリアルタイムで分析することを可能にします。AI-Opsを使用することで、懸念される異常やデータポイントについて、正確かつ迅速に答えを導き出すことができます。Dynatraceエンタープライズは、ベアメタル、VMware、OpenStack、AWS、Azure、またはハイブリッドソリューションとして設定することができます。
Dynatraceは2019年8月に公開され、そこからAPM、AIOps、クラウドインフラの監視などを追加していきました。Dynatraceには、トランザクショントレース、合成監視、リアルユーザー監視、ネットワーク監視があります。ソフトウェアアプリケーションの可用性やパフォーマンスだけでなく、全体的なユーザーエクスペリエンスへの影響を管理します。無料版では、最大5台のサーバーを無制限に監視することができますが、データ保持は含まれていません。無料版での訪問回数は10万回に制限されています。
Dynatraceのウェブサイトには価格についての言及はありませんが、無料版は小規模ですぐに導入できるインフラに適しています。インターフェイスは、特にクラウドモニタリングツールの経験のないユーザーにとっては、少し乱雑すぎるように感じました。それ以外の点では、Datadogの代わりになる製品だと思います。
#まとめ
インフラストラクチャ監視の市場には、非常に競争の激しいツールが数多く存在します。この記事が、適切なツールを選択する際に、正しい洞察、知識、アドバイスを提供出来ればとを願っています。
今すぐモニタリングを開始したい方は、MetricFireの無料トライアルをお試しください。また、デモを予約して、モニタリングのニーズについて直接お問い合わせください。