みなさん、こんにちは。DatadogテクニカルエバンジェリストのTaijiです。
こちらは2022年アドベントカレンダー10日目の記事です🎄
前の記事は @ks0714 さんの OpenshiftへのDatadog Agent導入について になります。
この記事では、HiveMQとOpenTelemetryを使い、DatadogでIoTアプリの監視をしちゃおうという英語記事の翻訳になります!
Intro
大規模なIoT環境は非常に複雑で、信頼性の低い接続で相互にデータを移動させなければならない異種デバイスの複数の層で構成されています。IoT環境の各レイヤーを可視化することは、ユーザーエクスペリエンスに悪影響を及ぼす可能性のある導入時の問題を迅速に特定するために重要となります。
HiveMQ は、企業規模のIoTフリート向けのオープンソースのMQ Telemetry Transport(MQTT)ブローカーで、接続デバイスと下流のアプリケーションやサービス間で安全かつ信頼性の高いデータ転送を実現します。
DatadogのHiveMQ Integration は、HiveMQからメトリクスとイベントログを収集し、接続、切断、メッセージスループットなどの主要データの可視化とアラートを支援する、すぐに使えるダッシュボードを提供します。これにより、IoTインフラの健全性を可視化するベースラインが提供されますが、環境で実際に実行されているアプリケーションとワークロードのパフォーマンスに対する洞察を得ることも重要です。
IoTアプリケーションを可視化するために、HiveMQの Distributed Tracing Extension を使用すると、ユーザーはワークロードを計測してOpenTelemetry形式の 分散トレース を生成し、環境全体でアプリケーションプロセスをエンドツーエンドで追跡することができます。これらのトレースをDatadogに送信することで Datadog Application Performance Monitoring(APM) を使用して、接続デバイス上で実行されているアプリケーションのパフォーマンスをより深く理解し、より効果的なトラブルシューティングと根本原因の分析を行うことができます。
この記事では、HiveMQの拡張機能とOTelのサポートによって環境全体のIoT観測性がどのように強化され、Datadogを使用して分散IoTアプリケーションの健全性とパフォーマンスを完全に可視化できるかを見ていきます。
HiveMQとOpenTelemetryのIntegration方法について
HiveMQは 公式のOTel API を使用して、そのブローカーがスパンとトレースを作成できるようにしました。これにより、ユーザーはHiveMQブローカー(V. 4.9x)と HiveMQ Enterprise Extension for Kafka をOTelの仕様にしたがって計測することができるようになりました。さらに、Distributed Tracing Extensionは、HiveMQ MQTTブローカーとその統合にトレーシング機能を追加します。
この拡張機能は、HiveMQブローカーで送受信されるすべてのMQTT PUBLISHメッセージと、Kafka Extensionで送受信されるKafkaレコードをトレースします。ブローカーでは PublishInboundIntercepors
、PublishOutboundInterceptors
、PublishAuthorizers
などのアクションに対するトレースサポートが含まれています。Kafka拡張では、マッピングやトランスフォーマーのKafkaレコードが送信および/または受信されると、トレースが生成されます。また、レイテンシーや例外発生数などのメトリクスを収集することができます。
これらの機能により、DatadogのようなAPMソリューションにMQTTの可視性をもたらすことができます。例えば、この拡張機能を使用すると、HiveMQ MQTTブローカーがリクエストの処理にかかる時間を正確に把握することができますし、得られた洞察は、根本原因の分析を迅速化し、平均解決時間(MTTR)を改善し、分散アーキテクチャ全体の平均故障間隔(MTBF)を増加させることができます。
DatadogでHiveMQからのOpenTelemetryトレースの監視を開始する
DatadogはOTelのメトリクス、ログ、トレースをサポートしているため、HiveMQとDatadogのカスタマーは、Datadog APMを使用して、HiveMQブローカーに接続したIoTアプリケーションからのOTelインストルメントによる分散トレースを監視できるようになりました。
HiveMQのOTel互換ブローカーとKafka拡張により、IoTアプリケーションからOTelコレクターに分散トレースを送信し、Datadogに送信してモニタリングすることができます。
Datadogでこれらのトレースの監視を開始するには、まずHiveMQ Distributed Tracing Extensionを有効にします。これにより、トレースが OTel Collector に送信されます。そこから Datadog Exporterを使用して、OTel SDKのトレースをDatadogに転送 してください。分散トレースがDatadog APMに送信され始めると トレースエクスプローラ から可視化およびクエリを実行し、IoTアプリケーションのパフォーマンス問題を可視化することができます。
HiveMQのOTel計装トレースとDatadogのOpenTelemetryのサポート、これらの機能を組み合わせることで、次のようなことが可能になります。
- IoTアプリケーションのパフォーマンスに関する問題を迅速に発見する
- 根本原因を特定し、解決までの時間を短縮
- ユーザーエクスペリエンスの問題を修正し、顧客満足度を向上させる
- 広範なインフラストラクチャの中で、IoTアプリケーションがどのように相互作用しているかを理解できる
さいごに
IoT observabilityについては HiveMQブログ で詳細をご覧ください。また Datadog HiveMQ Integration を有効にして、HiveMQのメトリクスとイベントログをDatadogに送信したり DatadogのOpenTelemetryのサポート について詳しく知ることができます。Datadogをまだご利用でない方は、14日間の 無料トライアル にご登録の上、ぜひご利用ください。
オリジナルBlog