今回の環境はAmazonLinux2です。
セッションマネージャにて接続し、コマンドを実行しています。
Datadog-Agentをインストールする
DatadogAgentをインストールするにあたり、Datadogの無料トライアルを開始する際に自身のAPIキーが発行されますので、そのコマンドを入力してください。
DatadogAgentのYUMパッケージをインストールすることができるようです。
パッケージのインストールが正常に終了すると下記画像のように出力されます。
※注意
Amazon Linux 2022 インストールの場合はlibxcrypt-compat パッケージが必要なため、下記コマンドを実行してください。
dnf install -y libxcrypt-compat
ここまで完了すると、datadog-agentのステータスは起動中となっています。
コマンドについては公式に一覧がありますので、以下をご確認ください。
https://docs.datadoghq.com/ja/agent/basic_agent_usage/amazonlinux/?tab=agentv6v7
Datadogの無料トライアルを利用してみる
無料トライアルの登録にあたり、メールアドレスの登録等が必要になります。
指示通りに登録を進めていくと、パーソナルダッシュボードが作成されます。
今回はCloudProviderとしてAWSを連携させてみようと思います。
+Add を押下し、AWSアカウントを登録させます。
今回はAutomarically using CloudFormation RECOMMENDEDを選択し、下記画像の通り設定します。
3,4については、デフォルトの設定のままにしていますが、お好みに合わせて変更してください。
テンプレートを起動するとAWSアカウントのCloudFormationページに遷移します。
(ログインしていない方はログイン情報を求められます。)
設定項目については、今回は特段変更せず、テンプレートを起動します。
作成に失敗しました。
何故でしょう。一旦スタックを削除してください。
もう一度やり直してみます。
以下の2項目にチェックマークをつけ忘れていました。
チェックを付けたうえで、再度テンプレートを起動してみます。
少し時間はかかりましたが、CREATE_COMPLETEとなりました。
では続いてダッシュボードを作成してみましょう。
(ちなみに進捗については、ダッシュボード左上のGet Startedを展開すると表示されます。)
CreateNewDashboardからオリジナルなダッシュボードを作成することができます。
下記画像の赤枠から、追加したいダッシュボードを選択し、ダッシュボードを作成します。
ダッシュボードの作成が完了したら続いてモニターを作成してみましょう。
NewMonitorを選択します。
モニターの値としては様々なものを設定できますが
今回は、5分間当たりのロードアベレージの負荷が10を超えると
指定のメールにアラートが飛ぶように設定しました。
(ちなみにSlackのワークスペースを決めて、特定のチャンネルに通知する設定も簡単にできます。)
今回はSeverityを特段設定していないので、全てを通知するにしていますが
Severityごとに通知先(通知チャンネルを変えることも可能のようです。これは運用する側からするとありがたい。)
インシデント発生後にポストモーテムを残すことも可能です。
この記録を丁寧に残している組織は運用の品質が上がりそうです。
Datadogのアカウント権限については、追加したいメンバーのメールアドレスを登録し、そこに何のロールを追加するか決められます。
今回は3名のメンバーを登録し、それぞれにreadonlyロールを付与しました。
負荷テストしてみます
それでは、実際に負荷がかかった際にどのような挙動が発生するのかテストしてみます。
今回はstressコマンドより、CPUに負荷を与え続けDatadogコンソール上でどのように表示/通知されるか見てみます。
(本当はFIS使いたかったんですが、トラブルシューティングに時間がかかりそうでひとまずStressコマンド。いずれFISでも検証します。)
メールとSlackそれぞれに通知を飛ばしてみました。
(Slackだと以下のような感じで通知されます。)
他にも細かい設定をすれば欲しいログは取れますし、何より視認性の良いSaaS監視ツールだなという印象を受けました。
ちなみに料金体系についてはこちら
今回は、ここまでにします。
また、検証する機会があれば随時編集していければと思います。