0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

AWS(Amazon Web Services)Advent Calendar 2024

Day 16

AWS X-Rayの基本とPtyhon + Flask + ECS + FargateでのX-Ray導入手順

Last updated at Posted at 2024-12-15

AWS X-Rayの機能や料金といった基本的な情報とPtyhon + Flask + ECS + Fargateの構成のアプリケーションにX-Rayを導入する手順を記載しました。

AWS X-Rayとは

AWS X-Rayは、分散アプリケーションの分析とデバッグを行うためのサービスです。サービスやリソースの関係性の可視化や、AWSサービスをまたぐリクエストをトレースし関連するログの調査やアプリケーションのパフォーマンスの分析などが可能です。

X-Rayの主な機能

サービスマップ:
X-Rayを有効にした範囲のサービスマップが自動で作成されます。サービスマップ上ではノードに対して、異常の有無やそのノードの成功率やエラー率、応答時間の統計が表示されます。

tracemap.png

トレース:
各リクエストに一意のトレースIDが付与され、リクエストの処理経路をトレースすることができます。トレースにはステータスコードやリクエストの処理経路、リクエストにかかった時間、リクエストに関連するログなどが含まれます。また、SDKを導入したアプリケーション内でトレースに対しアノテーションとメタデータを付与することができデバッグや分析に役立たせることができます。

サンプリングルールのカスタマイズができ、デフォルトでは1秒ごとに最初のリクエストが記録され、それ以降は5%のリクエストが記録されます。この設定はカスタマイズ可能です。

trace.png

X-Rayの対応

X-RayはAWSの各種サービスに対してトレースを行うことができまた、アプリケーションコードに対してもSDKを組み込むことでトレースを行うことができます。

X-Ray SDKが対応している言語:

  • Java
  • .NET
  • Node.js
  • Python
  • Ruby
  • Go

X-Rayとの統合可能なサービス:

  • AWS Distro for OpenTelemetry
  • API Gateway
  • App Mesh
  • App Runner
  • AWS AppSync
  • CloudTrail
  • CloudWatch
  • AWS Config
  • Amazon EC2
  • Elastic Beanstalk
  • Elastic Load Balancing
  • EventBridge
  • Lambda
  • Amazon SNS
  • AWS Step Functions
  • Amazon SQS
  • Amazon S3

※ CloudWatchやCloudTrail等のトレースを収集以外の統合サービスも記載しています。どのように統合されるかは以下の参考のリンクを参照ください。

X-Ray インサイトと通知:
しきい値の設定やアプリケーションの変更不要で通常とは異なる動作やパフォーマンスの問題の異常を自動的に検出する機能。通知を有効化することでAmazon EventBridgeを使用してインサイトイベントを配信することができます。デフォルトでは、インサイトは有効化されていません。

X-Rayの料金

後述の「サンプリングルレートの変更」に詳細は記載していますが、AWS X-Rayではデフォルトですべてのリクエストをトレースするわけではありません。またこのサンプリングのルールを設定できるため規模の大きいアプリケーションでも無料枠に収めることが可能です。

無料枠
トレースの記録が 10 万回まで無料(月あたり)
トレースの取得とスキャンが合わせて 100 万回まで無料(月当り)

有料枠
トレースの記録 5.00USD/100万件 (トレース 1 件あたり 0.000005 USD)
トレースの取得 0.50USD/100万件 (トレース 1 件あたり 0.0000005 USD)
トレースのスキャン 0.50USD/100万件 (トレース 1 件あたり 0.0000005 USD)
X-Ray Insightsトレースの記録 1.00USD/100万件 (トレース 1 件あたり 0.000001USD)

X-Rayの保存期間

X-Rayは直近30日間のトレースデータを保存します。

よくある質問 - AWS X-Ray | AWS
追跡データは、どれだけさかのぼってクエリを実行できますか? X-Ray はトレースデータをどのくらいの期間保存しますか?
X-Ray では、直近 30 日間の追跡データが保存されます。したがって、過去 30 日間の追跡データに対してクエリを実行できます。

Ptyhon + Flask + ECS + FargateでのX-Rayの導入

X-Rayは複数の言語・サービスに対応していますが、ここではPython + FlaskのアプリケーションをECS + Fargateにデプロイした場合のX-Rayの導入手順を記載しています。

Pytyhon + FlaskでのX-Rayの導入手順

SDKをpipでインストールする

参考: AWS X-Ray SDK for Python - AWS X-Ray

pip install aws-xray-sdk

アプリケーションにミドルウェアを追加する (Flask)
X-Ray SDK for Pythonは、次のミドルウェアをサポートしています。

  • Django
  • Flask
  • Bottle

上記以外のpythonコードでも手動で実装しX-RayをSDKから利用することができます。

参考: X-Ray SDK for Python ミドルウェアを使用して受信リクエストをトレースします。 - AWS X-Ray

Flaskの場合は以下のようにxray_recorderを作成しミドルウェアを追加します。

from aws_xray_sdk.core import xray_recorder
from aws_xray_sdk.ext.flask.middleware import XRayMiddleware

app = Flask(__name__)
logging.basicConfig(level=logging.INFO)

plugins = ('ECSPlugin', )
xray_recorder.configure(
    service='FLASK-XRAY-APP',
    plugins=plugins,
)
XRayMiddleware(app, xray_recorder)

plugins = ('ECSPlugin', )はECSPluginを有効にするための設定です。ECSPluginはECSのコンテナIDをトレース情報に追加し、ClowdWatch logsとトレースを紐づけるために設定するもので、動作環境に合わせて適切なもの(EKSPlugin, ElasticBeanstalkPluginなど)を指定します。

service='FLASK-XRAY-APP'はAmazon X-Rayによって追跡されるアプリケーションやサービスの任意の名前を指定するパラメータです。この名前はX-Rayコンソールで表示されます。

ダウンストリームコールを実装するためのライブラリへのパッチ適用
参考: ダウンストリームコールを実装するためのライブラリへのパッチ適用 - AWS X-Ray

requestsやsqlite3等pythonのライブラリに対してパッチを適用することで、ダウンストリームコールをトレースすることができます。

from aws_xray_sdk.core import patch_all

patch_all()

put_annotationとput_metadataでトレース情報に追加データを付与する

  • put_annotation: トレースにカスタムキーと値のペアを「注釈」として追加します。この注釈は、検索とフィルタリングが可能で、クエリなどで絞り込みを行いたい情報を持たせる際に便利です。
  • put_metadata: トレースのデバッグや詳細な調査用に追加情報を付加します。このメタデータはクエリには使用できませんが、トレースビューで詳細なデータとして確認できます

参考: Basic Usage — aws-xray-sdk 2.14.0 documentation

from aws_xray_sdk.core import xray_recorder

segment = xray_recorder.current_segment()
# value can be string, number or bool
segment.put_annotation('key', value)
# namespace and key must be string and value is an object
# that can be serialized to json
segment.put_metadata('key', json, 'namespace')

ログの出力とX-Rayとの連携
ログ出力にX-RayのトレースIDを含めることで、X-Rayのトレースに紐づくログをX-Rayコンソール上で確認することができます。

trace_id = xray_recorder.current_segment().trace_id
app.logger.info(f"[ AWS-XRAY-TRACE-ID: {trace_id} ] Request headers: {request_headers_json}")

ECS + FargateでのX-Rayの導入

Roleの作成
ECSのタスクのtaskRoleArnexecutionRoleArnに指定するロールを作成します。

taskRoleArn
信頼されたエンティティとしては「AWSのサービス」のユースケースが「Elasitc Container Service」→「Elastic Container Service Task」を選択します。
許可ポリシーはAWS管理のAWSXRayDaemonWriteAccessポリシーをアタッチします。

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "AWSXRayDaemonWriteAccess",
            "Effect": "Allow",
            "Action": [
                "xray:PutTraceSegments",
                "xray:PutTelemetryRecords",
                "xray:GetSamplingRules",
                "xray:GetSamplingTargets",
                "xray:GetSamplingStatisticSummaries"
            ],
            "Resource": [
                "*"
            ]
        }
    ]
}

executionRoleArn
信頼されたエンティティとしては「AWSのサービス」のユースケースが「Elasitc Container Service」→「Elastic Container Service Task」を選択します。
許可ポリシーはAWS管理のAmazonECSTaskExecutionRolePolicyポリシーをアタッチします。

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "ecr:GetAuthorizationToken",
                "ecr:BatchCheckLayerAvailability",
                "ecr:GetDownloadUrlForLayer",
                "ecr:BatchGetImage",
                "logs:CreateLogStream",
                "logs:PutLogEvents"
            ],
            "Resource": "*"
        }
    ]
}

X-Rayデーモンをサイドカーとして起動
FlaskアプリとX-Rayデーモンを同じタスクで起動するために、X-Rayデーモンをサイドカーとして起動します。
<ecs_task_role_arn><region>、またロググループ名等は適宜変更してください。
以下のタスク定義ではflask-xray-app:latestでFlaskアプリのコンテナイメージを指定しています。amazon/aws-xray-daemonがX-Rayデーモンのコンテナイメージです。

{
  "family": "flask-xray-task",
  "taskRoleArn": "<ecs_task_role_arn>",
  "executionRoleArn": "<ecs_task_execution_role_arn>",
  "networkMode": "awsvpc",
  "containerDefinitions": [
    {
      "name": "flask-xray-app",
      "image": "<aws_account_id>.dkr.ecr.<region>.amazonaws.com/flask-xray-app:latest",
      "essential": true,
      "portMappings": [
        {
          "containerPort": 80,
          "hostPort": 80,
          "protocol": "tcp"
        }
      ],
      "logConfiguration": {
        "logDriver": "awslogs",
        "options": {
          "awslogs-group": "/ecs/flask-xray",
          "awslogs-region": "<region>",
          "awslogs-stream-prefix": "flask-xray-app"
        }
      }
    },
    {
      "name": "xray",
      "image": "amazon/aws-xray-daemon",
      "essential": true,
      "environment": [
        {
          "name": "AWS_REGION",
          "value": "<region>"
        }
      ],
      "portMappings": [
        {
          "containerPort": 2000,
          "hostPort": 0,
          "protocol": "udp"
        }
      ],
      "logConfiguration": {
        "logDriver": "awslogs",
        "options": {
          "awslogs-group": "/ecs/flask-xray",
          "awslogs-region": "<region>",
          "awslogs-stream-prefix": "xray"
        }
      }
    }
  ],
  "requiresCompatibilities": [
    "FARGATE"
  ],
  "cpu": "256",
  "memory": "512"
}

もし何らかの理由によりX-Rayデーモンを別の場所で起動する場合はX-Ray SDK側に環境変数AWS_XRAY_DAEMON_ADDRESSでデーモンのアドレス(デフォルトは127.0.0.1:2000)を指定するか

xray_recorder.configure(
    daemon_address='127.0.0.1:3000'

のようにpythonコード内のxray_recorder.configureに直接設定を書き込む必要があります。

サンプリングレートの変更

X-Rayのトレースはデフォルトではすべてのリクエストを記録しません。デフォルトでは以下の設定になっています。

  • 1秒ごとに以下を記録
    • リザーバのサイズ設定として最初のリクエストが1件記録される
    • リザーバ以降は5%のリクエストが記録される

この設定を変更する場合はCloudWatch > 設定 > X-Ray トレース - 新規 > サンプリングルール ビュー設定から設定できます。
サンプリングルールはAPI Gateway Entrypoint, AWS AppSync, X-Ray SDK

sampling_rate_setting.png

サンプリングルールは以下のように優先度リストになっていて、一致基準に一致した最も優先度の高いルールが適用されます。
初期状態では画像のDefautlのルールのみが設定されています。

sampling_rate_list.png

新規作成する場合は右上のサンプリングルールの作成から行います。

sampling_rate_rule.png

各設定値の詳細は以下の通りです。

  • ルールの情報
    • 名前: 任意のルール名
    • 優先度: ルールの優先度。数値が小さいほど優先度が高い
  • 制限
    • リザーバのサイズ: 1秒ごとに先頭から指定した値のリクエスト数が記録される
    • 固定レート: リザーバを使い切った後のリクエストの記録割合
  • 一致基準
    • サービス名: Amazon API GatewayやX-Ray SDKで設定するサービス名
    • サービスタイプ: トレースマップに表示されるサービスタイプ。
       - SDKのプラグインとして設定したもの: AWS::EC2::Instance, AWS::ECS::Container, AWS::ElasticBeanstalk::Environment
      • X-Rayを有効化したサービス: AWS::APIGateway::Stage, AWS::AppSync::GraphQLAPI
    • HTTPメソッド: ルールを適用するHTTP メソッド、GET, POST, PUT, DELETEなど
    • URLパス: リクエストのURL パス
    • リソースARN:ルールを適用する AWS リソースの ARN
    • ホスト: ルールを適用するホスト名。HTTPヘッダーから取得される。
  • 一致する属性
    • key-valueのペアで一致する属性を指定する。API Gatewayで元のHTTPリクエストのヘッダーを参照する。X-Ray SDKではサポートされない。

まとめ

AWS X-Rayの基本とAWS上にECSで動くPython + FlaskのアプリケーションでX-Rayを有効化する手順を紹介しました。X-Rayを有効化することで、アプリケーションのトレースやデバッグが容易になり、アプリケーションのパフォーマンスの分析や問題の特定が行いやすくなります。特にトレースした個別のリクエストに対してCloudwatch Logsと連携することで、リクエストに紐づくログを確認することができるのは非常に便利です。ただし、サンプリングレートの設定やサンプリングルールの設定によっては全てのリクエストがトレースされるわけではないので、適切な設定を行うことが重要です。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?