はじめに
この記事は、ミロゴス Advent Calendar 2022 20日目の記事です。
Lambda のログを CloudWatch Logs で見ている。けれども、調査時にログの検索がし辛いと感じたり、そのログからとある値を集計したい要件があったりするかと思います。
このような場合に対して CW Logs には CW Logs Insights が 用意されています。
本記事では CW Logs Insights を使ったログ検索のクエリの一例を記載します。
また、CW Logs に 構造化ログの形で出力できるPython のライブラリ、aws-lambda-powertools を使うことで CW Logs Insights がどう便利になるのかを紹介します。
対象者としては下記のような方を対象としています。
- Lambda を使ってるが CW Logs の検索に辛さを感じている。
- CW Logs のログから抽出し集計をするスクリプトを作っている。
CloudWatch Logs Insights について
CW Logs のログデータをクエリによって検索、分析できる機能です。
独特なコマンドがいくつかありますが、下記のようなクエリを書くだけで簡単に検索できます。
fields @timestamp, @message
| sort @timestamp desc
| limit 20
AWS Lambda PowerTools について
Lambda はデフォルトとして CW Logs にログ出力するため、外部サービスを使う以外には CW Logs にログ集約されているかと思います。
CW Logs では通常の 1 行で表示されるログ以外に、JSON 形式の構造化ログも利用できます。
PowerTools は構造化ログ以外に、トレースやカスタムメトリクスなどをベストプラクティスの形で実装するためのライブラリです。
Python には AWS Lambda Powertools for Python があり、他に TypeScript や Java、.NET にもそれぞれ提供されています。
- AWS Lambda Powertools for Python
- AWS Lambda Powertools for TypeScript
- AWS Lambda Powertools for Java
- Lambda Powertools .NET
各リファレンスを見るとわかりますが、特に Python 版は様々な機能を持っています。そのため、Lambda で Python を使うのであれば基本的に利用するのが良いかと思います。
相性の良さを見てみる
Lambda
まずは、PowerTools を使った時に表示されるLambdaのログです。
赤枠が PowerTools を使ったログ出力、青枠が logging モジュールを使ったログ出力になります。
下記にログ出力したプログラムの一部を記載します。
test_object = {"hoge": "Hello World", "count": random.randint(10, 99)}
# PowerToolsを使ったログ出力
powertools_logger = Logger()
powertools_logger.info(test_object)
# Pythonのloggingモジュールを使ったログ出力
import logging
logger = logging.getLogger()
logger.setLevel(logging.INFO)
logger.info(test_object)
logging モジュールは 1 行に表示される形で、サンプルでは2 要素の辞書型の出力のためまだ確認しやすいですが、さらに要素が多くなるとより見づらくなります。
PowerTools を使ったログは構造化されており、info メソッドに渡した値以外にlevel
やtimestamp
まで表示されています。
辞書型のtest_object
変数もフォーマットがかかることで見やすくなっているのが見てとれるかと思います。
さらにログをわかりやすくする
powertools_logger = Logger(
location="[%(name)s - %(filename)s] %(funcName)s:%(lineno)d"
)
上記は私が PowerTools を使う際に追加している設定です。
Lambda で使うファイルが 1 ファイルのみで済む場合は問題ありませんが、複数のファイルがある場合にどこのファイルのログなのかはデフォルトの設定では表示されません。
そこで私はログから該当箇所を判別しやすいようにlocation
にログフォーマットを渡しています。
下記がその実際の CW のログです。
赤線を引いている箇所が追加されています。
ログ名やファイル名、関数名と行番号まで表示できており、どこでこのログが出力されたのか一目で判断できます。
CW Logs Insights
PowerTools を使うことで簡単に構造化ログが出力できました。
構造化ログを使うメリットの一つとして、Logs Insights でクエリの指定がしやすくなるという点があります。
例えば、INFO ログのみを表示したい場合、下記のようなクエリになります。
fields @timestamp, @message, hoge, count as cnt
| sort @timestamp desc
| filter @message like /(?i)INFO/
(?i)は大文字小文字関係なく検索をかけます。
しかし、例えば DEBUG ログにinformation
のようなinfo
が入った単語の出力があると、それもクエリ結果に引っかかってしまいます。
これに対して、もし PowerTools で構造化ログを出力しているなら下記のように書くことができます。
fields @timestamp, @message, message.hoge, message.count as cnt
| sort @timestamp desc
| filter level = 'INFO'
ログレベルを INFO に指定する形なので、他のログレベルのログが検索結果に出てくることはありません。
なぜできるのか
なぜ、構造化ログを使っているとfilter level = 'INFO'
のような形が書けるのでしょうか。
それは下記のレコードを見るとわかります。
@message
に JSON の形で宣言されている値は、level
やmessage.count
のような形でデフォルトのフィールド(@message
や@log
など)と同じように宣言されています。
そのため、クエリ結果のフィールド部分にもmessage.hoge
と言った形で指定でき、数値であれば下記のように集計することもできます。
# 5分ごとにmessage.countの値を合算して出力
stats sum(message.count) by bin(5m)
| sort @timestamp desc
| filter level = 'INFO'
他の集計のクエリは下記に記載があります。
https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/logs/CWL_QuerySyntax.html#CWL_QuerySyntax-alias
まとめ
PowerToolsの機能を使うことで構造化ログを簡単に設定しました。
また、構造化ログのおかげで CW Logs Insights でログの調査や集計が簡単になるような例を紹介しました。
CW Logs Insights には構造化ログ以外にも非常に便利な機能がいくつもあります。
AWS のオンラインイベントでも紹介されています。
ぜひ、Lambda 関数の開発で使うようにしてみてください。