Lambda Extensionsについて
AWS Lambda Extensions (プレビュー) のご紹介でも書かれている通り、Extensionsはinternalとexternal二つのモードで実行することができます。
Internal extensionsは、利用者のコードと同じランタイムプロセスの一部として実行されます。ランタイムプロセスの起動を言語固有の環境変数とラッパースクリプトを用いて変更できます。Internal extensionsを用いて、コードの自動計測などのユースケースを実現することができます。
External extensionsは、対象のLambda関数のランタイムプロセスと同じ実行環境内の、別のプロセスで動作させることができます。External extensionsは、呼び出し前にシークレットを取得したり、関数呼び出しの外にいるカスタムな送信先へと測定情報を送信したりするようなユースケースで使用できます。こういったExtensionsはLambda関数に付随するプロセスとして実行されます。
そして、AWSの各種ブログではExternal extensionsの説明に 多くの項を割いていて、Internal Extensionsはほんの少ししか登場しない。
有名なこの図もExternal Extensionsのものになります。
External Extensionsはもちろん自作もできますが、AWSのMonitoringやSecurity系パートナーが提供するLambda Layerを組み込むだけですぐにLambdaを拡張することが可能になっています。(blogの中で、ローンチ時に利用可能なAWS Lambda Readyパートナーextensionとして紹介がありますのでご参考ください)
しかし本稿では、このExternal Extensionsではなく、あえてInternal Extensionsに光を当てて、その使い道を探っていきます。とくにAWS Lambdaのチューニングについてこんな使い方が出来ますよというご紹介にしていきたいと思います。
Internal Extensions
External Extensionsがサイドカー的に、Lambda実行環境にプロセスをアドオンしていたのに対し、Internal ExtensionsはHandlerが動くプロセスと同じプロセスで実行されるため、主としてRuntimeの拡張用途で使われることが多いです。
言語 | 環境変数 | 説明 |
Java | JAVA_TOOL_OPTIONS | Java 11 および Java 8 (java8.al2) では、Lambda はこの環境変数をサポートし、Lambda で追加のコマンドライン変数を設定します。この環境変数では、ツールの初期化を指定できます。具体的には、agentlib または javaagent オプションを使用して、ネイティブまたは Java プログラミング言語エージェントの起動を指定できます。 |
Node.js | NODE_OPTIONS | Node.js 10x 以降では、Lambda はこの環境変数をサポートします。 |
.NET | DOTNET_STARTUP_HOOKS | .NET Core 3.1 以降では、Lambda はこの環境変数によって提供されるアセンブリ (dll) へのパスを使用できます。 |
AWS Lambda 関数を使用するためのベストプラクティスにも詳しく書かれていますが、
- 他のAWSサービスとの統合方法やシステム要件などの俯瞰したアーキテクチャ的な視点
- SQSを用いた非同期実装
- EventBridgeを用いたイベントドリブン実装
- StepFunctionsを用いたワークフロー構築
- 継続的改善のための可観測性向上、X-Ray, CloudWatch Metrics(Logs), External Extensions
- フロントキャッシュ
- etc.
- AWS Lambdaサービス機能としてのチューニング
- Provisioned Concurrencyによる暖機
- Memory設定
- VPC設定
- Containerの利用
- EFSの利用
- etc.
- プログラミングコードとしてのチューニング
- ランタイム言語ごとのプラクティス
- Handler外のキャッシュ、再利用
- 遅延が懸念される3rd Party APIの同期呼び出しを避ける
- Lazy Loading (Pythonの場合、Lazy Importing)
- etc.
このチューニングの中で、特に今回よく使われる技法として、PythonのLazy Importingについて着目し、Lambdaとの関わり方や、どのようにチューニングするかをみていきます。
Python での Lazy Importing
従来、Lazy Importingを行うには2つの方法がありました。
- ローカルインポートによる対処
- LazyLoaderによる対処
なるほど。これらの方法でLazy Loadingが実装できたので"よかったよかった"なのですが本当にLazy Loadingされているかを確認する方法ってどうしたら良いでしょうか。
- Pythonコードの中でグローバルインポート/ローカルインポートしている部分をログから追跡/確認したい
- 実際にimportされている部分のロード時間を計測したい
この課題に対処するアプローチがPythonのruntimeオプションである implementation-specific optionになります。
話しがここまでたどり着くのに長くなってしまったのですが、これまでのLambdaはこのRuntime Optionに触れることが難しかったのですが、Internal Extensionsを利用すると簡単に設定できるようになります。(本稿で言いたいのはこの部分でした。)
Python の implementation-specific option
さまざまな実装固有のオプションとして、以下のように定義されています。 (CPythonでは、次の可能な値を定義)
この中で今回利用するのは、-X importtime になります。
Python 3.8 でのラッパースクリプトの作成と使用
Python 3.8 でのラッパースクリプトの作成と使用について、公式Docにのも掲載されていますので、合わせてご覧ください。
- SAM templateを用意
- メインのLambda関数実装
- LayerとしてWrapper Scriptを用意
- Lambda関数のDeploy
AWSTemplateFormatVersion: '2010-09-09'
Transform: AWS::Serverless-2016-10-31
Description: >
Timeout: 20
Type: AWS::Serverless::Function
CodeUri: src/
Handler: app.lambda_handler
Runtime: python3.8
- !Ref PythonWrapperLayer
AWS_LAMBDA_EXEC_WRAPPER: "/opt/importtime_wrapper" #スクリプトのファイルシステムパス
Type: AWS::Serverless::LayerVersion
LayerName: python-wrapper-layer
Description: Dependencies for the Function
ContentUri: layer/
- python3.8
LicenseInfo: 'MIT'
RetentionPolicy: Retain
基本的なSAMの構文説明は割愛しますが、Internal Extensionsスクリプトを指定するには、実行可能バイナリまたはスクリプトのファイルシステムパスとして AWS_LAMBDA_EXEC_WRAPPER 環境変数の値を設定します。
├── layer
│ ├── importtime_wrapper
│ └── python
│ └── util
│ ├──
│ ├──
│ └──
├── src
│ ├──
│ ├──
│ └── requirements.txt
└── template.yaml
inside.pyとoutside.pyはそれぞれローカルとグローバルインポートする予定のモジュールです。(本来はInternal Extensionsと別のLayerで管理すべきですが簡単のために同居させています。)
注意点としてimporttime_wrapperにはchmod +xしておくのを忘れないようにしましょう。
# the path to the interpreter and all of the originally intended arguments
# the extra options to pass to the interpreter
extra_args=("-X" "importtime")
# insert the extra options
args=("${args[@]:0:$#-1}" "${extra_args[@]}" "${args[@]: -1}")
# start the runtime with the extra options
exec "${args[@]}"
extra_args=("-X" "importtime") にて、implementation-specific optionを設定しています。
import json
from util import outside
outside.echo('this is loaded outside')
def lambda_handler(event, context):
from util import inside
inside.echo('this is loaded inside')
return {
"statusCode": 200,
"body": json.dumps({
"message": "hello world"
START RequestId: e949850e-1435-473b-a852-a368dc23a358 Version: $LATEST
import time: self [us] | cumulative | imported package
this is loaded outside
import time: 234 | 234 | util.inside
this is loaded inside
END RequestId: e949850e-1435-473b-a852-a368dc23a358
REPORT RequestId: e949850e-1435-473b-a852-a368dc23a358 Duration: 1.21 ms Billed Duration: 2 ms Memory Size: 128 MB Max Memory Used: 51 MB Init Duration: 124.62 ms
ネストされたロード時間がマイクロ秒単位でロードモジュールごとに列挙されています。自身のロード時間(μs)そして累計のネストロード時間(μs)が表形式で出力されています。また、import packageのカラムには適切なインデントが施されているためネストが見やすくなっています。
import time: 266 | 266 | util
import time: 271 | 271 | util.outside
this is loaded outside
import time: 234 | 234 | util.inside
this is loaded inside
END RequestId: e949850e-1435-473b-a852-a368dc23a358
this is loaded outside
より上がグローバルにロードされたモジュールで、そこからthis is loaded inside
Provisioned Concurrency と Lazy Loading の関係について
いったんここまででInternal Extensionsの話は終わりですが、ちょっと補足としてProvisioned ConcurrencyとLazy Loadingの関係について説明しておきます。
Provisioned ConcurrencyはLambda関数インスタンスのColdStart対策など(他にも効用はありますが)で用いられる暖機機能です。
※Provisioned Concurrency自体は別のblogに LambdaのProvisioned Concurrencyと1年付き合ってみて思ったことという内容で説明を書きましたので参照ください。
Provisioned Concurrencyは事前にLambda関数を暖機することができるので、あえてLazy Loadingにしなくても Provisioningフェーズでimport仕切ってしまえばよいという実装パターンがよく用いられます。
こちらの資料でも、importはHandler外で実装することがプラクティスとして挙げられています。このようにProvisioned ConcurrencyのCapacityを超えない(spill overしない)リクエスト量であったり、もしくはApplication Auto ScalingでLambdaへのリクエスト増加に応じてProvisioned Concurrencyが適切にスケールするような設計をしている場合は、あえてLazy Loadingしないという考え方も取れるということに注意ください。
本稿では、あまり脚光を浴びていなかった Lambda Internal Extensions をピックアップしその利用価値について説明しました。