はじめに
株式会社 NTT データ デジタルサクセスコンサルティング事業部の @ren8k です.
AI Agent を Python で実装する際の代表的なフレームワークとして,LangGraph や CrewAI などが挙げられます.これらのフレームワークではストリーミング出力を行う機能があり,ユーザービリティを高めること可能です.
実装した Agent をアプリケーションに組み込む際,コスト削減のためサーバーレスでの配信を検討することが多いです.AWS では Lambda が代表的なサーバーレスサービスですが,Python で実装した Agent のストリーミング処理を Lambda で実現する場合,工夫が必要です.
本稿では,LangGraph で実装した Agent のストリーミング処理を Lambda で実現するための方法を調査・検証した結果を示します.具体的には,Lambda Web Adapter (LWA) を利用して,LangGraph のレスポンスストリーミングが可能かを確認します.また,React で実装したアプリケーションを CloudFront + S3 でホスティングし,Web アプリケーション経由でレスポンスストリーミングが可能かを確認します.
検証で実装したコードは以下のリポジトリに公開しています.
目的
本検証の目的は,LangGraph (Python) で実装した Agent のストリーミング処理 を AWS 上でサーバーレスで実現することです.ストリーミング処理として,LangGraph の stream()
メソッドを利用します.LangGraph のストリーミング処理は,グラフの実行完了を待たずに,逐次的にノードの実行結果を返します.
AWS Lambda は,サーバーレスコンピューティングサービスとして代表的なサービスですが,執筆時点(2025/01/01)において,Lambda は Node.js のマネージドランタイムでのみレスポンスストリーミングをサポートしています.その他の言語でレスポンスストリーミングを実現する場合は,「カスタムランタイムの作成」か 「Lambda Web Adapter (LWA)の利用」が必要です.
そこで,本検証では,容易に実装可能な Lambda Web Adapter を利用することで,Lambda から LangGraph (Python) のストリーミングレスポンスを取得可能かを確認します.
また,React で実装したアプリケーションを CloudFront + S3 でホスティングし,Web アプリケーション上で Lambda Function URL 経由でレスポンスストリーミングが可能かを確認します.
補足説明
通常,Lambda における Python マネージドランタイムでは,以下の形式で一度にすべてのレスポンスを返す必要があります.
def lambda_handler(event, context):
# 処理
return {
'statusCode': 200,
'body': 'レスポンス'
}
一方,Lambda における Python マネージドランタイムは,ストリーミングレスポンスを直接サポートしていません.具体的には,以下のようには実装できません.
def lambda_handler(event, context):
for chunk in generate_response(): # 本来はこのように少しずつデータを返したい
yield chunk # ← これができない
Lambda Web Adapter (LWA) と FastAPI のような Web フレームワークを介すことで,レスポンスストリーミングを実現できます.
from fastapi.responses import StreamingResponse
# Lambda Web Adapter + FastAPIを使用した場合
@app.post("/stream")
def stream_response():
return StreamingResponse(
generate_response(), # yieldを使ったジェネレータ関数
media_type="text/event-stream"
)
検証の全体像
バックエンドでは,Lambda Web Adapter (LWA) で FastAPI を Lambda 上で実行し,LangGraph で実装した Agent のレスポンスストリーミングをサーバーレスで実現します.なお,Agent で利用する LLM には Amazon Bedrock Claude 3.5 Haiku を利用しています.また,ストリーミングレスポスは,Lambda Function URL 経由で取得します.
フロントエンドでは, React による SPA を CloudFront + S3 でホスティングし,Web アプリケーション経由でレスポンスストリーミングが可能かを確認します.
検証で利用する Agent
簡単のため,以下のような workflow 型の Agent を利用します.
本 Agent は,与えられた商品情報から「広告コピー文」と「ターゲットとする顧客」を提案する Agent です.Prompt chaining により 以下のステップでノードを連続して実行します.
- step0. 商品情報を入力 (
__start__
ノード) - step1. step0. の結果を基に,広告文を生成 (
generate_copy
ノード) - step2. step1. の結果を基に,ターゲットとする顧客を分析 (
analysis_target_audience
ノード)
本検証では,LangGraph の stream()
メソッドを利用して,generate_copy
ノード,analysis_target_audience
ノードの結果をストリーミングで取得します.
Lambda Web Adapter (LWA) とは
LWA は,Flask,Express.js などの一般的な Web フレームワークで作られたアプリケーションを Lambda 上で実行できるようにするためのツールです.具体的には,LWA は Lambda で受信したイベントを Web アプリケーションに HTTP で転送するプロキシとして機能します.LWA は単なるアダプター(変換層)であり,実際の HTTP リクエスト/レスポンスの処理機能は持っていません.つまり,Web フレームワークを利用し,HTTP リクエストを処理する Web アプリケーションを用意する必要があります.
LWA の呼び出し元として,以下が利用可能です.本検証では,ストリーミングレスポンスを取得するため,Lambda Function URL を利用します.
- API Gateway
- Lambda Function URL
- ALB
検証手順
以下の手順で,LWA を利用して,LangGraph のストリーミング処理を実現します.
- バックエンドの実装
- Web アプリケーションの準備
- Docker ファイルの作成
- ECR に Docker イメージを push
- Lambda の作成
- Lambda Function URL 経由でのレスポンスストリーミング
- CDK 実装
- フロントエンドの実装
- Streamlit / React の実装
- CloudFront + S3 でのホスティング
- CDK 実装
バックエンドの実装
LWA を利用し,Lambda Function URL 経由でレスポンスストリーミングを実現するための手順を示します.
Web アプリケーションの準備
FastAPI と Uvicorn を利用し,Web アプリケーションを実装します.以下に,FastAPI の簡易実装を示します.関数 api_stream_graph
にて,StreamingResponse
を利用してレスポンスストリーミングを行います.また,Lambda Web Adapter のデフォルトポートは 8080
なので,Uvicorn のポートを 8080
に変更しています.
実装
import os
import uvicorn
from agent import stream_graph
from fastapi import FastAPI
from fastapi.middleware.cors import CORSMiddleware
from fastapi.responses import StreamingResponse
from pydantic import BaseModel
app = FastAPI()
# CORSミドルウェアの設定 (本番環境では適切なオリジンを指定してください)
app.add_middleware(
CORSMiddleware,
allow_origins=["*"],
allow_credentials=True,
allow_methods=["*"],
allow_headers=["*"],
)
class Input(BaseModel):
product_detail: str
@app.post("/api/stream_graph")
def api_stream_graph(input: Input):
return StreamingResponse(
stream_graph(input.product_detail), media_type="application/json; charset=utf-8"
)
if __name__ == "__main__":
uvicorn.run(app, host="0.0.0.0", port=int(os.environ.get("PORT", "8080"))) # Default port of LWA is 8080
以下に,Agent の実装を示します.関数 stream_graph
にて,LangGraph のストリーミング処理を実行しています.LLM としては,Bedrock Claude3.5 Haiku を利用しています.また,最近新しく追加された機能である Command
を利用しています.
実装
import json
from typing import Annotated, Any, Generator
from langchain_aws import ChatBedrock
from langchain_core.prompts import ChatPromptTemplate
from langgraph.graph import START, StateGraph
from langgraph.graph.state import CompiledStateGraph
from langgraph.types import Command
from typing_extensions import TypedDict
llm = ChatBedrock(
model="us.anthropic.claude-3-5-haiku-20241022-v1:0",
region="us-west-2",
)
# Define graph state
class State(TypedDict):
product_detail: Annotated[str, "製品詳細"]
copy: Annotated[str, "コピー"]
target_audience: Annotated[str, "ターゲット顧客"]
# Define the nodes
def generate_copy(state: State) -> Command:
print("Called generate_copy")
human_prompt = """
以下の製品情報から,商品の広告文を作成しなさい.最終的な広告文を1つのみ出力すること.
<product_details>
{product_detail}
</product_details>
"""
prompt = ChatPromptTemplate([("human", human_prompt)])
chain = prompt | llm
response = chain.invoke({"product_detail": state["product_detail"]})
return Command(
update={"copy": response.content},
goto="analysis_target_audience",
)
def analysis_target_audience(state: State) -> Command:
print("Called analysis_target_audience")
human_prompt = """
以下の広告文に基づいて,最適なターゲット層を分析してください.最終的なターゲット層のみ出力すること.
<copy>
{copy}
</copy>
"""
prompt = ChatPromptTemplate([("human", human_prompt)])
chain = prompt | llm
response = chain.invoke({"copy": state["copy"]})
return Command(
update={"target_audience": response.content},
)
def build_graph() -> CompiledStateGraph:
builder = StateGraph(State)
builder.add_edge(START, "generate_copy")
builder.add_node("generate_copy", generate_copy)
builder.add_node("analysis_target_audience", analysis_target_audience)
return builder.compile()
def stream_graph(input: str) -> Generator[str, Any, None]:
print("Starting graph")
graph = build_graph()
stream = graph.stream(input={"product_detail": input}, stream_mode="values")
for state in stream:
yield json.dumps(state, ensure_ascii=False) + "\n"
Docker ファイルの作成
以下に,Dockerfile の実装を示します.既存のアプリケーション用の Dockerfile に 2 行目の COPY コマンドを追記するだけで,LWA のインストールが可能です.また,LWA でレスポンスストリーミングを行う場合,環境変数 AWS_LWA_INVOKE_MODE
を RESPONSE_STREAM
に設定する必要があります.(環境変数の設定は,Lambda 側で実施しても問題ないです.)
FROM public.ecr.aws/docker/library/python:3.12.0-slim-bullseye
COPY --from=public.ecr.aws/awsguru/aws-lambda-adapter:0.8.4 /lambda-adapter /opt/extensions/lambda-adapter
WORKDIR /app
ADD . .
RUN pip3 install --no-cache-dir -r requirements.txt
ENV AWS_LWA_INVOKE_MODE RESPONSE_STREAM
CMD ["python", "main.py"]
awslabs のリポジトリ を参考にしています.
上記のコンテナイメージは, Lamabda 以外の環境でも利用可能なので,ローカルでの動作確認が容易です.例えば,上記のコンテナイメージをビルドし,以下のコマンドでローカルで FastAPI を実行できます.
docker build -t <image_name> .
docker run --rm -it -p 8080:8080 -v /home/<username>/.aws/:/root/.aws <image_name>
# http://localhost:8080/docsにアクセス可能なことを確認
# 別のターミナルから以下のコマンドでリクエストを送信
curl -X 'POST' \
'http://localhost:8080/api/stream_graph' \
-H 'accept: application/json' \
-H 'Content-Type: application/json' \
-d '{
"product_detail": "香りの良い化粧水"
}'
ECR に Docker イメージを push
上記の Dockerfile をビルドし,ECR にプッシュします.以下のコマンドで,リポジトリに対してイメージを認証し,プッシュします.
# Retrieve an authentication token and authenticate your Docker client to your registry
aws ecr get-login-password --region ap-northeast-1 | docker login --username AWS --password-stdin 12345678910.dkr.ecr.ap-northeast-1.amazonaws.com
# Build the Docker image
docker build -t <name> .
# Tag the image so you can push the image to your registry
docker tag <name>:latest 12345678910.dkr.ecr.ap-northeast-1.amazonaws.com/<name>:latest
# Push the image to your registry
docker push 12345678910.dkr.ecr.ap-northeast-1.amazonaws.com/<name>:latest
Lambda の作成
以下の点に留意して Lambda を作成します.
- コンテナイメージから関数を作成
- ECR にプッシュした Docker イメージを利用します.
- Bedrock のポリシー付与
-
'bedrock:InvokeModel'
に対するポリシーを付与します.
-
- 関数 URL の作成
- 今回は検証のため,認証タイプ:
NONE
とします. - 関数 URL の設定で,呼び出しモード:
RESPONSE_STREAM
にします.
- 今回は検証のため,認証タイプ:
- Lambda の最大実行時間の変更
- 5 分に延長します.
Lambda Function URL 経由でのレスポンスストリーミング
curl などで,Lambda Function URL を利用して構築した API エンドポイントへ POST リクエストを送信することで,ストリーミングレスポンスを取得できます.
#!/bin/bash
LAMBDA_URL="https://XXXXXXXXXXXXXXXXXXXXXXXXXXXXX.lambda-url.ap-northeast-1.on.aws/"
ENDPOINT="api/stream_graph"
API_URL="${LAMBDA_URL}${ENDPOINT}"
PRODUCT_DETAIL="ラベンダーとベルガモットのやさしい香りが特徴の保湿クリームで、ヒアルロン酸とシアバターの配合により、乾燥肌に潤いを与えます。"
curl -X 'POST' \
"${API_URL}" \
-H 'accept: application/json' \
-H 'Content-Type: application/json' \
-d "{
\"product_detail\": \"${PRODUCT_DETAIL}\"
}"
上記では,商品情報として,ラベンダーとベルガモットのやさしい香りが特徴の保湿クリームで、ヒアルロン酸とシアバターの配合により、乾燥肌に潤いを与えます。
という架空の商品情報を与えています.この場合,以下のようなレスポンスをストリーミングで取得できます.
{"product_detail": "ラベンダーとベルガモットのやさしい香りが特徴の保湿クリームで、ヒアルロン酸とシアバターの配合により、乾燥肌に潤いを与えます。"}
{"product_detail": "ラベンダーとベルガモットのやさしい香りが特徴の保湿クリームで、ヒアルロン酸とシアバターの配合により、乾燥肌に潤いを与えます。", "copy": "乾燥肌にやさしい愛のケア✨ラベンダーとベルガモットの香りに包まれながら、ヒアルロン酸とシアバターが肌に深い潤いを与える、至福の保湿クリーム、あなたの肌を優しく癒します🌿✨"}
{"product_detail": "ラベンダーとベルガモットのやさしい香りが特徴の保湿クリームで、ヒアルロン酸とシアバターの配合により、乾燥肌に潤いを与えます。", "copy": "乾燥肌にやさしい愛のケア✨ラベンダーとベルガモットの香りに包まれながら、ヒアルロン酸とシアバターが肌に深い潤いを与える、至福の保湿クリーム、あなたの肌を優しく癒します🌿✨", "target_audience": "20代後半から40代前半の女性で、乾燥肌に悩み、自然由来の成分にこだわり、心地よい香りと高い保湿力を求めるライフスタイル重視の美意識の高い層。"}
各行が,__start__
ノード,generate_copy
ノード,analysis_target_audience
ノード終了時点の State を表しています.copy
キーには,生成された広告文が,target_audience
キーには,ターゲットとする顧客が格納されています.
CDK 実装
上記の ECR へのイメージのプッシュや LWA によるレスポンスストリーミングが可能な Lambda の作成を,CDK で一括で行えるようにしました.cdk deploy
コマンド終了後,Lambda Function URL がターミナルに表示されます.
実装
import * as cdk from 'aws-cdk-lib';
import * as lambda from 'aws-cdk-lib/aws-lambda';
import * as iam from 'aws-cdk-lib/aws-iam';
import { Construct } from 'constructs';
export class FastapiLambdaWebAdapterCdkStack extends cdk.Stack {
constructor(scope: Construct, id: string, props?: cdk.StackProps) {
super(scope, id, props);
// Lambda関数の作成
const fastApiFunction = new lambda.DockerImageFunction(this, 'FastAPIFunction', {
code: lambda.DockerImageCode.fromImageAsset('./app', {
file: 'Dockerfile',
}),
memorySize: 512,
timeout: cdk.Duration.seconds(300),
tracing: lambda.Tracing.ACTIVE,
});
// Bedrock用のIAMポリシーを追加
fastApiFunction.addToRolePolicy(new iam.PolicyStatement({
effect: iam.Effect.ALLOW,
actions: ['bedrock:InvokeModel'],
resources: ['*'],
sid: 'BedrockInvokePolicy',
}));
// Function URLの設定
const functionUrl = fastApiFunction.addFunctionUrl({
authType: lambda.FunctionUrlAuthType.NONE,
invokeMode: lambda.InvokeMode.RESPONSE_STREAM,
});
// 出力の設定
new cdk.CfnOutput(this, 'FastAPIFunctionUrl', {
description: 'Function URL for FastAPI function',
value: functionUrl.url,
});
new cdk.CfnOutput(this, 'FastAPIFunctionArn', {
description: 'FastAPI Lambda Function ARN',
value: fastApiFunction.functionArn,
});
}
}
フロントエンドの実装
Streamlit と React を利用し,ローカル上のアプリケーションでレスポンスストリーミングが可能であることを確認します.また,CloudFront + S3 で React アプリ (SPA) をホスティングし,実際の Web アプリケーションとしてレスポンスストリーミングが可能であることを確認します.検証に利用した実装は以下に公開しております.
Streamlit
変数 LAMBDA_URL
に Lambda Function URL を設定することで利用可能です.requests.post()
メソッドでストリーミングモードを有効化し,API エンドポイント (Lambda Function URL) に POST リクエストを送信しています.実装は GitHub に公開しています.
以下にアプリケーションの画面録画を示します.ストリーミングで取得したレスポンスを画面上に表示することができています.
実装
import json
import requests
import streamlit as st
# APIのエンドポイントURL
LAMBDA_URL = "https://XXXXXXXXXXXXXXXXXXXXXXXXXXXXX.lambda-url.ap-northeast-1.on.aws/"
ENDPOINT = "api/stream_graph"
API_URL = LAMBDA_URL + ENDPOINT
# ページ設定
st.set_page_config(
page_title="商品広告生成アプリ",
page_icon="🤖",
layout="wide",
)
# タイトルと説明
st.title("商品広告生成アプリ")
st.markdown("本アプリは、製品情報から広告文を生成し、最適なターゲット層を分析します。")
# 製品情報入力欄
product_detail = st.text_area(
"製品情報を入力してください",
height=150,
placeholder="例:ラベンダーとベルガモットのやさしい香りが特徴の保湿クリームで、ヒアルロン酸とシアバターの配合により、乾燥肌に潤いを与えます。",
)
# 実行ボタン
if st.button("Agent 実行開始", type="primary", disabled=not product_detail):
# 結果表示用のプレースホルダー
copy_placeholder = st.empty()
target_placeholder = st.empty()
try:
# APIリクエストを送信
with st.spinner("実行中..."):
response = requests.post(
API_URL,
json={"product_detail": product_detail},
stream=True,
headers={"Accept": "application/json"},
)
if response.status_code == 200:
# ストリーミングレスポンスを処理
for line in response.iter_lines():
if line:
# JSONデータをデコード
state = json.loads(line.decode("utf-8"))
# コピーが生成された場合
if "copy" in state:
with copy_placeholder.container():
st.subheader("📝 生成された広告文")
st.info(state["copy"])
# ターゲット層が分析された場合
if "target_audience" in state:
with target_placeholder.container():
st.subheader("🎯 ターゲット層分析")
st.success(state["target_audience"])
else:
st.error(f"APIエラー: ステータスコード {response.status_code}")
except requests.exceptions.RequestException as e:
st.error(f"接続エラー: {str(e)}")
except json.JSONDecodeError as e:
st.error(f"JSONデコードエラー: {str(e)}")
except Exception as e:
st.error(f"予期せぬエラーが発生しました: {str(e)}")
React
当方 React 初学者のため簡易実装ですが,参考のため以下に主要なコードを示します.config/api.js
の変数 LAMBDA_URL
に Lambda Function URL を設定することで利用可能です.本実装は GitHub にも公開しています.
以下にアプリケーションの画面録画を示します.ストリーミングで取得したレスポンスを画面上に表示することができています.
実装
// API設定
export const API_CONFIG = {
LAMBDA_URL: "https://XXXXXXXXXXXXXXXXXXXXXXXXXXXXX.lambda-url.ap-northeast-1.on.aws/",
ENDPOINT: "api/stream_graph",
get API_URL() {
return `${this.LAMBDA_URL}${this.ENDPOINT}`;
},
HEADERS: {
'Content-Type': 'application/json',
'Accept': 'text/event-stream'
}
};
import React from 'react';
import useProductAnalysis from './hooks/useProductAnalysis';
import ProductForm from './components/ProductForm';
import ResultCard from './components/Result/ResultCard';
import './styles/components/App.css';
const App = () => {
const {
copy,
targetAudience,
isLoading,
error,
analyzeProduct
} = useProductAnalysis();
return (
<div className="container">
<div className="card">
<h1 className="title">
<span className="title-highlight">商品広告生成アプリ</span>
</h1>
<h2 className="subtitle">商品詳細</h2>
<ProductForm
onSubmit={analyzeProduct}
isLoading={isLoading}
/>
{error && (
<div className="error">
{error}
</div>
)}
{copy && (
<ResultCard
title="生成された広告文"
content={copy}
emoji="📝"
/>
)}
{targetAudience && (
<ResultCard
title="ターゲット層分析"
content={targetAudience}
emoji="🎯"
isTargetAudience={true}
/>
)}
</div>
</div>
);
};
export default App;
import { useState } from 'react';
import { API_CONFIG } from '../config/api';
const useProductAnalysis = () => {
const [copy, setCopy] = useState('');
const [targetAudience, setTargetAudience] = useState('');
const [isLoading, setIsLoading] = useState(false);
const [error, setError] = useState(null);
const analyzeProduct = async (productDetail) => {
setIsLoading(true);
setCopy('');
setTargetAudience('');
setError(null);
try {
const response = await fetch(API_CONFIG.API_URL, {
method: 'POST',
headers: API_CONFIG.HEADERS,
credentials: 'omit',
mode: 'cors',
body: JSON.stringify({ product_detail: productDetail })
});
if (!response.ok) {
throw new Error(`HTTP error! status: ${response.status}`);
}
await processStream(response.body.getReader());
} catch (error) {
console.error('Error:', error);
setError(error.message || '予期せぬエラーが発生しました');
} finally {
setIsLoading(false);
}
};
const processStream = async (reader) => {
const decoder = new TextDecoder();
let buffer = '';
try {
while (true) {
const { done, value } = await reader.read();
if (done) {
processBuffer(buffer);
break;
}
buffer += decoder.decode(value, { stream: true });
const lines = buffer.split('\n');
buffer = lines.pop() || '';
lines.forEach(line => processBuffer(line));
}
} catch (error) {
console.error('Stream processing error:', error);
throw error;
}
};
const processBuffer = (buffer) => {
if (!buffer.trim()) return;
try {
const data = JSON.parse(buffer);
if (data.copy) setCopy(data.copy);
if (data.target_audience) setTargetAudience(data.target_audience);
} catch (error) {
console.error('JSON parsing error:', error);
}
};
return {
copy,
targetAudience,
isLoading,
error,
analyzeProduct
};
};
export default useProductAnalysis;
CloudFront + S3 でのホスティング
以下の手順で,React による SPA を CloudFront + S3 でホスティングすることができます.
- React プロジェクトのディレクトリ内でビルドし,静的ファイルを生成する
npm run build
- S3 バケットを作成し,ビルドした静的ファイルをアップロードする
aws s3 sync build/ s3://<bucket-name>
- CloudFront ディストリビューションを作成
- オリジンドメイン: 先ほど作成した S3 バケット名が含まれるドメイン名を選択
- オリジンアクセス: Origin access control settings を選択
- Origin access control では,Create new OAC を選択
- ※OAC: S3 には CloudFront からのアクセスのみ許可する設定
- 設定 の デフォルトルートオブジェクト:
index.html
を入力 - その他の設定はデフォルトで問題ない
- 「ディストリビューションを作成」を押下
-
The S3 bucket policy needs to be updated
と表示されるので,Copy policy
を押下し,クリップボードにコピー
- S3 バケットのポリシーを更新
- S3 バケットの「アクセス許可」 の 「バケットポリシー」を編集
- クリップボードにコピーしたポリシーを貼り付け
CDK 実装
上記の S3 や CloudFront の作成を,CDK で一括で行えるようにしました.前提として,config/api.js
の変数 LAMBDA_URL
に Lambda Function URL を設定後,React プロジェクトのディレクトリ内でビルドしておく必要があります.cdk deploy
コマンド終了後,ディストリビューションドメイン名がターミナルに表示されます.
実装
import * as cdk from 'aws-cdk-lib';
import * as s3 from 'aws-cdk-lib/aws-s3';
import * as cloudfront from 'aws-cdk-lib/aws-cloudfront';
import * as cloudfront_origins from 'aws-cdk-lib/aws-cloudfront-origins';
import * as s3deploy from 'aws-cdk-lib/aws-s3-deployment';
import * as path from 'path';
import { RemovalPolicy } from 'aws-cdk-lib';
export class ReactAppStack extends cdk.Stack {
constructor(scope: cdk.App, id: string, props?: cdk.StackProps) {
super(scope, id, props);
// S3バケットの作成
const websiteBucket = new s3.Bucket(this, 'ReactAppBucket', {
removalPolicy: RemovalPolicy.DESTROY, // 本番では RETAIN にすべき
autoDeleteObjects: true, // 本番では false にすべき
});
// CloudFront Distributionの作成
const distribution = new cloudfront.Distribution(this, 'ReactAppDistribution', {
defaultBehavior: {
origin:
// S3 バケットへの OAC によるアクセス制御を設定
cloudfront_origins.S3BucketOrigin.withOriginAccessControl(
websiteBucket
),
},
defaultRootObject: 'index.html',
errorResponses: [
{
httpStatus: 403,
responseHttpStatus: 200,
responsePagePath: '/index.html',
},
{
httpStatus: 404,
responseHttpStatus: 200,
responsePagePath: '/index.html',
},
],
});
// S3へのデプロイ
new s3deploy.BucketDeployment(this, 'DeployReactApp', {
sources: [s3deploy.Source.asset(path.join(__dirname, '../../react/build'))],
destinationBucket: websiteBucket,
distribution,
distributionPaths: ['/*'],
});
// CloudFront URLの出力
new cdk.CfnOutput(this, 'DistributionDomainName', {
value: distribution.distributionDomainName,
description: 'CloudFront Distribution Domain Name',
});
}
}
ディストリビューションドメイン名をコピーし,ブラウザで開くことで,React アプリケーションにアクセスすることができます.ストリーミングで取得したレスポンスを画面上にリアルタイムで表示できることを確認します.
まとめ
本稿では,Lambda Web Adapter を利用することで,Lambda 上で LangGraph (Python) で実装した Agent のレスポンスストリーミングが可能であることを確認しました.また,React による SPA を CloudFront + S3 でホスティングし,Web アプリケーション上でのレスポンスストリーミングが可能であることを確認しました.LangGraph などの Agent フレームワークを利用する場合,ECS や EC2 で実行する例が多いですが,Lambda を利用しサーバーレス化することで,大幅なコスト削減が可能です.
今後の課題として,Lambda Function URL を利用する際の認証タイプとして AWS_IAM
を利用することが挙げられます.本検証では,認証タイプ: NONE
で実装しましたが,本番環境ではセキュリティ上のリスクがあるため,AWS_IAM
認証を利用することが推奨されます.この場合,CloudFront で Lambda@Edge を利用した Cognito 認証が必要になります.最後に,本対応で参考になりそうなリンクを以下に示します.