Amazon Bedrockで画像生成&S3保存するPythonコードを書く

Last updated at 2023-12-29Posted at 2023-12-17

はじめに

画像生成AIで絵を作成するのが好きなので、Amazon Bedrock(以下Bedrock)でStable Diffusion XL 1.0を使ってみました。

作りたいイメージは頭の中にあるのですが、それをちゃんと出力できるプロンプト考えるのが結構大変なので、チャット形式でざっくりイメージを伝える -> よしなにプロンプト組み立て -> 画像生成して返してくれる
といったアプリを作れればいいなあと思ってます。

今回はAWS Lambda(以下Lambda)からStable Diffusion XL 1.0のAPIを叩いて、作成された画像をS3に格納する部分を作りました。

Bedrockは、Meta、Stability AI、Amazonなどが提供する基盤モデル(生成AIの一種)を利用できるフルマネージド型サービスです。マネジメントコンソール上のPlaygroundsで提供されているモデルを試してみることもできます。

1. 構成

完成系はこんなイメージです。
Amazon API Gateway経由でLambdaを実行し、BedrockのStable Diffusion XL 1.0のAPIを叩いて、実行結果(base64文字列)をデコードしてS3に保存します。

2. 構築手順

2.1 Bedrockで利用するAIモデルを申請する

Bedrockで基盤モデルを利用するために、まず最初にモデルへのアクセス申請をする必要があります。

Overviewから"Request Model Access"をクリック

"Manage model access"をクリック

利用したいモデルにチェックを入れ、"Request model access"ボタンを押す

自分が申請したときは数分掛かったか掛からないかくらいで使えるようになりました。

2.2 Lambdaを書く

モデルを利用できるようになったらStable Diffusion XL 1.0のAPIを叩くコードを書きます。
base64文字列で生成結果が返ってくるので、デコードしてS3に格納します。
ランタイムはPython 3.12です。

コード作成にあたり、下記サイトを参考にさせていただきました。

Bedrockの基盤モデルのAPIを叩くPythonコード

Stable Diffusion XL 1.0へのinput部分

base64文字列をデコードしてS3に保存する

import boto3
import json
import base64

def lambda_handler(event, context):
  s3 = boto3.resource('s3')
  bedrock = boto3.client(service_name='bedrock-runtime')

  #引数をプロンプトとして格納
  prompt_data = event['input']

  body = json.dumps({
      "text_prompts": [{"text": prompt_data}],
      "cfg_scale": 10,
      "seed": 20,
      "steps": 50
  })
  
  modelId = 'stability.stable-diffusion-xl-v1'
  accept = '*/*'
  contentType = 'application/json'
  
  response = bedrock.invoke_model(
      modelId=modelId,
      accept=accept,
      contentType=contentType,
      body=body,
  )

  
  response_body = json.loads(response.get('body').read())
  
  #レスポンスのbodyから生成された画像の情報のみ取得
  img_base64 = response_body["artifacts"][0].get("img_base64")

  #<bucketname>は実際のバケット名に置き換える
  bucket = s3.Bucket('<bucketname>')

  #S3に格納(ファイル名は<プロンプト>.png)
  bucket.put_object(
                  Key=f'{prompt}.png',
                  Body=base64.b64decode(img_base64.encode("UTF-8")),
                  ContentType='image/png')

  return response_body

2.3 Lambdaを動かしてみる

Lambdaのテストイベントでパラメータ(今回はプロンプト)を指定して実行してみましょう。
"waterfall and basin"というプロンプトで画像生成してもらいます。

実行後、生成されたファイルがS3に格納されました

ファイルを開いてみるとこんな感じ

おわりに

次はチャット形式でプロンプトを提案してくれる部分を作りたいです。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up