LoginSignup
3
6

AIで簡単!自分だけの絵本を作ろう「ふしぎえほん.ai」

Last updated at Posted at 2024-01-14

はじめに

うちの娘(4歳)は絵本が大好きです。
特に、登場人物を娘の名前にしたりパパ、ママを登場させると大喜びします。

そこで、AIを活用して手軽にオリジナル絵本を作れるサービス、「ふしぎえほん.ai」を作りました。

IMG_9552.png

https://fushigiehon-ai.fly.dev/
※Googleアカウントをお持ちであればそのままログイン可能です。(お持ちでない方もメールアドレスだけで簡単に登録できます。)
IMG_9816.jpeg

こんなものがつくれます

こんなことができます

どきどき!きょうのおはなし

タイトルをいれるだけで絵本ができます。
内容、イラスト、音声まですべてAIが生成します!

きらきら!そうぞうがあふれだす

あなたのアイディアが、ページごとに生き生きとしたイラストになります。

にこにこ!おもいでえほん

楽しかった1日を絵本にできます。写真を取り込んでイラスト化しましょう。

わくわく!みんなとだいぼうけん。

登場人物を自由に設定できます。名前と見た目を設定してお話に登場してもらいましょう。

サービスの特徴

簡単で柔軟

  • タイトルを入力するだけで作成できます。
    IMG_9749.jpeg

  • 生成した絵本はページごとにテキストの編集、画像と音声の再作成、削除が可能です。(AIを使わずに1から作ることも可能)

  • ページを後ろに追加したり途中に差し込むことも可能です。(前後のつながりを意識した内容で生成されます)

表紙編集画面
hyousi.png

ページごとの編集画面
image.png

自分だけの

  • 手持ちの画像や写真をアップロードして、AIでイラスト化できます。

IMG_9735.png

  • 音声も自動生成と録音を選べます。

いつでもどこでも

  • 作成した絵本はいつでも見返すことができます。
    copy_A5717855-6639-4B38-BED6-955403FA7246.gif
  • 動画を簡単に保存して共有することができます。また、PDFとしてダウンロードすることも可能なので、印刷して実際の絵本を作成することもできます。
    image.png

最初から全部

  • 初回ログイン時に100クレジットが付与されるので、すぐに全ての機能が使えます。(イラストの生成のみクレジットを消費します)

技術まわりの話

アプリケーション

相変わらずStreamlitです。
今回は普通っぽい見た目を目指していろいろ工夫してみました。

利用したサードパーティコンポーネント

streamlit-option-menu

pip install streamlit-option-menu

サイドバー内のメニュー表示に利用しています。
IMG_9775.jpeg

streamlit_antd_components

pip install streamlit_antd_components

ステップバーとページネーションの表示に利用しています。
image.png

IMG_9773.jpeg

streamlit_shadcn_ui

pip install streamlit_shadcn_ui

モーダル表示付きのボタンに利用しています。(削除系の操作は確認を挟みたいため)

IMG_9774.jpeg

streamlit-audiorecorder

pip install streamlit-audiorecorder

音声を録音するために利用しています。

image.png

streamlit-supabase-auth

pip install streamlit-supabase-auth

Supabaseと統合した認証フォームとして利用しています。
IMG_9765.jpeg

streamlit-card

pip install streamlit-card

トップページのカード表示に利用しています。
image.png

Streamlit-Image-Carousel

PyPIからのインストールはできません。
ビルド後の各種ファイルをリポジトリに含めておくとStreamlit Cloud上でも使えます。

copy_A5717855-6639-4B38-BED6-955403FA7246.gif

文章、イラスト、音声生成

OpenAIが提供するAPIを利用しています。
文章:GPT-4 Turbo
イラスト:DALL·E 3
音声:Text-to-speech

※各APIの使い方などは↓にまとめています。

手持ちの画像や写真をイラスト化する部分は↓の方法で行なっています。

※複数のイラストや音声を一括で生成するため、非同期でAPIを呼び出しています。
イラスト生成だと以下の感じで実装しています。

import asyncio
import base64
import io
import json

import const
import modules.database as db
import streamlit as st
from modules.utils import culc_use_credits
from openai import AsyncOpenAI
from PIL import Image

client = AsyncOpenAI(api_key=st.secrets["OPEN_AI_KEY"])


def get_event_loop():
    try:
        # 現在のスレッドに対するイベントループを取得または新規作成
        loop = asyncio.get_event_loop()
    except RuntimeError as ex:
        # 'There is no current event loop in thread' エラーの対応
        if "There is no current event loop in thread" in str(ex):
            # 新しいイベントループを作成し、それを現在のスレッドのイベントループとして設定
            loop = asyncio.new_event_loop()
            asyncio.set_event_loop(loop)
        else:
            raise
            
    return loop

async def post_image_api(prompt, user_id):
    event = "イラスト生成"
    b64_json = ""
    gen_size = "1024x1024"

    for _ in range(3):
        try:
            response = await client.images.generate(
                model=const.IMAGE_MODEL,
                prompt=prompt,
                size=gen_size,
                quality="standard",
                n=1,
                response_format="b64_json",
            )
            b64_json = response.data[0].b64_json
            break
        except Exception as e:
            print(e.args)
            return ""

    if b64_json:
        decoded_b64_json = base64.b64decode(b64_json)
        image = Image.open(io.BytesIO(decoded_b64_json))
        image = image.resize((512, 512))

        buffer = io.BytesIO()
        image.save(buffer, format="jpeg", quality=50)
        db.adding_credits(user_id=user_id, value=culc_use_credits([event]), event=event)
        return buffer.getvalue()
    else:
        return ""


async def create_images(tales: dict, user_id: str) -> dict:
    images = {"title": "", "content": []}

    content_image_tasks = [post_image_api(tales["title"], user_id)] + [
        post_image_api(page_prompt, user_id) for page_prompt in tales["content"]
    ]
    results = await asyncio.gather(*content_image_tasks)

    images["title"] = results[0]
    images["content"] = results[1:]

    return images
呼び出し側
if st.button("イラストを一括で生成する"):
    loop = get_event_loop()
    st.session_state.images = loop.run_until_complete(
    create_images(st.session_state.tales,st.session_state.user_id))

認証、ユーザー管理

SupaBaseを利用しました。
最初はAWS Cogniteを使って実装を進めていたのですが、決済処理で利用するStripeとの相性が良さそうだったのと、どうせDBも使うということでSupabaseにまとめました。

↑にも書きましたが、Streamlit有志の方がsupabaseを利用した認証のコンポーネントを作ってくれているので、Google認証との組み合わせなども非常に簡単に実装できました。

決済処理

文章と音声の生成は大きなコストはかかりませんが、いかんせんイラスト生成はコストが大きいです。。破産しないためにもクレジット制とすることにし、Stripeを利用して決済処理を組み込みました。

AWS LambdaをWebhookにしてDBを更新し、Stripeの決算処理とクレジットの追加を連動させています。

※決済処理を組むこと自体はStripeのおかげで難しくなかったですが、特定商取引法に基づく表記など、法律面での対応が最初よくわからず、なかなか許可がおりず。。

その他

ローダー

画面を暗くして中央にアニメーションと文字を表示、操作を不可に。
というのがStreamlitの標準コンポーネントではできません。
CSSとHTMLを以下のように利用して実装しています。
trim.5FEBFFF5-60F3-460D-BE22-49E7DBB3056E.gif

css部分
    st.markdown(
        """
<style>
               .loader-text {
                    color: white; /* テキストの色 */
                    margin-top: 20px; /* ローダーとの間隔 */
                    font-size: 20px; /* テキストサイズ */
                    text-align: center; /* 中央揃え */
                    }

                /* ローダー要素のスタイル定義 */
                .loader {
                    position: relative;
                    width: 75px;
                    height: 100px;
                    background-repeat: no-repeat;
                    background-image: linear-gradient(#DDD 50px, transparent 0),
                                    linear-gradient(#DDD 50px, transparent 0),
                                    linear-gradient(#DDD 50px, transparent 0),
                                    linear-gradient(#DDD 50px, transparent 0),
                                    linear-gradient(#DDD 50px, transparent 0);
                    background-size: 8px 100%;
                    background-position: 0px 90px, 15px 78px, 30px 66px, 45px 58px, 60px 50px;
                    animation: pillerPushUp 4s linear infinite;
                }
                .loader:after {
                    content: '';
                    position: absolute;
                    bottom: 10px;
                    left: 0;
                    width: 10px;
                    height: 10px;
                    background: #de3500;
                    border-radius: 50%;
                    animation: ballStepUp 4s linear infinite;
                }

                @keyframes pillerPushUp {
                0% , 40% , 100%{background-position: 0px 90px, 15px 78px, 30px 66px, 45px 58px, 60px 50px}
                50% ,  90% {background-position: 0px 50px, 15px 58px, 30px 66px, 45px 78px, 60px 90px}
                }

                @keyframes ballStepUp {
                0% {transform: translate(0, 0)}
                5% {transform: translate(8px, -14px)}
                10% {transform: translate(15px, -10px)}
                17% {transform: translate(23px, -24px)}
                20% {transform: translate(30px, -20px)}
                27% {transform: translate(38px, -34px)}
                30% {transform: translate(45px, -30px)}
                37% {transform: translate(53px, -44px)}
                40% {transform: translate(60px, -40px)}
                50% {transform: translate(60px, 0)}
                57% {transform: translate(53px, -14px)}
                60% {transform: translate(45px, -10px)}
                67% {transform: translate(37px, -24px)}
                70% {transform: translate(30px, -20px)}
                77% {transform: translate(22px, -34px)}
                80% {transform: translate(15px, -30px)}
                87% {transform: translate(7px, -44px)}
                90% {transform: translate(0, -40px)}
                100% {transform: translate(0, 0);}
                }
                .overlay {
                        position: fixed;
                        width: 100%;
                        height: 100%;
                        top: 0;
                        left: 0;
                        background-color: rgba(0,0,0,0.5);
                        z-index: 99;
                        cursor: not-allowed;
                        display: flex;
                        justify-content: center;
                        align-items: center;
                        }
                    
</style>
""",
    unsafe_allow_html=True,
呼び出し用の関数
# オーバーレイを表示
def show_overlay(text=""):
    st.markdown(
        f"""
        <div class="overlay">
            <div class="loader"></div>
            <div class="loader-text">{text}</div>
        </div>
        """,
        unsafe_allow_html=True,
    )


# オーバーレイを非表示
def hide_overlay():
    st.markdown(
        """
    <style>
    .loader, .overlay {
        display: none !important;
    }
    </style>
    """,
    unsafe_allow_html=True,

おわりに

絵本好きのお子さんをお持ちの皆様、ぜひ使ってみてください!

3
6
3

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
6