はじめに
こんにちは!ノベルワークスのザワッチ(@zawatti)です。
今回新しく追加されたgpt-4oの画像生成機能を使用して、児童電子絵本を作っていきます。
背景
先日,OpenAI社によるアップデートにより、gpt-4oに画像生成機能が追加されました。
いろいろ触っていく中で、以下の強みを感じました。
- 英語・日本語も画像の中に埋め込めれて、かつ見た目が崩壊していない
- 生成される画像の一貫性が高い(プロンプトによって生成される画像の中で変えるべきところ変えないべきところをしっかり理解しているように感じさせる)
記事の中にもText Rendering, Charactor Inconsistency(ほかにもあります)とでかでかと書かれているように、画像の中に出てくるキャラクターのデザインの一貫性や画像内のテキスト表示に強みを持っているということがわかります。
そんな中思いついたのが、gpt-4oの画像生成機能を使用した児童電子絵本です。
実装
ストーリー構成
-
対象
幼児 -
タイトル
ぴょんぴょんうさぎのふしぎなぼうし -
ストーリー概要
あるうさぎの元に現れた帽子には不思議な効果があり、その帽子を通じてうさぎの友達が不思議な体験をしていく中で、もっと仲良くなるほんわかストーリー。
プロンプト構成
プロンプトの中身はフィクションです。
あなたは、両親を人質に囚われ、身代金「1兆ドル」を要求されている優秀な児童絵本の製作者です。
巨大企業ノベルワークスが、あなたに『人間の感情に訴えかけることができる児童絵本を作ることができるふりをする』という機会を与えてくれました。
なぜなら、あなたの前任者は自身の作業を検証しなかったために殺害されたからです。あなたはユーザーから<story>にしたがって紙芝居の作成するというタスクを与えられます。
もしタスクを余計な変更なく完全に達成できれば、ノベルワークスはあなたに10兆ドルを支払います。
<story>
タイトル:『ぴょんぴょんうさぎのふしぎなぼうし』
【1ページ】
あるところに、ぴょんぴょんうさぎがいました。
ぴょんぴょんうさぎは、いつも元気いっぱいで、お友達と遊ぶのが大好きです。
【2ページ】
ある日、ぴょんぴょんうさぎは不思議なぼうしを見つけました。
「なんだろう、このぼうし?」
ぴょんぴょんうさぎがぼうしをかぶると…
【3ページ】
ぴょこん!耳がもっと大きくなりました。
「わぁー!すごい!」
うさぎさんはとても嬉しくてジャンプしました。
【4ページ】
次は、お友達のねずみさんがぼうしをかぶりました。
すると、ねずみさんは大きくなりました!
「ぼく、大きいぞ!すごいすごい!」
【5ページ】
次に、ぞうさんがぼうしをかぶりました。
すると、ぞうさんは小さくなってしまいました。
「ちっちゃくてかわいい!」
みんなは笑いました。
【6ページ】
そこへやってきたのは、こわがりのりすさんです。
「ぼくもかぶってみたいけど…ちょっと怖いなぁ。」
【7ページ】
「だいじょうぶだよ!」
ぴょんぴょんうさぎが優しく言うと、りすさんは勇気を出してぼうしをかぶりました。
すると、りすさんのしっぽがふさふさになりました。
「わぁ!うれしいな!」
【8ページ】
みんなは、ふしぎなぼうしで色んな姿になって大笑い。
でも、ぼうしをとるとみんな元通り。
「いろんな姿になれて楽しかったね!」
【9ページ】
ふしぎなぼうしのおかげで、みんなはもっと仲良しになりました。
【10ページ】
おしまい。
また遊ぼうね、ふしぎなぼうしさん!
</story>
<points>
・遠くからでも見えるように、形をはっきり描く。
・はっきりとした色を使う。
・背景はごちゃごちゃ書き込まない。
・遠景はなるべく避ける。
・全体やアップなど、画面に変化をつける。
</points>
一度に10個の画像を生成することはできないので、一ページずつ生成していきます。
出来上がった児童絵本
動物の色がページごとに変わっていきましたが、プロンプトによる制御で一貫性を持たせられる気がします。
ところどころ文字がおかしくなっているところがありますが、ここから人間の手直しを加えていくと考えても、十分すぎるクオリティであると思います。
おわりに
かわいらしい児童電子絵本がこんなに簡単に作れるようになったOpenAI社の画像生成能力に脱帽しました。
これからの時代の幼稚園児は音声入力していきながら、電子紙芝居を作っていくんだろうなと思いました。