はじめに
量子アニーリング× 生成AI でオリジナル絵本を生成するアプリを運営しています
QUBOOK
2025年5月頃に第一弾をリリースして、地道にエンハンスを続けています。QA4U3という「量子アニーリングを活用したアプリを作ろう」というイベントをきっかけに、現在も社会人1名、学生2名で細く活動しています。(2025年11月24日時点)
1. ユーザー体験

絵本の主人公がまさかの自分だったとき、多くの子どもは嬉しく思うのではないでしょうか。
そんな誰でも主人公になれ、その人にぴったりのオリジナル絵本を生成することができます。
1-1. アプリで何ができる?
このアプリではオリジナル絵本を作成することができます
QUBOOKを試してみる
ここからは、最も想定される「親から子どもへのプレゼント」として話を進めていきます。
- 子どもの名前、その由来、その子への特別な願い(メッセージ)を入力
主人公の画像をアップロードすることも可能です!

2. その子にぴったりの「キャラクター」「舞台」「イベント」「メッセージ (エッセンス)」のストーリー要素の組が決定

3. 納得ができれば絵本生成開始
4. 世界に一つだけのオリジナル絵本が完成!!!
あなただけのオリジナル絵本の完成です。PDF, PNGで保存することができます。
■ 始まりパート


↑
「ぎ」がむずかしそう

↑
出かける方向、逆ではw
■ 冒険パート (3回分ある)


↑
「み」がむずかしそう
星にだって手はあります



1-2. 他のオリジナル絵本
オリジナル絵本業界では、すでに老舗の「Wonderbly」(生成AIとかは関係ない)、「ふしぎえほん.ai」(生成AI利用) などが展開されていて、ニーズが見受けられます。
テンプレート型(例:Wonderbly)
-
https://www.wonderbly.com/jp/personalized-products/when-you-were-born-book
- プロが作り込んだストーリー・レイアウトがベースなので、安定してきれいな一冊が手に入るのが強み
- 一方で、物語の骨格そのものはテンプレートに依存するため、名前や一部の要素を差し替えるのみのパーソナライズが中心。
- 価格は6000円~でかなり人気を集めている (公式サイトでは900万人以上に愛されていると記載されています)
生成AIフル活用型(例:ふしぎえほん.ai)
-
https://fushigiehon-ai.com/
- 生成AIでテキストと画像をまとめて作り、PDF や動画として出力できるタイプ。
- ブラウザ上で手軽に「AI 絵本」を試せるのが魅力で、とにかく色々なパターンを遊んでみたいニーズに向いている。
QUBOOK の立ち位置
QUBOOK は、上の2つとは少し違うところを狙っています。
- 「名前が入っている」だけでなく、その子の名前に込めた想いやその子へ伝えたいメッセージがストーリーに関係する
- 事前に定義した多数のストーリー要素の中から、組み合わせを最適化することで、「その子のための一冊」に近づけることを目指している。
「物語の構造レベルでの特別感」を出せるところを、QUBOOKならではの強みとして目指しています。
2. 絵本ができるまでの流れ
大まかに以下の流れでオリジナル絵本は生成されます。
ユーザーの入力
↓
入力のベクトル化
↓
ストーリー要素最適化
↓
絵本生成
2-1. 入力のベクトル化
名前の由来と、特別な想い・願いををベクトル表現(embedding)に変換します。
ベクトル化することで、類似しているとか、全く異なるとかの計算ができるようになります。
2-2. 量子アニーリングによるストーリー要素最適化
量子アニーリングとは?
→ ヒューリスティックな数理最適化の手法の一つ
多くの組合せ最適化問題は、QUBO (0/1の二次形式の最適化問題) の形に落とし込むことができます。QUBOの最適解を求めることは、変数変換を通じて「あるイジングハミルトニアンで特徴づけられる物理系の基底状態を求めること」と等価になります。
ここでハミルトニアンとは、その物理系において状態ごとのエネルギーがどう決まるかを表す関数だと思ってください。
一方で、「ある基底状態にある物理系のハミルトニアンを十分ゆっくり時間変化させたとき、系は高確率でその時刻ごとのハミルトニアンの基底状態にとどまり続ける」という定理があります。
量子アニーリングでは、この性質を利用します。初期状態として、横磁場だけをかけた「簡単なハミルトニアン」の基底状態を用意し(この基底状態はよく知られており、準備が容易です)、そこから時間とともに横磁場を弱めつつ、QUBOから構成した「解きたい問題のイジングハミルトニアン」になるようにハミルトニアンを変化させていきます。変化が十分ゆっくりであれば、最終的には「問題のハミルトニアンの基底状態」にたどり着いていると期待でき、その状態を読み出すことで元のQUBOの最適解=問題の答えを得ることができます。
ストーリー要素とは?
QUBOOKでも、大まかなストーリーは1つに決めています
量子アニーリングを用いた最適化では、上記の3回の冒険パートにおいて、どんな「キャラ」がどんな「舞台」で出てきて、どんな「イベント」を経てどんな「メッセージ」を心に刻むのかを決定します。
これらの「キャラ」「舞台」「イベント」「メッセージ」をストーリー要素と呼んでいます
⭐ストーリー要素の種類と例

量子アニーリングの役割
→ 生成AIが苦手な部分を補う!
QUBOOK では
- 「どんなキャラ・舞台・イベント・メッセ―ジ(ストーリー要素たち)を組み合わせるか」といったストーリーの骨格づくりを量子アニーリングに任せ、
- その骨格をもとに良い感じの文章や画像を生み出す部分を生成AIに任せる
という役割分担をしています。生成AIが得意な「表現の豊かさ」「文としての自然さ」を活かしつつ、量子アニーリングで入力にフィットした要素の組み合わせや多様なパターンの探索を行うことで、ストーリー全体の一貫性と特別感を底上げするイメージです。
最適化の方針
以下の条件をなるべく満たす組み合わせを見つけてもらうようにしています。
- 罰金項 : 各冒険パートでキャラクター/イベント/メッセージ/舞台は一つ
- 各冒険パートでユーザーの入力と親和性の高いキャラクター/イベント/メッセージ/舞台を選択
- 同じ冒険パートで親和性の高いキャラクター&舞台, イベント&メッセージを選択
- 異なる冒険パートでは親和性の低い、つまり、多角的なキャラクター/イベント/メッセージ/舞台を選択
なんで量子アニーリングなのか?厳密解を出すようなソルバーじゃダメなのか
正直にいうと、
「量子アニーリングをちゃんと使ってみたい」
というモチベーションが原点
なのは否定しません。
しかしそれでは、元も子もないので、量子アニーリングを使うことで得られそうだと考えている利点を挙げます。
-
解の多様性が高いことへの期待
- 量子アニーリングは、1回で厳密最適解を1つだけというより、近いスコアの解を色々なパターンで返してくれる可能性がある。
→ 同じ子どもに対して絵本を複数回作るときに、 良さげなストーリー要素の組を、異なるレパートリーで出力してくれることを期待
(現状、厳密な比較はできておらず、あくまで実験+期待レベルです...)
- 量子アニーリングは、1回で厳密最適解を1つだけというより、近いスコアの解を色々なパターンで返してくれる可能性がある。
記事内で紹介した「たくま」君と同じ内容で作成した別パターンの絵本をXで公開しています
(Xで公開した絵本は記事内で指摘したような文字のミスなどが少なかったです)
https://x.com/qubo_ok/status/1993324979996541124?s=46
-
ストーリー要素の数が増えたときのスケーラビリティへの期待
- よりパーソナライズされた絵本を生成するため、ストーリー要素の種類や数をどんどん増やしていくと、一般的な古典ソルバーだけでは現実的な時間内に解くのが厳しい
- 一方、実機の量子アニーリングマシンでは、処理時間が数十マイクロ秒と非常に短い
→ 古典計算のみの場合と比べて、スループット面で有利になることを期待
(ただし、本記事の時点では厳密なベンチマークまではできていません...)
なお現状のアプリでは、実機のQAではなく OpenJij の SQA (Simulated Quantum Annealing) を利用していますが、設計としては、将来的に実機QAに載せ替えた場合のスケーラビリティも見据えています。
2-3. 生成AIによる絵本生成
ストーリー要素が決まったあと、生成AIで「大まかなストーリー」および各ページの「文章」と「画像」を生成し、絵本として組み立てています。簡単にできそうで、色々うまくいかなかったので、原因とその対応の概要を述べます。
一筋縄ではいかない
- 課題となるポイント
- 主人公・キャラがページごとに崩れていく
- ページごとに顔立ち・服装が変わり、「本当に同じ子なのか?」というレベルで別人になる
- どのページも同じような絵・構図になりがち
- 絵本として退屈なものに...
- 文字(センテンス)が正確に描かれない/読めない
- 画像生成モデルは文字が苦手で、文字が小さすぎる/一部省略される/絵に埋もれる/そもそも出てこない、などが頻発 → 絵本としては「文字が読めない」は致命的
- 画像生成モデルは文字が苦手で、文字が小さすぎる/一部省略される/絵に埋もれる/そもそも出てこない、などが頻発 → 絵本としては「文字が読めない」は致命的
- 主人公・キャラがページごとに崩れていく
課題への対応
絵の生成のプロセスを工夫し、最後はプロンプトでゴリ押すしかできませんでした。。(結局プロンプトなのか...)
-
課題①:主人公・キャラが崩れていく
- 一貫させる情報を最小限に絞るようにプロンプトを調整
- 厳密に維持するもの: 髪型 / 髪色
- 変わってよいもの: 表情・ポーズ・身体の向き / 服のディテール・アクセサリー / カメラアングル・構図
- gpt-image-1において、images.generate()ではなくimages.edit()を使用
→ 同じ主人公だと分かる状態だけ確保し、ページごとに動きが出ることを期待- 1ページ目:
- 主人公+サブキャラの「基準画像」を生成して保存
- 各キャラにキャラデザ的なものがある
- 主人公+サブキャラの「基準画像」を生成して保存
- 2ページ目以降
- 直前ページの画像のみを参照画像として渡す
- プロンプトで「髪型・髪色は固定、それ以外はシーンに合わせて変えてよい」と明示
- 1ページ目:
- 一貫させる情報を最小限に絞るようにプロンプトを調整
-
課題②:同じような絵が生み出される
- 課題①の参照画像に頼りすぎると、背景・構図・ポーズが似通い「どこを開いても同じような画面」になりがち
- 方針 : テキスト側で「視覚情報」を設計して、多様性を明示的に指示
- 各ページに「視覚: 朝、明るい森の入口、引きの構図」などを動的に付与
- キャラのつながりは参照画像で維持しつつ、背景・構図はページごとにしっかり変化させる
-
課題③:文字(センテンス)が正確に描かれない
- 方針: プロンプトで描画手順と条件を細かく指定
- 描画順序
- まずセンテンスを一字一句正確に描く
- その後、残りスペースに絵を描く
- 文字の条件
- 高さ: 画面の 8〜12%(例: 1024px なら 82〜123px)
- 画面内に完全に収める
- 絵で文字を隠さない・かぶせない
- NGパターン
- 文字の省略・変更 / 重複表示 / 画面外に切れる / 吹き出しや帯で文字が小さくなる配置
- 最終チェック
- 文字が全部読めるか? / センテンスが指定どおりか? などのチェックリストを用意
- 描画順序
- 方針: プロンプトで描画手順と条件を細かく指定
以上を経てそこそこマシなクオリティにはなりました!
余談 : OpenAI を信じて賭けに出た話(感謝)
QA4U3では、2025年の3月くらいから本格的にアプリ開発フェーズに入りました。当時OpenAIが提供していた画像生成APIはDALL·Eだけで、ラフな一枚絵ならともかく、「子どもに渡せる絵本」として使うにはクオリティやコントロールの面で採用を見送らざるを得ませんでした。
そこで一度、Stable Diffusion系や各種商用サービスも含めて片っ端から画像生成モデルを調査していたのですが、「これだ」と思える決め手に欠ける日々が続きます。。。
そんな中、3月末にChatGPTのUI側にImage Generationのアップデートが入り、「おおお!これは絵本でも戦えそうだぞ」というレベルの画像がブラウザ上で出るようになりました。同時に「APIも近日公開」のようなアナウンスが出て、「これはもうOpenAI信者になるしかねえ」と決意しました。とはいえ、QA4U3の提出期限は5月12日。APIが実際に公開されたのは4月23日だったので、不安とずっと隣り合わせでした。(ChatGPT のブラウザ版で画像生成のフィージビリティ確認は済ませているが、アプリは未完成という最悪パターンの恐れが...) チームミーティングで毎回「次のミーティングごろまでには出てると思います(💦)」と根も葉もないことを言って、Xをひたすら更新していたのを思い出します(笑)
最終的には、画像 API が来てくれて、気合いで提出期限に間に合わせることができました!「間に合ってくれて本当にありがとう」という、ハラハラドキドキの開発体験になりました。
3. 今後の改善点・チャレンジ
まだまだ改善・チャレンジしたいことは山ほどありますが、特に注目している二点を述べます。
3-1. 生成した絵本を「親子で編集できる」ようにする
現状は、AI が一気に最後まで絵本を作りきるフローになっていますが、本当はここから先にこそ人間の出番があります。たとえば、
- 気になる表現を親が少し書き換える
- 子どもが自分でセリフを足す・絵を描き足す
ことで、AIの暴走をその場で調整しつつ、「ここはこうしてあげたい」という親の愛情や、子どもの個性をきちんと反映でき、クオリティ・パーソナライズ性のより高い絵本が生成できると考えています
→ GoogleのNano Banana Pro なら安定してできそう
3-2. キャラクターとのコラボレーション(推し活の人向け)
特に、もう一つやってみたいのが、「キャラとのコラボ」です。
自分の推しキャラや好きな世界観のキャラクターと、自分自身(あるいは自分の子ども)が絵本の中で出会い、一緒に冒険する体験ができたら、、、子どもだけでなく、大人も推し活としても相当アツいのではないかと考えています。
- 推しのキャラと自分が同じ物語の中に登場する
- 特定の作品やIPとコラボした「公式QUBOOK」的な展開ができる
といった方向性までいければ、な新しい遊び場として面白いことができそうです。
おわりに
QUBOOKは、QA4U3のイベント内や東京科学大のINDESTなどでの発表では高い評価を得ることができました!引き続き頑張ります。
https://www.idp.ori.titech.ac.jp/event-news/7495/
基盤からアプリとそのUIまで設計・開発し、一通り自分でやってみることは非常に良い経験になりますし、自分の無知を痛感し、このままではいけないと思う良いきっかけを与えてくれます。
(QUBOOKの開発も、生成AIさまさまでしたが) 最近では、Claude Code, Codex, Gemini CLI のような画期的なAIコーディングアシスタントが当たり前になり、「AI-DLC時代」が幕開けしました。とりあえず作ってみるかと決意してからモノができるまでがより早く、楽に、そしてより高いクオリティで実現できることに期待しています。
最先端の技術を何か身近なプロダクトに落とし込むことには非常にやりがいを感じ、重要だと捉えているので、上記の強力なツールをうまく使いこなせる人間になり、今後も積極的にトライしていきます。
(QUBOOKはもちろん、引き続き愛情込めてエンハンスしていきますのでもしよければご贔屓を...)
■ 公式サイト
QUBOOK公式
■ X
https://x.com/qubo_ok?s=21








