注意:「novel2commic」は勝手に言ってみただけなので、世の中にそんな言葉があるかは知らないです
GPT-4oの画像生成が話題なので簡単に漫画が描けるのか試してみる。
結論から言うと、うまくいってはおらず、試行の記録です。
題材
ちょっと前に練習で書いてみた自作小説を対象にしてみる。
キャラデザを作る
ラフな絵をちゃちゃっと書いて仕上げてもらう。
ポニーテールが消えたりしており、違う人になってる。
この辺の挙動はGeminiさんの方が忠実な印象がある。
漫画のコマ割りを作る
Gemini 2.5 Pro Experimental 03-25に考えてもらう。
こんな感じで小説(約6000字)を丸っと投げて、コマ割りを依頼してみる。
するとこんな感じで出力してくれた。
12ページは超えてたけど、まあ元々の依頼が無茶だった気がするのでOK。
- ページ:
ページ番号: 1
コマ:
- コマの位置: 全体(大ゴマ)
キャラの配置: 星奈結愛(バストアップ、少し困り顔)
背景: 無地 or 軽くぼかし
セリフ: |
(モノローグ)私の名前は星奈 結愛(ほしな ゆあ)。
都内の某私立大学に通う、どこにでもいる普通の女子大生だ。
- コマの位置: 左下(横長)
キャラの配置: 結愛(全身、友達とカフェにいるなど)
背景: 大学のキャンパスやカフェなど
セリフ: (モノローグ)特に将来の夢があるわけでもないし、勉強に没頭するタイプでもない。友達と適度に遊んで、バイトもそこそこにこなし、学生生活をそこそこ楽しみながら生きている。
- ページ:
ページ番号: 2
コマ:
- コマの位置: 右上(横長)
キャラの配置: なし
背景: 雑居ビルの外観、最上階が少しモダン
セリフ: (モノローグ)そんな私だが、ひょんなことから「二宮ラボ」とかいう謎の研究所で助手のバイトをしている。
- コマの位置: 左上(中)
キャラの配置: なし
背景: ラボ内部(小洒落たオフィス風、中央に大きな机、奥に機械類が見える)
セリフ: (モノローグ)都内の外れにある雑居ビルの最上階をまるごと改装したらしく、見かけだけは小洒落たオフィスのようだ。
- コマの位置: 右下(中)
キャラの配置: 二宮(後ろ姿 or 横顔、机に向かいデータを見ている)、結愛(少し離れた位置)
背景: ラボ内部
セリフ: (モノローグ)でも、中で働いているのは私と“二宮”という若い男性の二人だけ。
- コマの位置: 左下(中)
キャラの配置: 二宮(少し顔が見える、メガネ、インテリ風だが少し変わった雰囲気)
背景: ラボ内部(PCモニターなど)
セリフ: |
(モノローグ)二宮はどうやらかなりの資産家らしい。いわゆる“ボンボン”だ。
大学卒業後、就職せずにこのラボを作り、研究に明け暮れている。
本人曰く「世界を震撼させる超スケールの研究」らしいのだけれど、実際のところ何をしているかはよく分からない。
出力全体
- ページ:
ページ番号: 1
コマ:
- コマの位置: 全体(大ゴマ)
キャラの配置: 星奈結愛(バストアップ、少し困り顔)
背景: 無地 or 軽くぼかし
セリフ: |
(モノローグ)私の名前は星奈 結愛(ほしな ゆあ)。
都内の某私立大学に通う、どこにでもいる普通の女子大生だ。
- コマの位置: 左下(横長)
キャラの配置: 結愛(全身、友達とカフェにいるなど)
背景: 大学のキャンパスやカフェなど
セリフ: (モノローグ)特に将来の夢があるわけでもないし、勉強に没頭するタイプでもない。友達と適度に遊んで、バイトもそこそこにこなし、学生生活をそこそこ楽しみながら生きている。 - ページ:
ページ番号: 2
コマ:
- コマの位置: 右上(横長)
キャラの配置: なし
背景: 雑居ビルの外観、最上階が少しモダン
セリフ: (モノローグ)そんな私だが、ひょんなことから「二宮ラボ」とかいう謎の研究所で助手のバイトをしている。
- コマの位置: 左上(中)
キャラの配置: なし
背景: ラボ内部(小洒落たオフィス風、中央に大きな机、奥に機械類が見える)
セリフ: (モノローグ)都内の外れにある雑居ビルの最上階をまるごと改装したらしく、見かけだけは小洒落たオフィスのようだ。
- コマの位置: 右下(中)
キャラの配置: 二宮(後ろ姿 or 横顔、机に向かいデータを見ている)、結愛(少し離れた位置)
背景: ラボ内部
セリフ: (モノローグ)でも、中で働いているのは私と“二宮”という若い男性の二人だけ。
- コマの位置: 左下(中)
キャラの配置: 二宮(少し顔が見える、メガネ、インテリ風だが少し変わった雰囲気)
背景: ラボ内部(PCモニターなど)
セリフ: |
(モノローグ)二宮はどうやらかなりの資産家らしい。いわゆる“ボンボン”だ。
大学卒業後、就職せずにこのラボを作り、研究に明け暮れている。
本人曰く「世界を震撼させる超スケールの研究」らしいのだけれど、実際のところ何をしているかはよく分からない。 - ページ:
ページ番号: 3
コマ:
- コマの位置: 右上(中)
キャラの配置: 結愛(湯沸かし器を操作、笑顔)
背景: ラボの給湯スペース
セリフ: お茶、いれますねー
効果音: カチッ(湯沸かし器のスイッチ)
- コマの位置: 左上(中)
キャラの配置: 二宮(机に向かったまま、少し顔を上げる)
背景: ラボ中央の机周り
セリフ: 星奈くん。今日は来客が来る予定になっている。
- コマの位置: 右中(小)
キャラの配置: 結愛(湯呑みを持って二宮に近づく)
背景: ラボ内部
セリフ: へえ、そうなんですか。どなたが来られるんですか?
- コマの位置: 下(大ゴマ)
キャラの配置: 二宮(顔アップ、メガネをくいっと上げる仕草)
背景: 少し暗く、PCモニターの光が当たる感じ
セリフ: イタコだ。
- コマの位置: 左下隅(小)
キャラの配置: 結愛(きょとんとした顔)
セリフ: ……イタコ? 痛い子? - ページ:
ページ番号: 4
コマ:
- コマの位置: 右上(小)
キャラの配置: 二宮(冷静な顔)
背景: ラボ内部
セリフ: 違う。霊媒師だ。
- コマの位置: 左上(小)
キャラの配置: 結愛(納得いかない顔)
セリフ: はぁ。
- コマの位置: 右中(横長)
キャラの配置: 二宮(少し遠目、薄暗い中でPCに向かう)
背景: カーテンの閉まったラボ、PC画面の光
セリフ: 魂とは何だろう?
- コマの位置: 左中(小)
キャラの配置: 結愛(曖昧な表情)
セリフ: はぁ。
- コマの位置: 右下(中)
キャラの配置: 二宮(説明するようなポーズ)
背景: ラボ内部
セリフ: 昔、アメリカの医師が“人間の魂の重さは 21 グラムだ”って研究発表をしたのは知っているか。(以下略)
- コマの位置: 左下(中)
キャラの配置: 結愛(指でグラムを計算するような仕草、少しアホっぽい顔)
セリフ: たった 21 グラムなんですか。豚肉だったら 40 円くらい……ですよね。 - ページ:
ページ番号: 5
コマ:
- コマの位置: 右上(小)
キャラの配置: 二宮(呆れ顔 or 無表情)
セリフ: ……ふむ。今度もっと良いお肉をあげよう。
- コマの位置: 左上(小)
キャラの配置: 結愛(目が輝く)
セリフ: (心の声)ラッキー。ボンボンがくれるお肉って、いくらぐらいするんだろう。
- コマの位置: 右中(小)
キャラの配置: 二宮(呆れ顔)
セリフ: ……本音と建前が逆になってるな。
- コマの位置: 左中(小)
キャラの配置: 結愛(プイッとそっぽ向く)
セリフ: やだ、セクハラ
- コマの位置: 右下(中)
キャラの配置: 二宮(ChatGPTについて話す)
セリフ: ChatGPT なら分かるな?(以下略、文字予測の話)
- コマの位置: 左下(中)
キャラの配置: 二宮(真面目な顔)
セリフ: では、“人が人たらしめる魂”とは何なのか。…だからイタコを呼んだ。
キャラの配置: 結愛(ポカンとした顔)
セリフ: ……はぁ。 - ページ:
ページ番号: 6
コマ:
- コマの位置: 右上(小)
背景: ラボのインターホン
効果音: プルルル。
- コマの位置: 左上(小)
背景: インターホンのモニター画面(古めかしい老婆が映っている)
キャラの配置: (モニター内の老婆)
- コマの位置: 右中(中)
キャラの配置: 二宮(モニターを見ている)
セリフ: お客さまをここに通してくれたまえ。
- コマの位置: 左中(中)
キャラの配置: イタコ(老婆、ラボに入ってくる、数珠を持っている)
背景: ラボの入口付近
セリフ: (モノローグ or 結愛の心の声)服装だけなら「それっぽい」感じはあるものの、どこかあやしげな空気も漂う。
- コマの位置: 下(横長)
キャラの配置: イタコ(椅子に座る)、二宮(立っている)、結愛(少し離れて見ている)
背景: ラボ内部
セリフ: (二宮)いきなりだが、“星奈くんの亡くなったおばあちゃんの霊”を降ろしてもらいたい。
セリフ: (結愛、心の声)え、聞いてないですよ! - ページ:
ページ番号: 7
コマ:
- コマの位置: 上(横長)
キャラの配置: イタコ(目を閉じ、ぶつぶつ唱え始める)
背景: ラボ内部、少しもやがかかるような演出
効果音: ぶつぶつ……
セリフ: (モノローグ)やたらと古臭い線香のような匂いが漂ってきた。
- コマの位置: 中(大ゴマ)
キャラの配置: イタコ(ブルブル震え、目を見開く、低い声)
背景: 集中線など、異様な雰囲気
効果音: ブルブル…
セリフ: おお……久しぶりじゃのう……。元気にしてるか……?
- コマの位置: 右下(小)
キャラの配置: 結愛(驚きで目を見開く)
- コマの位置: 左下(小)
キャラの配置: 二宮(冷静に結愛を促す)
セリフ: どうした、答えてあげなさい。
- コマの位置: 下段中央(中)
キャラの配置: 結愛(恐る恐る尋ねる)
セリフ: ……あのー、本当にばあちゃんの霊なんですか?
- コマの位置: 下段右(中)
キャラの配置: イタコ(老婆の声で)
セリフ: そうじゃ。もう忘れてしまったんか? - ページ:
ページ番号: 8
コマ:
- コマの位置: 上(大ゴマ)
キャラの配置: 結愛(呆れた顔でツッコむ)
背景: ラボ内部
セリフ: いや、うちのばあちゃん、昨日もカラオケに行ってたんですけど。めっちゃ生きてますけど。
- コマの位置: 左下(中)
キャラの配置: イタコ(明らかに動揺、口パクパク、二宮を見る)
- コマの位置: 右下(中)
キャラの配置: 二宮(冷静、片眉を上げるなど)
セリフ: ふむ……やはり偽物か。
- コマの位置: 最下段(横長)
キャラの配置: イタコ(小さくなって帰っていく後ろ姿)
背景: ラボの出口へ向かう廊下
セリフ: (イタコ)すみませんでした……
セリフ: (モノローグ)気まずい沈黙が場を包む。 - ページ:
ページ番号: 9
コマ:
- コマの位置: 右上(中)
キャラの配置: 結愛(呆れ顔で二宮に)
セリフ: で、所長。今日はこれで終わりですか? もう帰ってもいいですか?
- コマの位置: 左上(中)
キャラの配置: 二宮(ニヤリとする)
セリフ: いや、これからがメインディッシュだ。
- コマの位置: 右中(小)
キャラの配置: 結愛(期待する顔)
セリフ: 牛肉ですか?
- コマの位置: 左中(小)
キャラの配置: 二宮(呆れ顔)
セリフ: お肉の話はもういい……
- コマの位置: 下(大ゴマ、見開き風でも可)
キャラの配置: 二宮(装置の前に立つ)、結愛(少し離れて驚く)
背景: ラボの奥にある巨大な「脳情報完全記録化装置」。金属パネル、ケーブル、モニター類が複雑に配置されている。
セリフ: (二宮)星奈くん、これは私が作り上げた“脳情報完全記録化装置”だ。人間の脳内活動を余すところなくスキャンして、電子データとして保存できる。簡単に言えば“脳のコピー機”というわけだ。 - ページ:
ページ番号: 10
コマ:
- コマの位置: 右上(中)
キャラの配置: 結愛(眉をひそめる)
セリフ: ……脳の CT スキャンとは違うんですか?
- コマの位置: 左上(中)
キャラの配置: 二宮(得意げに鼻を鳴らす)
セリフ: 違う。CT はあくまで形状データだが、これは脳内のシナプスの動きや記憶のパターンまで再現できる。(以下略)
- コマの位置: 右中(中)
キャラの配置: 結愛(不安げな表情)
セリフ: ……で、それを使って何をするんですか?
- コマの位置: 左中(中)
キャラの配置: 二宮(装置を指し示す)
セリフ: 私をスキャンして、AI 化した“もう一人の私”と会話する。…そいつと対話して、魂があるかどうか検証する。
- コマの位置: 下(横長)
キャラの配置: 二宮(装置に入る、またはスイッチを押す)
背景: 装置が作動し始める。モニターに脳波のような波形、数字が流れる。
効果音: ウィィィン… ゴウン…
セリフ: (結愛、心の声)ほんとに大丈夫なのかなあ…… - ページ:
ページ番号: 11
コマ:
- コマの位置: 右上(小)
背景: モニター画面に「COMPLETE」の文字
効果音: (装置の音が止まる)
- コマの位置: 左上(小)
キャラの配置: 二宮(満足げな笑み)
セリフ: 終わったか……。
- コマの位置: 右中(中)
キャラの配置: 二宮(大型コンピュータを操作)
セリフ: クローン AI を起動する。…これで OK だ
効果音: カタカタ…(キーボード操作音) ピッ(Enterキー)
- コマの位置: 左中(横長)
背景: モニター画面。人型シルエット→徐々に二宮の姿になるアバター生成過程。
- コマの位置: 下(大ゴマ)
キャラの配置: モニターの中の二宮AI(リアル二宮と瓜二つ、喋り始める)
背景: モニター画面
セリフ: (二宮AI)……ここは……? お? おい、星奈くん、聞こえてるか?
キャラの配置: 結愛(モニターに身を乗り出して驚く)
セリフ: えっ、本当に喋ってる! しかも私の名前まで…… - ページ:
ページ番号: 12
コマ:
- コマの位置: 右上(中)
キャラの配置: モニターの二宮AI
セリフ: 私のことを忘れたのか?……ん? 私の体がない。……ああ、そうか。今、私は AI になったのか。
- コマの位置: 左上(中)
キャラの配置: リアル二宮(モニターに向かって)
セリフ: 私よ。“AI になった”気分はどうだ?
キャラの配置: モニターの二宮AI
セリフ: 思ったよりなんともないな。私は私だと思っているし、特に違和感はない。
- コマの位置: 右下(中)
キャラの配置: モニターの二宮AI(結愛の方を見る)
セリフ: 星奈くんもコピーしてみるか? せっかくだし、データを増やせば実験が捗るだろう。
- コマの位置: 左下(中)
キャラの配置: 結愛(全力で首を横に振る、嫌そうな顔)
セリフ: いやいや、私の脳をコピーして何になるんですか。遠慮します。絶対いやですって。 - ページ:
ページ番号: 13
コマ:
- コマの位置: 右上(中)
キャラの配置: リアル二宮(悪びれず)
セリフ: 実はさっきのニセイタコの婆さんを、こっそりスキャンしておいた。
- コマの位置: 左上(大ゴマ)
キャラの配置: 結愛(驚愕と非難の表情)
セリフ: はぁぁ!? 何やってるんですか!
効果音: ドン!(背景効果)
- コマの位置: 右中(小)
キャラの配置: 二宮(平然とコンピュータ操作)
セリフ: サンプル数は多いほうが良い。…さあ、起動するぞ。
- コマの位置: 左中(小)
キャラの配置: 結愛(スマホを見ながら呆れる)
セリフ: (心の声)うちの所長は倫理観ゼロかよ……
- コマの位置: 下(大ゴマ)
キャラの配置: なし
背景: モニター画面に歪んだ老婆のアバターが表示。ノイズが走り、不気味な雰囲気。
効果音: ザザ… ギギ…
セリフ: (二宮の声)ふむ……面白いことになってるぞ。ニセイタコ AI を起動したら挙動がおかしい。ほら、モニターを見てみろ。
セリフ: (結愛の声)うわ、こわ。何これ……ホラーですか? - ページ:
ページ番号: 14
コマ:
- コマの位置: 上(横長)
背景: モニター画面。アバターが崩壊していく様子。エラーコードが流れる。
効果音: ザザザ… ブツブツ…
セリフ: (アバターの断片的な声)うそ……私……どこ…… わしは……本物……
- コマの位置: 右中(小)
背景: モニター画面に「FATAL ERROR」の文字(赤色)。
- コマの位置: 左中(中)
キャラの配置: 結愛(青ざめた顔、怯えている)
セリフ: ……これって自我の崩壊、みたいなものなんですか? 怖いんですけど。
- コマの位置: 下(中)
キャラの配置: 二宮(冷静にモニターを見ている)
セリフ: 脳を記録化しても、こうしてまともに動かないケースがあるわけだ。(以下略) - ページ:
ページ番号: 15
コマ:
- コマの位置: 右上(小)
背景: インターホン
効果音: プルルル。
- コマの位置: 左上(小)
背景: モニター画面(外国人風女性と通訳が映る)
- コマの位置: 右中(中)
キャラの配置: 結愛、二宮
セリフ: (結愛)誰ですか?
セリフ: (二宮)今度は“本物”の霊能力者かもしれない。アメリカから招いたんだ。
セリフ: (結愛)……はぁ、所長、どれだけお金あるんですか。
- コマの位置: 左中(中)
キャラの配置: マデリン(黒いドレス、ゴシック風)、通訳、二人を迎える結愛
背景: ラボ入口
- コマの位置: 下(横長)
キャラの配置: マデリン(椅子に座り目を閉じる)、通訳(横に立つ)、二宮、結愛(見守る)
背景: ラボの一角
セリフ: (通訳、小声)彼女は今、“あちら側”との扉を開こうとしています
セリフ: (モノローグ)最初は胡散臭いと思っていた私だが、やがてマデリンの様子が変化し始め… - ページ:
ページ番号: 16
コマ:
- コマの位置: 上(大ゴマ)
キャラの配置: マデリン(苦しげな表情、低い声)
背景: ラボ内部、もやがかかるような、または霊的なエフェクト
セリフ: ……ここに……いる……。強い残留思念が……こびりついている……。
- コマの位置: 右中(中)
キャラの配置: マデリン(続ける)
セリフ: この思念は……自分が本物だと……言い張りながら……消えていく……。名残が……彷徨っている……。
- コマの位置: 左中(中)
キャラの配置: 結愛(ゾッとして周りを見回す)
セリフ: (マデリンの漏れる声)わしは……本物…… 体がない…… 助けて……
セリフ: (結愛、心の声)・・・これって、絶対に AI イタコさんじゃん!
- コマの位置: 下(大ゴマ)
キャラの配置: マデリン(苦しげに、ニセイタコAIを起動していた装置を指差す)
背景: 指差された装置が強調される
セリフ: この者の魂は……本物だと……思い込みながら……アイデンティティを失った……。しかし存在は消えず……この世界にしがみついている……。 - ページ:
ページ番号: 17
コマ:
- コマの位置: 右上(小)
キャラの配置: マデリン(倒れかける)、通訳(支える)
- コマの位置: 左上(小)
キャラの配置: マデリンと通訳(疲れた様子で退場していく後ろ姿)
- コマの位置: 右中(中)
キャラの配置: 二宮(装置を見つめる)
背景: 静まり返ったラボ
セリフ: イタコ AI はさっきシャットダウンさせたんだがな……。AI にも魂が宿るのか?
- コマの位置: 左中(中)
キャラの配置: モニターの二宮AI
セリフ: 幽霊というのは、一種のゾンビプロセスみたいなものかもしれないな。
- コマの位置: 右下(小)
キャラの配置: 結愛(??という顔)
セリフ: ゾンビプロセス……ですか?
- コマの位置: 左下(中)
キャラの配置: モニターの二宮AI(説明する)
セリフ: PC 上でプロセスを起動し、それが終了しても…(以下略、ゾンビプロセスとシミュレーション説) - ページ:
ページ番号: 18
コマ:
- コマの位置: 右上(中)
キャラの配置: リアル二宮(面白がっている顔)
セリフ: なるほど。仮想世界の住人だからこその説得力だな。(以下略)
- コマの位置: 左上(中)
キャラの配置: 結愛(混乱した顔、頭を抱える)
セリフ: ちょ、ちょっと所長。これ、どうするんですか? このまま放置して平気なんですか?
- コマの位置: 右中(中)
キャラの配置: 二宮(全く意に介さない様子)
セリフ: ここは私のラボだから、どんな霊が居つこうが構わんよ。むしろ観察させてもらいたい。(以下略、霊の質量について考察)
- コマの位置: 左中(小)
キャラの配置: 結愛(呆れ果てた顔)
セリフ: もう、何言ってるのか分かりません……
- コマの位置: 右下(中)
キャラの配置: 二宮(さらっと言う)
セリフ: そういえば、マデリンもこっそりスキャンしておいたのだが——
- コマの位置: 左下(大ゴマ)
キャラの配置: 結愛(絶叫)
セリフ: ダメですってば! やめてください! - ページ:
ページ番号: 19
コマ:
- コマの位置: 上(大ゴマ)
キャラの配置: 結愛(嫌な予感がして二宮を睨む)
セリフ: ……私のはスキャンしてないですよね?
- コマの位置: 中(中)
キャラの配置: 二宮(目をそらす、沈黙)
セリフ: ……
- コマの位置: 下(大ゴマ、ページいっぱいに近い)
キャラの配置: 結愛(顔面蒼白で絶叫)
セリフ: なんで何も答えないんですかー!
効果音: ゴゴゴゴ…(背景効果) - ページ:
ページ番号: 20
コマ:
- コマの位置: 全体(横長、引きの絵)
キャラの配置: ラボを出ていく結愛の後ろ姿。奥ではリアル二宮とモニターの二宮AIが何か議論している。
背景: 薄暗いラボ、装置類が光る。
セリフ: (結愛モノローグ)魂の存在はわからないが、ニセイタコ AIは崩壊し、その霊がマデリンに降霊したかもしれないという不可解な事実(?)だけが残った。(中略)そのカオスな状況を横目に、私は定時退社する。
セリフ: (結愛モノローグ、小さく)——結局、魂って何なんだろう。
漫画を描いてもらう
試行1
こんな感じで、先ほどのキャラデザの続きでどんどん依頼を投げていく。
結果はこちら。6ページ出力したところで諦めました。
- キャラデザと違う
- 女性はわりと一貫性はあるが、男性は毎ページ変わってる
- 日本語が読めない箇所が多い
- コマの左右を間違っていることがある
- セリフとコマの関係も間違っていることがある
日本語や左右の間違いはともかく、キャラクタが変わっていってるのは1つのコンテキストで続けてやってるせいかもしれません。
試行2
次に、1ページ1ページ、コンテキストをわけて指示を出してみます。
結果はこちら。
- キャラデザの一貫性はあがりました
- 日本語、左右の間違い、セリフ間違いなどはそのまま
- コンテキストがわかれてるのでページ間でズレが生じそうですが、もともとおかしいので変わらないと思う
セリフとキャラがあってないのはコマ割りの指示の改善で変わりそうな気がするので、日本語の崩れを中心に改善を検証してみます。
試行3
gpt-4o自身に出力結果を再確認してもらいます。
日本語として読めない文字も何やら読めてるようですが、自ら自省してくれました。
ちなみに私のカスタム指示は「オタクに優しいギャル風」になってるのでギャルが応対してくれます。
修正後はこちら。
若干良くなりましたが、まだ間違ってます。
試行4
PSD形式にして文字はテキストにできないかと試す。ギャルのGPTもできると言ってるし。
ギャルの提案により、まずセリフなし版画像を作って、そのあとにセリフあり版のPSDを作ります。
努力はしてくれたようですが、日本語フォントがなかったようなのと、フォントがあっても漫画にはならない感じです。
試行5
Gemini 2.0 Flash(Image Generation) Experimentalで日本語の修正ができないか試す。
が、全然ダメ。
試行6
一コマずつ見直してもらう・・・改善されたが惜しい。それでもダメ。
試行7
試行6の結果に対してi2iで吹き出し内を選択し、日本語の訂正を具体的に依頼してみる。
しかし結果は改悪されて試行6の前に戻ってしまった。
試行8
日本語がおかしい箇所は、見た感じ日本語が吹き出しに収まらない感じもするので「吹き出しのサイズを1.5倍にして」と追加の指示をだしてみます。
また、日本語の漫画の読み方も参考に与えてみます。
結果はこちら。流れは良くなりましたが女性のセリフが1個ずれた。
試行9
試行8の結果に対して、画像をBASE64にしたうえでSVGにし、セリフのテキスト化を依頼してみる。
結果は、元画像のセリフは一旦良いとして、追加されたテキストの位置がズレてる。
試行10
日本語だからダメなのかもしれないので、「セリフはすべて英語に翻訳して、英語の漫画にしてください」という指示を追加してみる。
結果は、話者とセリフの対応間違ってるところあるけど、日本語よりは断然良い。
Google翻訳でいけないかとも思ったが、原作者(私)としては許容できない文章になる。
試行11(追記)
世の中の人の投稿を見てるとバナーっぽいのとかできてるので、吹き出しを手作業でA, Bと書き換えて指示を出してみる。
結果、出力は改善された。吹き出しが大きければAもちゃんと描いてくれたかもしれない。
ということで2段階の画像生成を依頼しみる。
最初はセリフをA, B, C...だけにしてもらって、2回目で日本語を当てはめてもらう。
しかし、1段階目の出力をプロンプトを変えて試すもうまくはいかない。
試行12(追記)
レイアウトを手書きして、吹き出しに採番をつけて指示をだしてみる。
レイアウトはかなり忠実だが日本語がやっぱり失敗した。
諦める
原作があれば全自動で漫画作れないかと試しましたがぜまだ頑張らないと無理そうです。
いや、凄いんですけどね。
いかがでしたでしょうか
これで私もプロ驚き屋。