ブラウザ版の限界とAPI使用の可能性
注意: 本記事はGoogle AI ProやUltra、またはGoogleのAPIを課金して使うことを前提としています。無料でどのように使うかということは全く考えておりません。
【Gemini API】AI創作工房 - シンプルモード&画像加工で進化した高品質イラスト生成ツールで、アプリそのものについて書きました。以前から徹底してプログラミングはAI(Claude Code)、Qiita記事はAIと人間のハイブリッドを貫いています。今回は人間が書いた記事です。
キャラクタの同一性の保持
NanoBananaで画像生成を繰り返していると、だんだんキャラクタが変形してしまうというのが悩みのタネでした。キャラクタの同一性を保持するには、参考画像を添付し続ける必要があります。それを簡易にしたかった。
まず、このような素体を用意します。まず顔をつくります。顔だけはプロンプトで作らなければなりません。しかし、一度作ってしまえば、後はずっとこれを保持することができます。体格も保持したい場合は、下の素体の絵も作っておけばいいです。ここまではGeminiのブラウザ版でも生成できますが、本アプリではもっと手軽に作れます。
衣装を着せる
次に衣装ですが、プロンプトで指示をしてもいいのですが、このプログラムの特徴として衣装のキャプチャができることです。

上記キャラクタにこのような衣装を着せます。その衣装を




と同じ衣装で色違いなどということもできますし、

こういう写真を取り込んで

このようなこともできます。
注意: 当然ながら他社/他者の著作物の利用には十分注意してください。ここで紹介するのは引用の範囲と考えますが、商用利用などは十分に注意してください。
ポーズを付ける
プロンプトでポーズをつけさせてもいいですが、ある程度のポーズが最初からついていると、試行錯誤が減ります。





衣装のキャプチャができるなら当然ポーズのキャプチャもできます。

こんな写真をとりこんで、

こんなこともできます。ここで大事なのは**ポーズだけを取り込むことです。ちなみに

ちびキャラ化も簡単です。もちろん、著作物の利用には十分注意してください。
画像の合成~ブラウザ版での下書き
上で作ったバンドでライブの風景を作ります。まず、ブラウザのGeminiで元絵を作ります。

ここから様々なプロンプトを駆使して絵を変えていきます。まず、ブラウザで次のように変えます。



APIを使わなくてもかなり高品質なものができます。特に最後の肩を組むシーンはAIはとても苦手でした。腕や足が増えたり足りなくなったりしたものですが、今はちゃんと描画できます。
APIを使って清書
アップロードするファイルの制限が超えたので、後日追記します。

