はじめに
こんにちは。以前、nanobanana proで4コマ漫画を量産!YAMLプロンプト作成ツールという記事を書きましたが、今回はそのAPI強化版を作成しました。
Gemini 2からGemini 3への進化は想像以上に劇的でした。この記事では、その進化を実際の生成結果で比較しながら、新ツールの機能を紹介します。
本ツールはGoogle AI APIを使用します。API利用には料金が発生する場合があります。
Gemini 2 vs Gemini 3:衝撃の比較
まずは同じYAMLプロンプトで生成した結果を見てください。
Gemini 2(gemini-2.0-flash-exp-image-generation)
問題点:
- コマ割りが崩壊している
- セリフが文字化け・欠落
- キャラクターの描画が不安定
- 全体的に品質が低い
Gemini 3(ブラウザ版)
改善点:
- コマ割りが正確
- セリフが正しく表示される
- キャラクターの顔が一貫している
- 高品質な描画
Gemini 3(API版 gemini-3-pro-image-preview)
さらなる進化:
- ブラウザ版と同等以上の品質
- APIから直接生成可能
- プログラムからの自動生成に対応
Gemini 2からGemini 3への進化は、まさに「別物」と言えるレベルです。
作ったもの
前作のYAMLプロンプト作成ツールをベースに、Google GenAI APIを直接叩いて4コマ漫画を生成できる機能を追加しました。
GitHub: https://github.com/tokumeishatyo/Manga-generator-api
2つの出力モード
| モード | 説明 | 対象ユーザー |
|---|---|---|
| YAML出力 | 従来通りYAMLを生成してブラウザに貼り付け | Google AI Pro/Ultraユーザー |
| 画像出力(API) | APIで直接画像を生成 | API Keyを持つユーザー |
API出力の2つのサブモード
- 漫画生成モード:YAMLプロンプト + キャラ参照画像 → 4コマ漫画
- 参考漫画清書モード:既存漫画を高品質で再描画
こんな人におすすめ
- Geminiで4コマ漫画を量産したい人
- APIを使って自動化したい人
- ブラウザにいちいち貼り付けるのが面倒な人
- キャラクターの顔を一貫させたい人
- 高品質な出力を得たい人
主な機能
基本機能(前作から継承)
- タイトル・作者名入力
- 1〜2人のキャラクター設定
- 4コマ分のプロンプト・セリフ入力
- セリフ位置(左/右)、同時セリフ対応
- カラーモード(フルカラー/モノクロ)
- YAML読み込み・履歴機能
新機能(API対応版)
- API Key入力(マスク表示で安全)
- 漫画生成モード:プロンプトから直接画像生成
- 参考漫画清書モード:既存漫画の高品質化
- 解像度選択:1K / 2K / 4K
- 漫画プレビュー表示:生成結果を即座に確認
- 画像保存機能:PNG形式で保存
服装ビルダー(男女対応)
前作は女性向けの衣装が中心でしたが、今回は男性向けオプションを大幅追加しました。
| カテゴリ | 主な形状オプション |
|---|---|
| スーツ | パンツスタイル、スリーピース、ダブルスーツ、タキシード |
| 水着 | ビキニ各種、ワンピース、サーフパンツ、競泳パンツ |
| カジュアル | Tシャツ+デニム、パーカー、シャツ+チノパン、レザージャケット |
| 制服 | セーラー服、ブレザー、学ラン、詰襟、警察官、軍服 |
| ドレス/フォーマル | イブニングドレス、タキシード、モーニング、燕尾服 |
| スポーツ | テニスウェア、サッカー/野球/バスケユニフォーム、柔道着 |
| 和服 | 着物、浴衣、振袖、袴、紋付袴、甚平 |
| 作業着/職業服 | 白衣、作業着、シェフコート、消防服 |
太字が新規追加項目です。
スクリーンショット
3列レイアウトで、左から:
- 出力モード・キャラクター設定
- 4コマのプロンプト・セリフ入力
- YAMLプレビュー・漫画プレビュー
技術スタック
| 項目 | 内容 |
|---|---|
| 言語 | Python 3.10+ |
| GUI | CustomTkinter |
| API | google-genai(gemini-3-pro-image-preview) |
| 画像処理 | Pillow |
| YAML処理 | PyYAML |
| 実行環境 | venv仮想環境 |
なぜ gemini-3-pro-image-preview なのか
当初は gemini-2.0-flash-exp-image-generation を使用していましたが、品質が著しく低かったため変更しました。
gemini-3-pro-image-preview はブラウザ版Geminiと同等の品質で、4コマ漫画の生成に最適です。
インストールと起動
必要要件
- Python 3.10以上
- Google AI API Key(画像出力モード使用時)
起動方法
macOS / Linux:
git clone https://github.com/tokumeishatyo/Manga-generator-api.git
cd Manga-generator-api
chmod +x run_app.command
./run_app.command
Windows:
git clone https://github.com/tokumeishatyo/Manga-generator-api.git
cd Manga-generator-api
run_app_windows.bat
起動スクリプトが自動で仮想環境を作成し、依存ライブラリをインストールします。
使い方
漫画生成モード
- 「画像出力(API使用)」→「漫画生成」を選択
- API Keyを入力
- キャラクター情報・プロンプト・セリフを入力
- 「Generate (漫画生成)」をクリック
- プレビューで確認、「画像を保存」で保存
参考漫画清書モード
- 「画像出力(API使用)」→「参考漫画清書」を選択
- API Keyを入力
- 参考漫画画像のパスを入力(必須)
- キャラクター参照画像のパスを入力(推奨)
- プロンプト・セリフを入力(必須 - セリフの正確な再現のため)
- 「Generate (清書)」をクリック
清書モードでもプロンプト・セリフの入力が必要です。画像だけではセリフを正確に再現できないためです。
工夫したポイント
1. シンプルなプロンプト
当初は「縦1列に4コマを配置」「コマとコマの間に黒枠線を入れる」など詳細な指示を入れていましたが、Geminiが混乱する原因になりました。
最終的に「以下のyamlの内容を忠実に再現してください」というシンプルな指示に落ち着きました。
2. 清書モードでのYAML必須化
画像だけを送って「この漫画を高品質化して」と指示しても、セリフが文字化けしたり、違う内容になったりしました。
解決策として、清書モードでも:
- YAML(セリフ・タイトル情報)
- 参考漫画画像(構図・ポーズ参考)
- キャラクター参照画像(顔の再現)
の3点セットで送信するようにしました。
3. 正しいモデル選択
gemini-2.0-flash-exp-image-generation は実験的モデルで、品質が低かったです。gemini-3-pro-image-preview に変更したことで、ブラウザ版と同等の品質を実現しました。
今後の展望
- キャラクタープリセット保存機能
- テンプレート選択機能
- バッチ生成機能
- 生成履歴管理
おわりに
Gemini 2からGemini 3への進化は、4コマ漫画生成において革命的でした。
- コマ割りの正確さ
- セリフの再現性
- キャラクターの一貫性
- 全体的な画質
すべてが大幅に向上しています。
そして今回、APIから直接高品質な4コマ漫画を生成できるようになりました。ブラウザにいちいち貼り付ける手間がなくなり、自動化の可能性も広がります。
ぜひ試してみてください!
GitHub: https://github.com/tokumeishatyo/Manga-generator-api



