# Gemini 3で4コマ漫画が劇的進化！API対応版nanobanana用プロンプト作成ツール

Posted at 2025-12-08

はじめに

こんにちは。以前、nanobanana proで4コマ漫画を量産！YAMLプロンプト作成ツールという記事を書きましたが、今回はそのAPI強化版を作成しました。

Gemini 2からGemini 3への進化は想像以上に劇的でした。この記事では、その進化を実際の生成結果で比較しながら、新ツールの機能を紹介します。

本ツールはGoogle AI APIを使用します。API利用には料金が発生する場合があります。

Gemini 2 vs Gemini 3：衝撃の比較

まずは同じYAMLプロンプトで生成した結果を見てください。

Gemini 2（gemini-2.0-flash-exp-image-generation）

問題点：

コマ割りが崩壊している
セリフが文字化け・欠落
キャラクターの描画が不安定
全体的に品質が低い

Gemini 3（ブラウザ版）

改善点：

コマ割りが正確
セリフが正しく表示される
キャラクターの顔が一貫している
高品質な描画

Gemini 3（API版 gemini-3-pro-image-preview）

さらなる進化：

ブラウザ版と同等以上の品質
APIから直接生成可能
プログラムからの自動生成に対応

Gemini 2からGemini 3への進化は、まさに「別物」と言えるレベルです。

作ったもの

前作のYAMLプロンプト作成ツールをベースに、Google GenAI APIを直接叩いて4コマ漫画を生成できる機能を追加しました。

GitHub： https://github.com/tokumeishatyo/Manga-generator-api

2つの出力モード

モード	説明	対象ユーザー
YAML出力	従来通りYAMLを生成してブラウザに貼り付け	Google AI Pro/Ultraユーザー
画像出力(API)	APIで直接画像を生成	API Keyを持つユーザー

API出力の2つのサブモード

漫画生成モード：YAMLプロンプト + キャラ参照画像 → 4コマ漫画
参考漫画清書モード：既存漫画を高品質で再描画

こんな人におすすめ

Geminiで4コマ漫画を量産したい人
APIを使って自動化したい人
ブラウザにいちいち貼り付けるのが面倒な人
キャラクターの顔を一貫させたい人
高品質な出力を得たい人

主な機能

基本機能（前作から継承）

タイトル・作者名入力
1〜2人のキャラクター設定
4コマ分のプロンプト・セリフ入力
セリフ位置（左/右）、同時セリフ対応
カラーモード（フルカラー/モノクロ）
YAML読み込み・履歴機能

新機能（API対応版）

API Key入力（マスク表示で安全）
漫画生成モード：プロンプトから直接画像生成
参考漫画清書モード：既存漫画の高品質化
解像度選択：1K / 2K / 4K
漫画プレビュー表示：生成結果を即座に確認
画像保存機能：PNG形式で保存

服装ビルダー（男女対応）

前作は女性向けの衣装が中心でしたが、今回は男性向けオプションを大幅追加しました。

カテゴリ	主な形状オプション
スーツ	パンツスタイル、スリーピース、ダブルスーツ、タキシード
水着	ビキニ各種、ワンピース、サーフパンツ、競泳パンツ
カジュアル	Tシャツ+デニム、パーカー、シャツ+チノパン、レザージャケット
制服	セーラー服、ブレザー、学ラン、詰襟、警察官、軍服
ドレス/フォーマル	イブニングドレス、タキシード、モーニング、燕尾服
スポーツ	テニスウェア、サッカー/野球/バスケユニフォーム、柔道着
和服	着物、浴衣、振袖、袴、紋付袴、甚平
作業着/職業服	白衣、作業着、シェフコート、消防服

太字が新規追加項目です。

スクリーンショット

3列レイアウトで、左から：

出力モード・キャラクター設定
4コマのプロンプト・セリフ入力
YAMLプレビュー・漫画プレビュー

技術スタック

項目	内容
言語	Python 3.10+
GUI	CustomTkinter
API	google-genai（gemini-3-pro-image-preview）
画像処理	Pillow
YAML処理	PyYAML
実行環境	venv仮想環境

なぜ gemini-3-pro-image-preview なのか

当初は gemini-2.0-flash-exp-image-generation を使用していましたが、品質が著しく低かったため変更しました。

gemini-3-pro-image-preview はブラウザ版Geminiと同等の品質で、4コマ漫画の生成に最適です。

インストールと起動

必要要件

Python 3.10以上
Google AI API Key（画像出力モード使用時）

起動方法

macOS / Linux：

git clone https://github.com/tokumeishatyo/Manga-generator-api.git
cd Manga-generator-api
chmod +x run_app.command
./run_app.command

Windows：

git clone https://github.com/tokumeishatyo/Manga-generator-api.git
cd Manga-generator-api
run_app_windows.bat

起動スクリプトが自動で仮想環境を作成し、依存ライブラリをインストールします。

使い方

漫画生成モード

「画像出力(API使用)」→「漫画生成」を選択
API Keyを入力
キャラクター情報・プロンプト・セリフを入力
「Generate (漫画生成)」をクリック
プレビューで確認、「画像を保存」で保存

参考漫画清書モード

「画像出力(API使用)」→「参考漫画清書」を選択
API Keyを入力
参考漫画画像のパスを入力（必須）
キャラクター参照画像のパスを入力（推奨）
プロンプト・セリフを入力（必須 - セリフの正確な再現のため）
「Generate (清書)」をクリック

清書モードでもプロンプト・セリフの入力が必要です。画像だけではセリフを正確に再現できないためです。

工夫したポイント

1. シンプルなプロンプト

当初は「縦1列に4コマを配置」「コマとコマの間に黒枠線を入れる」など詳細な指示を入れていましたが、Geminiが混乱する原因になりました。

最終的に「以下のyamlの内容を忠実に再現してください」というシンプルな指示に落ち着きました。

2. 清書モードでのYAML必須化

画像だけを送って「この漫画を高品質化して」と指示しても、セリフが文字化けしたり、違う内容になったりしました。

解決策として、清書モードでも：

YAML（セリフ・タイトル情報）
参考漫画画像（構図・ポーズ参考）
キャラクター参照画像（顔の再現）

の3点セットで送信するようにしました。

3. 正しいモデル選択

gemini-2.0-flash-exp-image-generation は実験的モデルで、品質が低かったです。gemini-3-pro-image-preview に変更したことで、ブラウザ版と同等の品質を実現しました。

今後の展望

キャラクタープリセット保存機能
テンプレート選択機能
バッチ生成機能
生成履歴管理

おわりに

Gemini 2からGemini 3への進化は、4コマ漫画生成において革命的でした。

コマ割りの正確さ
セリフの再現性
キャラクターの一貫性
全体的な画質

すべてが大幅に向上しています。

そして今回、APIから直接高品質な4コマ漫画を生成できるようになりました。ブラウザにいちいち貼り付ける手間がなくなり、自動化の可能性も広がります。

ぜひ試してみてください！