0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

# 【Gemini API】AI創作工房 - 絵が描けなくても漫画が作れるmacOSアプリ

Posted at

はじめに

「漫画を描きたいけど、絵が描けない...」

そんな悩みを持つ方に朗報です。AI創作工房は、Google Gemini APIを活用して、絵を描く技術がなくても自分のイメージを画像にできるmacOSネイティブアプリケーションです。

キャラクターデザインから4コマ漫画まで、一貫したワークフローで創作活動を支援します。

本アプリは、GoogleのGemini APIを使用しており、API利用料金が発生します。完全無料ではありませんのでご承知おきください。料金の詳細はGoogle AI料金ページをご確認ください。

![メイン画面のスクリーンショット]

こんな方におすすめ

  • イラストレーター・漫画家(下書き・アイデア出しに)
  • TRPGプレイヤー(キャラクターシート作成に)
  • 同人誌・Web小説作家(表紙・挿絵作成に)
  • 創作活動を始めたい初心者の方

主な機能

AI創作工房には、大きく分けて3つの機能群があります。

1. キャラクター制作ワークフロー

キャラクターを「顔」から段階的に作成し、一貫性のあるデザインを維持できます。

顔三面図 → 素体三面図 → 衣装着用 → ポーズ → シーン合成/漫画
ステップ 機能 説明
Step 1 顔三面図 キャラクターの顔デザインを確定(正面・斜め・横顔)
Step 2 素体三面図 体型を確定(Step1の顔を継承)
Step 3 衣装着用 プリセットから選択、または参考画像から着せ替え
Step 4 ポーズ プリセットポーズ、または参考画像からポーズ抽出

![キャラクターワークフロー図]

2. 漫画・シーン制作

機能 説明
シーンビルダー 背景 + 複数キャラクター(最大5人)を合成
4コマ漫画 起承転結の4コマ漫画を1枚で生成
漫画コンポーザー 高度な漫画制作(吹き出し17種類、インセット機能)
ストーリー作成 漫画用YAMLを簡単に作成(英訳機能付き)

3. その他の便利機能

機能 説明
背景生成 様々なシチュエーションの背景画像を生成
装飾テキスト 技名テロップ、決め台詞、メッセージウィンドウ
スタイル変換 ちびキャラ化、ドット絵化
背景透過 生成画像の背景を透過処理

インストール方法

必要なもの

項目 要件
OS macOS 14.0 (Sonoma) 以降
API Google AI API Key
ネットワーク インターネット接続必須

Google AI APIキーの取得

  1. Google AI Studio にアクセス
  2. Googleアカウントでログイン
  3. 「Get API Key」をクリックしてキーを取得

注意: Gemini APIは従量課金制です。無料枠を超えると料金が発生します。詳細はGoogle AI料金ページをご確認ください。

アプリのビルド

# リポジトリをクローン
git clone https://github.com/tokumeishatyo/nanobananaMacOS.git
cd nanobananaMacOS

# Xcodeでプロジェクトを開く
open nanobananaMacOS.xcodeproj

Xcodeで以下を設定してビルドします:

  1. Signing & Capabilities で自分のTeamを設定
  2. App Sandbox → Network → Outgoing Connections (Client) を有効化
  3. Cmd + R でビルド&実行

![Xcode設定画面]


チュートリアル:キャラクターを作ろう

実際にキャラクターを作成する手順を説明します。

Step 1: 顔三面図を作成

まずはキャラクターの顔を作成します。

  1. 左カラムの「出力タイプ」から 「顔三面図」 を選択
  2. 「詳細設定」ボタンをクリック
  3. キャラクター名と顔の特徴を入力
例:
名前: 桜木 花音(さくらぎ かのん)
特徴: ピンク色のロングヘア, 大きな青い瞳, 小さなほくろが左頬に
  1. 「適用」をクリックして設定を保存
  2. 「YAML生成」をクリック
  3. 中央カラムでAPIキーを入力し「画像生成」をクリック

![顔三面図の生成例]

ポイント: 顔の特徴はカンマ区切りで具体的に記述すると、AIが正確に認識しやすくなります。

Step 2: 素体三面図を作成

顔が決まったら、体型を作成します。

  1. 出力タイプを 「素体三面図」 に変更
  2. 詳細設定で「参照画像」にStep 1で保存した顔三面図を選択
  3. 体型を選択(スレンダー、標準、グラマーなど)
  4. YAML生成 → 画像生成

![素体三面図の生成例]

Step 3: 衣装を着せる

次に、キャラクターに衣装を着せます。2つのモードがあります。

プリセットモード(簡単)

  1. 出力タイプを 「衣装着用」 に変更
  2. 詳細設定で「プリセット」を選択
  3. カテゴリ(制服、カジュアル、ファンタジーなど)を選択
  4. 形状、色、柄、印象を設定
  5. 参照画像にStep 2の素体三面図を選択

参考画像モード(こだわり派)

好みの衣装の画像がある場合は、その画像を参考にして着せ替えできます。

  1. 「参考画像」モードを選択
  2. 衣装の参考画像を選択
  3. フィットモード(タイトフィット/ルーズフィット)を選択

![衣装着用の生成例]

Step 4: ポーズをつける

最後に、キャラクターにポーズをつけます。

  1. 出力タイプを 「ポーズ」 に変更
  2. 詳細設定でモードを選択:
    • プリセット: 用意されたポーズから選択
    • 手動入力: 自分でポーズを記述
    • ポーズキャプチャ: 参考画像からポーズだけを抽出

![ポーズの生成例]


チュートリアル:4コマ漫画を作ろう

キャラクターができたら、漫画を作ってみましょう。

準備:キャラクターを登録

  1. 左カラムの「キャラクタ管理」をクリック
  2. 「追加」ボタンで新しいキャラクターを登録
  3. 名前、顔の特徴、体の特徴を入力
  4. 顔参照画像として、作成した顔三面図を登録

![キャラクター管理画面]

4コマ漫画を生成

  1. 出力タイプを 「4コマ漫画」 に変更
  2. 詳細設定を開く
  3. 登場キャラクターを設定(最大2人)
  4. 各コマのシーンとセリフを入力
1コマ目(起): 教室で花音が窓の外を見ている
  セリフ: 「今日も暑いなぁ...」

2コマ目(承): 友人の美咲が話しかける
  セリフ: 「花音、放課後プール行かない?」

3コマ目(転): 花音が驚いた表情
  セリフ: 「え!?私水着持ってないよ!」

4コマ目(結): 美咲がウィンクしながら水着を見せる
  セリフ: 「大丈夫、予備があるから!」
  1. YAML生成 → 画像生成

![4コマ漫画の生成例]


漫画コンポーザー:高度な漫画制作

より高度な漫画を作りたい場合は、漫画コンポーザーを使います。

漫画コンポーザーの特徴

  • 1コマ/4コマ両対応
  • 17種類の吹き出しスタイル
  • インセット機能(夢、回想、画面内表示)
  • ストーリーYAML生成(英訳機能付き)

吹き出しスタイル一覧

スタイル 用途
normal 通常の会話
shout 叫び・大声
whisper ささやき・小声
think 心の声・思考
narration ナレーション
angry 怒り
surprised 驚き
wavy 動揺・震え
burst 爆発・衝撃
cloud 夢・想像
heart 恋愛・ドキドキ
ice 冷たさ・凍結
electric 電撃・ショック

![吹き出しスタイルの例]

ストーリー作成機能(Version 5.1新機能)

漫画のストーリーをフォームで入力し、YAMLを自動生成できます。

  1. 「ストーリー作成」ボタンをクリック
  2. 1コマ/4コマモードを選択
  3. キャラクターを選択
  4. 各コマのシーン・セリフを入力
  5. 「英訳する」にチェックを入れると、Gemini APIで自動翻訳

![ストーリー作成画面]

ヒント: 英訳機能を使うと、AIがより正確に内容を理解して高品質な画像を生成します。


YAMLプロンプトの仕組み

AI創作工房では、YAML形式の構造化プロンプトを使用しています。

なぜYAMLなのか?

通常のテキストプロンプトでは、複雑な指示を正確に伝えることが困難です。YAMLを使うことで:

  • 構造化された情報をAIに伝えられる
  • 制約条件を明確に指定できる
  • 再利用・編集が容易

顔三面図のYAML例

実際に生成されるYAMLの一部を見てみましょう。

# ====================================================
# Header
# ====================================================
type: character_design
title: "桜木 花音"
author: "作者名"

# ====================================================
# Input
# ====================================================
input:
  name: "桜木 花音"
  description: "ピンク色のロングヘア, 大きな青い瞳, 小さなほくろが左頬に"

# ====================================================
# Output
# ====================================================
output:
  format: "reference sheet with multiple views"
  views: "front view, 3/4 view, side profile"
  background: "pure white, clean, seamless, no borders"

# ====================================================
# Constraints (CRITICAL)
# ====================================================
constraints:
  layout:
    - "Triangular arrangement: front view top-left, 3/4 left view top-right, left profile bottom-center"
    - "All angled views must face LEFT direction"
  face_specific:
    - "HEAD/FACE ONLY - show from top of head to neck/collarbone"
    - "Neutral expression, emotionless"

constraintsセクションの重要性

constraints(制約) セクションは、AIに「やってはいけないこと」「必ず守ること」を伝える重要な部分です。

anti_hallucination:
  - "Profile view MUST NOT show both eyes"
  - "Do NOT mix features from different characters"
  - "Do NOT distort facial proportions"

output_cleanliness:
  - "Do NOT add any text, titles, labels, or annotations"
  - "Do NOT add borders or frames around views"
  - "Do NOT add color palettes or color swatches"

これらの制約により、AIが勝手に余計な要素を追加することを防ぎます。


出力モードの使い分け

AI創作工房には4つの出力モードがあります。

モード 説明 用途
YAML出力 YAMLをクリップボードにコピー ブラウザ版Geminiで使用
通常モード アプリ内で直接画像生成 標準的な画像生成
清書モード 参考画像+YAMLで高品質再描画 成功した画像の高解像度化
シンプルモード テキストプロンプトのみで生成 手軽な画像生成

おすすめの使い方

  1. まずはYAML出力モードで試作

    • APIを消費せずにプロンプトを確認できる
    • ブラウザ版Geminiで無料で試せる
  2. うまくいったら通常モードで本番生成

    • アプリ内で高解像度の画像を生成
  3. 気に入った画像は清書モードで仕上げ

    • 既存の画像を参照しながら、より高品質に再生成

スタイル変換:ちびキャラ&ドット絵

作成したキャラクターを別のスタイルに変換できます。

ちびキャラ化

キャラクターを2〜3頭身のデフォルメキャラに変換します。

![ちびキャラ化の例]

ドット絵化

レトロゲーム風のピクセルアートに変換します。

![ドット絵化の例]


Tips:より良い結果を得るために

1. 特徴は具体的に記述する

❌ 悪い例: かわいい女の子
⭕ 良い例: ピンク色のツインテール, 大きな緑色の瞳, 小柄な体型, 丸い顔

2. カンマ区切りで箇条書きにする

AIは箇条書きの特徴を正確に認識します。改行よりもカンマ区切りが効果的です。

3. 参照画像を活用する

キャラクターの一貫性を保つために、前のステップで生成した画像を参照画像として使用しましょう。

4. 英訳機能を活用する

日本語よりも英語のほうがAIの認識精度が高い場合があります。ストーリー作成の英訳機能を積極的に使いましょう。

5. 失敗しても諦めない

AI画像生成は確率的なものです。同じプロンプトでも結果が異なることがあります。気に入る結果が出るまで何度か試してみてください。


制限事項

キャラクターの一貫性について

AI画像生成の特性上、完全に同一のキャラクターデザインが出力されることを保証するものではありません。三面図ワークフローにより一貫性の向上を図っていますが、若干の差異が生じる場合があります。

コンテンツフィルターについて

Gemini APIのSafety Filterにより、一部のコンテンツは生成が拒否される場合があります。

APIキーの取り扱い

  • APIキーはアプリのメモリ上のみに保持されます
  • アプリ終了時に自動で消去されます
  • ローカルに保存されることはありません

まとめ

AI創作工房は、絵を描く技術がなくても漫画を作れるmacOSアプリです。

特徴

  • 段階的なキャラクター作成で一貫性を維持
  • YAML構造化プロンプトで高品質な画像生成
  • 漫画コンポーザーで本格的な漫画制作
  • 英訳機能でAIの認識精度を向上

ぜひダウンロードして、あなただけのキャラクターと漫画を作ってみてください!


リンク


更新履歴

バージョン 主な機能
1.0 基本機能
2.0〜2.3 render_mode, position auto, chibi_reference
3.0〜3.4 品質プリセット, インセット, bubble_style 17種類
3.5 ストーリーインポート修正, 手動衣装登録
4.0 1コマモード対応
5.0 ストーリーYAMLジェネレーター
5.1 英訳機能(gemini-2.5-flash)
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?