画像比較アプリを作りました!
https://ai.studio/apps/drive/1fwLW13pbPtI66iLsFQYnJaPF0STP9BsT
Imagenは光とか肌のテクスチャがAIぽいです。
Gemini AutoEncoder 画像→テキスト→画像
https://ai.studio/apps/drive/1PLLorqZmER-xTFcyvwBh1ERG8PN4ORot
Nano Bananaは写真をそのまま再現できるほど世界理解があります。
他にもいろんなシチュエーションで無料生成できます
http://pico-banana.app
TL;DR
- Imagen 4=Googleの最新テキスト→画像専用モデル。文字組版・フォトリアル・解像感が大幅強化。$0.04/枚(Ultraは$0.06)で、Gemini API / Google AI Studio / Vertex AIから利用可(有料プレビュー)。編集機能はプレビュー中は限定的。全出力にSynthID透かし。 (Google Developers Blog, Google Cloud)
- Gemini 2.5 Flash Image(通称 Nano Banana)=生成+編集+マルチ画像合成までできる“会話型”画像モデル。低レイテンシで背景ぼかし・人物削除・ポーズ変更・色付けなどの自然言語編集が得意。価格は出力トークン課金=約$0.039/枚(1024px)。SynthID透かし付き。 (Google Developers Blog, Google AI for Developers)
位置づけの違い
- Imagen 4:Google DeepMindのフラッグシップテキスト→画像モデル。文字の描画(スペル・タイポグラフィ)とシャープさ、ほぼリアルタイムの生成を前面に。2K解像度対応が発表。利用チャネルはGemini API / AI Studio / Vertex AI(プレビュー)。 (Google DeepMind, Google Developers Blog)
- Gemini 2.5 Flash Image(Nano Banana):Geminiファミリーの画像生成・編集特化。会話で細かい編集指示や複数画像の融合、キャラクター一貫性など制作フロー寄りの機能を提供。低レイテンシで試行錯誤に向く。 (Google Developers Blog)
「Nano Banana」という呼称は公式ドキュメントでも別名として明記されています。 (Google AI for Developers)
主な機能比較
観点 | Imagen 4 | Gemini 2.5 Flash Image (Nano Banana) |
---|---|---|
主用途 | 高品質テキスト→画像 | 生成+編集+マルチ画像合成 |
テキスト描画 | 大幅改善(看板・ポスター等に強い) | 高忠実度のテキストレンダリング対応 |
画像編集 | プレビュー段階では限定的(編集未対応の報告あり) | 自然言語での部分編集(背景ぼかし/人物削除/色調整/ポーズ変更等)、マルチ画像融合 |
速度 | 近リアルタイムを謳う | 低レイテンシ |
解像度 | 最大2K(Imagen 4 / 4 Ultra) | 生成・編集とも実用解像度(API仕様に準拠) |
価格(目安) | $0.04/枚(Imagen 4)、$0.06/枚(Ultra) | 約$0.039/枚(出力トークン $30/100万、1024px≒1290トークン) |
透かし | SynthID | SynthID |
提供 | Gemini API / Google AI Studio / Vertex AI(プレビュー) | Gemini API / Google AI Studio(プレビュー)/ Vertex AI |
出典:機能・価格・提供形態の各項は公式ブログ/ドキュメントに基づく。編集の可否に関しては開発者フォーラムの最新スレッドも参照。 (Google Developers Blog, Google Cloud, Google AI for Developers, Google Developer forums)
価格と課金の考え方
- Imagen 4:公式に**$0.04/枚**(Ultraは**$0.06/枚**)と明示。テキスト→画像に特化して単価が把握しやすい。 (Google Developers Blog)
- Gemini 2.5 Flash Image:出力トークン課金($30/100万tokens)で、1024×1024は約1290 tokens≒$0.039/枚。編集でも会話の出力分が課金対象になる点を考慮。 (Google AI for Developers, Google Developers Blog)
どちらを選ぶべき?
- 広告クリエイティブ、パッケージ、ロゴ入りビジュアル、看板モックなど:文字の読みやすさ/配置を最重視するならImagen 4。価格も明快。 (Google Developers Blog)
- 人物写真の自然な“修正”や商品写真の差し替え、キャンペーン用の大量バリエーション生成→微修正を会話で回すワークフロー:Gemini 2.5 Flash Image(Nano Banana)。自然言語編集とマルチ画像融合が強力。 (Google Developers Blog)
既知の注意点
- Imagen 4の編集:プレビュー段階では未対応との開発者フォーラム報告あり(将来的に変わる可能性)。編集前提なら現時点ではGemini側を。 (Google Developer forums)
- SynthID透かし:両モデルとも不可視透かしが付与される方針。社内レビュー/配信プラットフォームのポリシーに合わせて運用を。 (Google Cloud, Google Developers Blog)
- モデルの“知識”:Gemini 2.5 Flash(プレビュー)の知識カットオフは2025年1月。最新実物比較や固有名詞の正確性が重要な合成では追加の検証を。 (ストレージ)
最小コードサンプル
1) Imagen 4(テキスト→画像)
from google import genai
from io import BytesIO
from PIL import Image
client = genai.Client()
resp = client.models.generate_content(
model="imagen-4.0-generate-001",
contents=["A retro-futuristic neon city at dusk, ultra sharp typography 'QiiTA' on a billboard"]
)
for part in resp.candidates[0].content.parts:
if part.inline_data:
img = Image.open(BytesIO(part.inline_data.data))
img.save("imagen4.png")
モデルIDと利用手順は公式を参照。 (Google AI for Developers, Google Cloud)
2) Gemini 2.5 Flash Image(画像編集)
from google import genai
from io import BytesIO
from PIL import Image
client = genai.Client()
prompt = "Blur the background, remove the person on the left, and warm up the color tone."
base = Image.open("input.jpg")
resp = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[prompt, base]
)
for part in resp.candidates[0].content.parts:
if part.inline_data:
Image.open(BytesIO(part.inline_data.data)).save("edited.jpg")
自然言語での部分編集やマルチ画像融合が可能。 (Google Developers Blog)
まとめ
- 最高品質のテキスト→画像を“単価明確”に大量生成したい:Imagen 4。
- 会話での細かい編集・合成・反復制作まで含めてワンストップにしたい:Gemini 2.5 Flash Image(Nano Banana)。
- どちらも商用配備向けにAPI/Studio/Vertexで提供、SynthID透かし付き。ユースケースと運用フローで使い分けましょう。 (Google Developers Blog, Google Cloud)
参考リンク(一次情報中心)
- Imagen 4 概要(DeepMind / 公式)/価格と提供(Google Developers Blog) (Google DeepMind, Google Developers Blog)
- Imagen 4 機能・上限(Vertex AI Docs) (Google Cloud)
- Gemini 2.5 Flash Image 概要・編集・マルチ画像融合/価格(Google Developers Blog / Gemini API Docs) (Google Developers Blog, Google AI for Developers)
- Gemini 2.5 Flash Preview モデルカード(知識カットオフ等) (ストレージ)
- (参考)Imagen 4の編集未対応の報告(フォーラム) (Google Developer forums)
※本記事の内容は2025-09-03(JST)時点の公式情報に基づきます。プレビューの仕様・価格は今後変更される可能性があります。