14
10

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Imagen 4とGemini 2.5 Flash Image (Nano Banana)の違い【Imagen 4 vs Nano Banana】

Last updated at Posted at 2025-09-02

画像比較アプリを作りました!
https://ai.studio/apps/drive/1fwLW13pbPtI66iLsFQYnJaPF0STP9BsT

GoogleAIStudio-GoogleChrome2025-09-0308-17-32-ezgif.com-video-to-gif-converter.gif

Imagenは光とか肌のテクスチャがAIぽいです。

Gemini AutoEncoder 画像→テキスト→画像
https://ai.studio/apps/drive/1PLLorqZmER-xTFcyvwBh1ERG8PN4ORot

2025-09-0309-12-03-ezgif.com-video-to-gif-converter.gif

Nano Bananaは写真をそのまま再現できるほど世界理解があります。

他にもいろんなシチュエーションで無料生成できます
http://pico-banana.app

TL;DR

  • Imagen 4=Googleの最新テキスト→画像専用モデル。文字組版・フォトリアル・解像感が大幅強化。$0.04/枚(Ultraは$0.06)で、Gemini API / Google AI Studio / Vertex AIから利用可(有料プレビュー)。編集機能はプレビュー中は限定的。全出力にSynthID透かし。 (Google Developers Blog, Google Cloud)
  • Gemini 2.5 Flash Image(通称 Nano Banana)=生成+編集+マルチ画像合成までできる“会話型”画像モデル。低レイテンシで背景ぼかし・人物削除・ポーズ変更・色付けなどの自然言語編集が得意。価格は出力トークン課金=約$0.039/枚(1024px)。SynthID透かし付き。 (Google Developers Blog, Google AI for Developers)

位置づけの違い

  • Imagen 4:Google DeepMindのフラッグシップテキスト→画像モデル。文字の描画(スペル・タイポグラフィ)とシャープさほぼリアルタイムの生成を前面に。2K解像度対応が発表。利用チャネルはGemini API / AI Studio / Vertex AI(プレビュー)。 (Google DeepMind, Google Developers Blog)
  • Gemini 2.5 Flash Image(Nano Banana):Geminiファミリーの画像生成・編集特化会話で細かい編集指示複数画像の融合キャラクター一貫性など制作フロー寄りの機能を提供。低レイテンシで試行錯誤に向く。 (Google Developers Blog)

「Nano Banana」という呼称は公式ドキュメントでも別名として明記されています。 (Google AI for Developers)


主な機能比較

観点 Imagen 4 Gemini 2.5 Flash Image (Nano Banana)
主用途 高品質テキスト→画像 生成+編集マルチ画像合成
テキスト描画 大幅改善(看板・ポスター等に強い) 高忠実度のテキストレンダリング対応
画像編集 プレビュー段階では限定的(編集未対応の報告あり) 自然言語での部分編集(背景ぼかし/人物削除/色調整/ポーズ変更等)、マルチ画像融合
速度 近リアルタイムを謳う 低レイテンシ
解像度 最大2K(Imagen 4 / 4 Ultra) 生成・編集とも実用解像度(API仕様に準拠)
価格(目安) $0.04/枚(Imagen 4)、$0.06/枚(Ultra) 約$0.039/枚(出力トークン $30/100万、1024px≒1290トークン)
透かし SynthID SynthID
提供 Gemini API / Google AI Studio / Vertex AI(プレビュー) Gemini API / Google AI Studio(プレビュー)/ Vertex AI

出典:機能・価格・提供形態の各項は公式ブログ/ドキュメントに基づく。編集の可否に関しては開発者フォーラムの最新スレッドも参照。 (Google Developers Blog, Google Cloud, Google AI for Developers, Google Developer forums)


価格と課金の考え方

  • Imagen 4:公式に**$0.04/枚**(Ultraは**$0.06/枚**)と明示。テキスト→画像に特化して単価が把握しやすい。 (Google Developers Blog)
  • Gemini 2.5 Flash Image出力トークン課金$30/100万tokens)で、1024×1024は約1290 tokens≒$0.039/枚。編集でも会話の出力分が課金対象になる点を考慮。 (Google AI for Developers, Google Developers Blog)

どちらを選ぶべき?

  • 広告クリエイティブ、パッケージ、ロゴ入りビジュアル、看板モックなど文字の読みやすさ/配置を最重視するならImagen 4。価格も明快。 (Google Developers Blog)
  • 人物写真の自然な“修正”や商品写真の差し替え、キャンペーン用の大量バリエーション生成→微修正会話で回すワークフロー:Gemini 2.5 Flash Image(Nano Banana)自然言語編集マルチ画像融合が強力。 (Google Developers Blog)

既知の注意点

  • Imagen 4の編集プレビュー段階では未対応との開発者フォーラム報告あり(将来的に変わる可能性)。編集前提なら現時点ではGemini側を。 (Google Developer forums)
  • SynthID透かし:両モデルとも不可視透かしが付与される方針。社内レビュー/配信プラットフォームのポリシーに合わせて運用を。 (Google Cloud, Google Developers Blog)
  • モデルの“知識”:Gemini 2.5 Flash(プレビュー)の知識カットオフは2025年1月。最新実物比較や固有名詞の正確性が重要な合成では追加の検証を。 (ストレージ)

最小コードサンプル

1) Imagen 4(テキスト→画像)

from google import genai
from io import BytesIO
from PIL import Image

client = genai.Client()

resp = client.models.generate_content(
    model="imagen-4.0-generate-001",
    contents=["A retro-futuristic neon city at dusk, ultra sharp typography 'QiiTA' on a billboard"]
)

for part in resp.candidates[0].content.parts:
    if part.inline_data:
        img = Image.open(BytesIO(part.inline_data.data))
        img.save("imagen4.png")

モデルIDと利用手順は公式を参照。 (Google AI for Developers, Google Cloud)

2) Gemini 2.5 Flash Image(画像編集)

from google import genai
from io import BytesIO
from PIL import Image

client = genai.Client()

prompt = "Blur the background, remove the person on the left, and warm up the color tone."
base = Image.open("input.jpg")

resp = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt, base]
)

for part in resp.candidates[0].content.parts:
    if part.inline_data:
        Image.open(BytesIO(part.inline_data.data)).save("edited.jpg")

自然言語での部分編集マルチ画像融合が可能。 (Google Developers Blog)


まとめ

  • 最高品質のテキスト→画像を“単価明確”に大量生成したい:Imagen 4
  • 会話での細かい編集・合成・反復制作まで含めてワンストップにしたい:Gemini 2.5 Flash Image(Nano Banana)
  • どちらも商用配備向けにAPI/Studio/Vertexで提供、SynthID透かし付き。ユースケースと運用フローで使い分けましょう。 (Google Developers Blog, Google Cloud)

参考リンク(一次情報中心)

※本記事の内容は2025-09-03(JST)時点の公式情報に基づきます。プレビューの仕様・価格は今後変更される可能性があります。

14
10
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
14
10

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?