はじめに
GoogleのImagen 4ファミリーが正式にGA(一般提供)となり、Gemini APIおよびGoogle AI Studioから利用可能になりました。Ultra・Standard・Fastの3モデル構成で、用途に応じて品質・速度・コストを選択できます。
この記事では、Imagen 4ファミリーの全体像と各モデルの違い、Pythonでの実装方法、料金体系、そしてプロダクション活用のポイントを解説します。
この記事で学べること
- Imagen 4ファミリー(Ultra / Standard / Fast)の特徴と使い分け
- Gemini API(Python SDK)を使った画像生成の実装方法
- 料金体系と最適なモデル選択の判断基準
- ネイティブ2K解像度やテキスト描画など、主要な新機能
対象読者
- AI画像生成をプロダクトに組み込みたいエンジニア
- Gemini APIをすでに利用しているか、導入を検討している方
- 画像生成のコストと品質のバランスを最適化したい方
TL;DR
- Imagen 4は Ultra($0.06/枚)・Standard($0.04/枚)・Fast($0.02/枚)の3モデル構成
- Ultra/Standardはネイティブ2K解像度(2048×2048px)に対応。ポストプロセスの拡大が不要
- テキスト描画精度が大幅に向上し、画像内の文字が正確に読める品質に
- Python SDK
google-genaiを使えば数行のコードで画像生成が可能 - すべての出力画像に SynthID電子透かしが自動埋め込み
Imagen 4ファミリーの全体像
Imagen 4はGoogleが提供する画像生成モデルの最新世代です。前世代のImagen 3から大幅に進化し、テキスト描画・プロンプト忠実度・細部の再現性が向上しています。
3モデルの比較
| 項目 | Ultra | Standard | Fast |
|---|---|---|---|
| モデルID | imagen-4.0-ultra-generate-001 |
imagen-4.0-generate-001 |
imagen-4.0-fast-generate-001 |
| 料金(1枚あたり) | $0.06 | $0.04 | $0.02 |
| 最大解像度 | 2K(2048×2048) | 2K(2048×2048) | 1K(1024×1024) |
| テキスト描画 | 最高精度 | 高精度 | 高精度 |
| プロンプト忠実度 | 最高 | 高 | やや低い |
| 生成速度 | 標準 | 標準 | Imagen 3比で最大10倍高速 |
| 推奨用途 | 商用デザイン・ブランディング | 汎用的な画像生成 | プロトタイピング・大量生成 |
共通仕様
- 入力: テキストプロンプト(最大480トークン)
- 出力: 1リクエストあたり1〜4枚の画像
-
アスペクト比:
1:1、3:4、4:3、9:16、16:9 -
画像サイズ:
1K(1024×1024)または2K(2048×2048、Ultra/Standardのみ) - 安全機能: SynthID電子透かし(すべての出力に自動適用)
モデル選択の判断基準
Imagen 4は3モデルすべてGAとなっているため、用途に応じた選択が重要です。
Ultraを選ぶケース
- 商用利用の最終成果物: 広告バナー、パッケージデザイン、ブランド素材
- テキストを含む画像: ポスター、インフォグラフィック、UIモックアップ
- 高解像度が必要: 印刷物、大型ディスプレイ向け
Standardを選ぶケース
- コストと品質のバランス: ブログのアイキャッチ、SNS投稿用画像
- 2K解像度が必要だがコスト重視: 社内プレゼン資料、ドキュメント挿絵
- 汎用的な画像生成タスク: 大半のユースケースに対応
Fastを選ぶケース
- プロトタイピング: アイデア検証、バリエーション比較
- 大量生成: A/Bテスト用の画像バッチ、カタログ素材
- リアルタイム性重視: ユーザー入力に応じた即時生成
コスト比較: 1,000枚生成する場合、Ultraは$60、Standardは$40、Fastは$20。大量生成ではモデル選択がコストに直結します。
PythonでImagen 4を使う
セットアップ
Google AI Python SDK(google-genai)をインストールします。
pip install google-genai Pillow
APIキーはGoogle AI Studioから取得できます。
基本的な画像生成(Standard)
from google import genai
from google.genai import types
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_images(
model="imagen-4.0-generate-001",
prompt="A serene Japanese garden with a wooden bridge over a koi pond, autumn colors",
config=types.GenerateImagesConfig(
number_of_images=1,
),
)
# 画像を保存
for i, generated_image in enumerate(response.generated_images):
generated_image.image.save(f"output_{i}.png")
print(f"画像を保存しました: output_{i}.png")
Ultra + 2K解像度での生成
response = client.models.generate_images(
model="imagen-4.0-ultra-generate-001",
prompt="Modern tech company logo with the text 'ACME AI' in bold sans-serif font",
config=types.GenerateImagesConfig(
number_of_images=1,
image_size="2K",
aspect_ratio="1:1",
),
)
Fastでバッチ生成
prompts = [
"Minimalist icon of a cloud server",
"Minimalist icon of a database",
"Minimalist icon of an API gateway",
"Minimalist icon of a security shield",
]
for prompt in prompts:
response = client.models.generate_images(
model="imagen-4.0-fast-generate-001",
prompt=prompt,
config=types.GenerateImagesConfig(
number_of_images=4,
aspect_ratio="1:1",
),
)
for i, img in enumerate(response.generated_images):
filename = prompt.split()[-1].lower()
img.image.save(f"{filename}_{i}.png")
アスペクト比の指定
# 16:9(横長 — ブログヘッダー、OGP画像向け)
response = client.models.generate_images(
model="imagen-4.0-generate-001",
prompt="Futuristic cityscape at sunset with flying vehicles",
config=types.GenerateImagesConfig(
number_of_images=1,
aspect_ratio="16:9",
),
)
# 9:16(縦長 — スマートフォン壁紙、Instagramストーリー向け)
response = client.models.generate_images(
model="imagen-4.0-generate-001",
prompt="Abstract geometric pattern in blue and gold",
config=types.GenerateImagesConfig(
number_of_images=1,
aspect_ratio="9:16",
),
)
主要な新機能
ネイティブ2K解像度
Imagen 4 Ultraは、Google画像生成モデルとして初めてネイティブ2K解像度(2048×2048px)での出力に対応しました。従来のように1K画像を生成後にアップスケーリングする必要がなく、最初から高解像度で生成されるため、細部の品質が向上しています。
image_size="2K" パラメータを指定するだけで利用可能です。
テキスト描画の精度向上
Imagen 4ファミリーでは、画像内のテキスト描画精度が前世代から大幅に改善されています。公式ドキュメントによると、小さいフォントサイズでも判読可能なテキストを生成でき、スペルミスの発生率も低減されています。
テキストを含む画像を生成する場合は、プロンプトで以下のように明示的に指定することが推奨されます。
"A poster with the text 'AI Conference 2026' in large bold letters at the top"
SynthID電子透かし
すべてのImagen 4出力画像には、GoogleのSynthID技術による電子透かしが自動で埋め込まれます。これは人間の目には見えませんが、専用ツールで検出可能で、AI生成コンテンツの識別に役立ちます。
SynthIDはピクセルレベルで埋め込まれるため、画像のリサイズやフォーマット変換後も検出可能です。
人物生成の制御
person_generation パラメータで、人物を含む画像の生成ポリシーを制御できます。
| 値 | 説明 |
|---|---|
dont_allow |
人物を含む画像の生成を禁止 |
allow_adult(デフォルト) |
成人のみ生成を許可 |
allow_all |
すべての人物の生成を許可 |
料金とコスト最適化
料金比較
| モデル | 1枚あたり | 100枚 | 1,000枚 | 10,000枚 |
|---|---|---|---|---|
| Ultra | $0.06 | $6.00 | $60.00 | $600.00 |
| Standard | $0.04 | $4.00 | $40.00 | $400.00 |
| Fast | $0.02 | $2.00 | $20.00 | $200.00 |
コスト最適化の方針
- 段階的モデル選択: Fastでプロトタイプ → Standardで確認 → Ultraで最終成果物
- アスペクト比の統一: プロジェクト内でアスペクト比を統一し、リサイズ処理を削減
- プロンプトの最適化: 明確で具体的なプロンプトにより、リトライ回数を削減
- 解像度の適正選択: Web用途なら1Kで十分な場合が多い。2Kは印刷物や大型表示向け
他の画像生成モデルとの比較
| 項目 | Imagen 4 Ultra | DALL-E 3 | Midjourney v7 |
|---|---|---|---|
| テキスト描画 | 高精度 | 高精度 | 中程度 |
| ネイティブ2K | 対応 | 非対応 | アップスケーリングで対応 |
| API提供 | Gemini API(公開) | OpenAI API(公開) | Enterprise限定 |
| 料金/枚 | $0.06 | $0.04〜$0.08 | 月額サブスクリプション |
| 電子透かし | SynthID自動 | C2PA対応 | メタデータ付与 |
| プロンプト上限 | 480トークン | 4,000文字 | 約350語 |
上記の比較は公開情報に基づく参考値です。各モデルの仕様は頻繁に更新されるため、最新情報は各公式ドキュメントを参照してください。
まとめ
- Imagen 4ファミリーはUltra・Standard・Fastの3モデル構成で、品質・速度・コストに応じた柔軟な選択が可能
- ネイティブ2K解像度とテキスト描画精度の向上が最大の進化ポイント
- Python SDK
google-genaiで簡潔に実装でき、number_of_images、image_size、aspect_ratioの3パラメータで制御 - SynthID電子透かしが全出力に自動適用され、AI生成コンテンツの透明性を確保
- 段階的なモデル選択(Fast → Standard → Ultra)でコストを最適化できる
Imagen 4ファミリーの詳細な仕様やサンプルコードは、公式ドキュメントやGemini API Cookbookを参照してください。


