Imagen 4入門 — Ultra・Standard・FastをAPI活用する完全ガイド

Last updated at 2026-03-08Posted at 2026-03-08

はじめに

GoogleのImagen 4ファミリーが正式にGA（一般提供）となり、Gemini APIおよびGoogle AI Studioから利用可能になりました。Ultra・Standard・Fastの3モデル構成で、用途に応じて品質・速度・コストを選択できます。

この記事では、Imagen 4ファミリーの全体像と各モデルの違い、Pythonでの実装方法、料金体系、そしてプロダクション活用のポイントを解説します。

この記事で学べること

Imagen 4ファミリー（Ultra / Standard / Fast）の特徴と使い分け
Gemini API（Python SDK）を使った画像生成の実装方法
料金体系と最適なモデル選択の判断基準
ネイティブ2K解像度やテキスト描画など、主要な新機能

対象読者

AI画像生成をプロダクトに組み込みたいエンジニア
Gemini APIをすでに利用しているか、導入を検討している方
画像生成のコストと品質のバランスを最適化したい方

TL;DR

Imagen 4は Ultra（$0.06/枚）・Standard（$0.04/枚）・Fast（$0.02/枚）の3モデル構成
Ultra/Standardはネイティブ2K解像度（2048×2048px）に対応。ポストプロセスの拡大が不要
テキスト描画精度が大幅に向上し、画像内の文字が正確に読める品質に
Python SDK google-genai を使えば数行のコードで画像生成が可能
すべての出力画像に SynthID電子透かしが自動埋め込み

Imagen 4ファミリーの全体像

Imagen 4はGoogleが提供する画像生成モデルの最新世代です。前世代のImagen 3から大幅に進化し、テキスト描画・プロンプト忠実度・細部の再現性が向上しています。

3モデルの比較

項目	Ultra	Standard	Fast
モデルID	`imagen-4.0-ultra-generate-001`	`imagen-4.0-generate-001`	`imagen-4.0-fast-generate-001`
料金（1枚あたり）	$0.06	$0.04	$0.02
最大解像度	2K（2048×2048）	2K（2048×2048）	1K（1024×1024）
テキスト描画	最高精度	高精度	高精度
プロンプト忠実度	最高	高	やや低い
生成速度	標準	標準	Imagen 3比で最大10倍高速
推奨用途	商用デザイン・ブランディング	汎用的な画像生成	プロトタイピング・大量生成

共通仕様

入力: テキストプロンプト（最大480トークン）
出力: 1リクエストあたり1〜4枚の画像
アスペクト比: 1:1、3:4、4:3、9:16、16:9
画像サイズ: 1K（1024×1024）または 2K（2048×2048、Ultra/Standardのみ）
安全機能: SynthID電子透かし（すべての出力に自動適用）

モデル選択の判断基準

Imagen 4は3モデルすべてGAとなっているため、用途に応じた選択が重要です。

Ultraを選ぶケース

商用利用の最終成果物: 広告バナー、パッケージデザイン、ブランド素材
テキストを含む画像: ポスター、インフォグラフィック、UIモックアップ
高解像度が必要: 印刷物、大型ディスプレイ向け

Standardを選ぶケース

コストと品質のバランス: ブログのアイキャッチ、SNS投稿用画像
2K解像度が必要だがコスト重視: 社内プレゼン資料、ドキュメント挿絵
汎用的な画像生成タスク: 大半のユースケースに対応

Fastを選ぶケース

プロトタイピング: アイデア検証、バリエーション比較
大量生成: A/Bテスト用の画像バッチ、カタログ素材
リアルタイム性重視: ユーザー入力に応じた即時生成

コスト比較: 1,000枚生成する場合、Ultraは$60、Standardは$40、Fastは$20。大量生成ではモデル選択がコストに直結します。

PythonでImagen 4を使う

セットアップ

Google AI Python SDK（google-genai）をインストールします。

pip install google-genai Pillow

APIキーはGoogle AI Studioから取得できます。

基本的な画像生成（Standard）

from google import genai
from google.genai import types

client = genai.Client(api_key="YOUR_API_KEY")

response = client.models.generate_images(
    model="imagen-4.0-generate-001",
    prompt="A serene Japanese garden with a wooden bridge over a koi pond, autumn colors",
    config=types.GenerateImagesConfig(
        number_of_images=1,
    ),
)

# 画像を保存
for i, generated_image in enumerate(response.generated_images):
    generated_image.image.save(f"output_{i}.png")
    print(f"画像を保存しました: output_{i}.png")

Ultra + 2K解像度での生成

response = client.models.generate_images(
    model="imagen-4.0-ultra-generate-001",
    prompt="Modern tech company logo with the text 'ACME AI' in bold sans-serif font",
    config=types.GenerateImagesConfig(
        number_of_images=1,
        image_size="2K",
        aspect_ratio="1:1",
    ),
)

Fastでバッチ生成

prompts = [
    "Minimalist icon of a cloud server",
    "Minimalist icon of a database",
    "Minimalist icon of an API gateway",
    "Minimalist icon of a security shield",
]

for prompt in prompts:
    response = client.models.generate_images(
        model="imagen-4.0-fast-generate-001",
        prompt=prompt,
        config=types.GenerateImagesConfig(
            number_of_images=4,
            aspect_ratio="1:1",
        ),
    )
    for i, img in enumerate(response.generated_images):
        filename = prompt.split()[-1].lower()
        img.image.save(f"{filename}_{i}.png")

アスペクト比の指定

# 16:9（横長 — ブログヘッダー、OGP画像向け）
response = client.models.generate_images(
    model="imagen-4.0-generate-001",
    prompt="Futuristic cityscape at sunset with flying vehicles",
    config=types.GenerateImagesConfig(
        number_of_images=1,
        aspect_ratio="16:9",
    ),
)

# 9:16（縦長 — スマートフォン壁紙、Instagramストーリー向け）
response = client.models.generate_images(
    model="imagen-4.0-generate-001",
    prompt="Abstract geometric pattern in blue and gold",
    config=types.GenerateImagesConfig(
        number_of_images=1,
        aspect_ratio="9:16",
    ),
)

主要な新機能

ネイティブ2K解像度

Imagen 4 Ultraは、Google画像生成モデルとして初めてネイティブ2K解像度（2048×2048px）での出力に対応しました。従来のように1K画像を生成後にアップスケーリングする必要がなく、最初から高解像度で生成されるため、細部の品質が向上しています。

image_size="2K" パラメータを指定するだけで利用可能です。

テキスト描画の精度向上

Imagen 4ファミリーでは、画像内のテキスト描画精度が前世代から大幅に改善されています。公式ドキュメントによると、小さいフォントサイズでも判読可能なテキストを生成でき、スペルミスの発生率も低減されています。

テキストを含む画像を生成する場合は、プロンプトで以下のように明示的に指定することが推奨されます。

"A poster with the text 'AI Conference 2026' in large bold letters at the top"

SynthID電子透かし

すべてのImagen 4出力画像には、GoogleのSynthID技術による電子透かしが自動で埋め込まれます。これは人間の目には見えませんが、専用ツールで検出可能で、AI生成コンテンツの識別に役立ちます。

SynthIDはピクセルレベルで埋め込まれるため、画像のリサイズやフォーマット変換後も検出可能です。

人物生成の制御

person_generation パラメータで、人物を含む画像の生成ポリシーを制御できます。

値	説明
`dont_allow`	人物を含む画像の生成を禁止
`allow_adult`（デフォルト）	成人のみ生成を許可
`allow_all`	すべての人物の生成を許可

料金とコスト最適化

料金比較

モデル	1枚あたり	100枚	1,000枚	10,000枚
Ultra	$0.06	$6.00	$60.00	$600.00
Standard	$0.04	$4.00	$40.00	$400.00
Fast	$0.02	$2.00	$20.00	$200.00

コスト最適化の方針

段階的モデル選択: Fastでプロトタイプ → Standardで確認 → Ultraで最終成果物
アスペクト比の統一: プロジェクト内でアスペクト比を統一し、リサイズ処理を削減
プロンプトの最適化: 明確で具体的なプロンプトにより、リトライ回数を削減
解像度の適正選択: Web用途なら1Kで十分な場合が多い。2Kは印刷物や大型表示向け

他の画像生成モデルとの比較

項目	Imagen 4 Ultra	DALL-E 3	Midjourney v7
テキスト描画	高精度	高精度	中程度
ネイティブ2K	対応	非対応	アップスケーリングで対応
API提供	Gemini API（公開）	OpenAI API（公開）	Enterprise限定
料金/枚	$0.06	$0.04〜$0.08	月額サブスクリプション
電子透かし	SynthID自動	C2PA対応	メタデータ付与
プロンプト上限	480トークン	4,000文字	約350語

上記の比較は公開情報に基づく参考値です。各モデルの仕様は頻繁に更新されるため、最新情報は各公式ドキュメントを参照してください。

まとめ

Imagen 4ファミリーはUltra・Standard・Fastの3モデル構成で、品質・速度・コストに応じた柔軟な選択が可能
ネイティブ2K解像度とテキスト描画精度の向上が最大の進化ポイント
Python SDK google-genai で簡潔に実装でき、number_of_images、image_size、aspect_ratio の3パラメータで制御
SynthID電子透かしが全出力に自動適用され、AI生成コンテンツの透明性を確保
段階的なモデル選択（Fast → Standard → Ultra）でコストを最適化できる

Imagen 4ファミリーの詳細な仕様やサンプルコードは、公式ドキュメントやGemini API Cookbookを参照してください。

参考リンク

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up