はじめに
以前、以下の検証記事を書きました(2025年11月20日投稿)。
「ChatGPT(GPT-5.1)で日本語入り画像は作れるのか?」
当時の結論は、
- GPT-5.1 では、日本語フォントを正確に扱った画像生成はまだ困難
というものでした。
検証当時(2025年11月)は GPT-5.1 が最新でしたが、
その後、2025年12月に GPT-5.2 がリリースされました。
画像生成まわりの性能向上も期待されており、
「再検証する価値がある」と判断しました。
さらに近年、画像生成の完成度が高いと話題の
Geminiで利用できる以下のモデルも気になります。
- Nano Banana
- Nano Banana Pro
そこで今回は、これらのモデルを対象に
実際のチラシ作成を題材に業務利用レベルで検証しています。
検証条件
業務利用を想定し、以下のやや厳しめ条件でテストしました。
- 情報量が多い
- レイアウト設計が必要
- 可読性が重要
- 日本語表現の破綻が許されない
- A4印刷前提
なお結論を先に述べると、
Geminiの「Nano Banana Pro」が想像以上に強力でした。
以下では、その理由を生成結果とともに詳しく見ていきます。
1. GPT-5.2で日本語入り画像を作成してみた
まずは、ChatGPT の最新モデルである GPT-5.2 を使用し、
日本語入り画像の生成を試しました。
<使用環境>
- ブラウザ版 ChatGPT
- 使用モデル:GPT-5.2
プロンプトはこちらをクリック
以下の情報をもとに、商店街イベント向けのハロウィンチラシを制作してください。
【デザインの方向性】
- ハロウィンの世界観を感じるポップで楽しい雰囲気
- 参加者(特に子ども・ファミリー)がワクワクする構成
- 色はオレンジ・黒・紫を基調
- かぼちゃ、オバケ、コウモリ、夜空などのモチーフを適度に配置
- 情報は見やすく、イベント内容がひと目で分かるレイアウト
- 写真またはイラストを使った視覚的に楽しいデザイン
- A4縦レイアウト(印刷用途)
【必要な要素】
- タイトルを大きく配置
- 開催日時・場所を目立たせる
- 主要イベント(仮装コンテスト/仮装パレード/お菓子掴み取り/グルメ屋台/スタンプラリー)をアイコン付きで分かりやすく
- 注意事項と問い合わせ先は下部にまとめて配置
- QRコードを配置するスペースを用意(実際のQRは後から差し替える想定)
【元となるチラシ内容(Markdownで記述済み)】
# 🎃 商店街ハロウィンフェスタ 202X
〜仮装して、食べて、遊んで楽しもう!〜
## ■ 開催概要
- **日時:〇月〇日(〇) 13:00〜17:00**
- **会場:〇〇商店街**
- メイン会場:中央広場 or 特設ステージ
---
## ■ イベント内容
### ● 仮装コンテスト
- 子ども・大人・ファミリー部門あり
- 受付時間:13:00〜14:00
- 結果発表:16:30
- ステージで写真撮影を実施
---
### ● 仮装パレード
- スタート:13:30
- 商店街をゆっくり一周
- みんなで「トリックオアトリート!」
---
### ● お菓子掴み取り
- 時間:15:30〜
- スタンプラリー達成者 or 参加券所持者が対象
---
### ● グルメ屋台
- かぼちゃスイーツ、軽食、ドリンクなど
- 開始:14:30〜
- 期間限定メニューも登場
---
### ● スタンプラリー
- 商店街を巡ってスタンプを集めよう
- コンプリートで「お菓子掴み取り券」または「抽選券」をプレゼント
---
## ■ 持ち物・参加方法
- 仮装は自由(簡単な仮装でもOK)
- スタンプラリー台紙は会場入口で配布
- 小学生以下は保護者同伴を推奨
- 雨天時の対応:〇〇(必要に応じて記載)
---
## ■ 注意事項
- 商店街内は車両通行にご注意ください
- パレード中はスタッフの指示に従ってください
- ゴミは所定の場所へ
- 体調不良の場合は参加をお控えください
---
## ■ 主催・お問い合わせ
- 主催:〇〇商店街振興組合
- お問い合わせ:〇〇-〇〇〇〇-〇〇〇〇
- HP / SNS:〇〇〇〇(任意)
この内容に基づき、参加者向けのわかりやすさとイベントの楽しさが伝わるチラシデザインを作ってください。
GPT-5.2で作成されたチラシ
評価
パッと見た第一印象は、
「GPT-5.1よりクオリティが上がってる!」
と思ったものの、よく見ると日本語が文字化け(?)しています。。。
デザイン面は向上しているものの、日本語の正確性はまだ実用域に達していない
という印象です。
2. Geminiで日本語入り画像を作成してみた
<使用環境>
- ブラウザ版 Gemini
- 使用モデル:Gemini 3
次に、Geminiで同じプロンプトを使用して画像作成を行いました。
Geminiで利用可能な画像生成モデルは以下の2種類です。(2026年2月17日時点)
- Nano Banana(高速モード)
- Nano Banana Pro(思考モード)
出典:https://gemini.google/jp/overview/image-generation/?hl=ja-JP
2-1.Nano Banana(高速モード)
Geminiで「高速モード」を選択した状態では、[Nano Banana] で画像作成が行われます。
まずは、こちらから試してみます。
Nano Bananaで作成されたチラシ
評価
- 日本語崩れあり
- レイアウトはやや単調
- GPT-5.2よりやや劣る印象
正直なところ、
「現時点では実務利用には厳しい」
という結果でした。
2-2.Nano Banana Pro(思考モード)
続いて、[Nano Banana Pro] で試してみます。
Geminiで「思考モード」を選択した状態では、[Nano Banana Pro] で画像作成が行われます。
Nano Banana Proで作成されたチラシ
す、すごい・・・。
明らかにクオリティが違います。
評価
- 日本語の可読性が大幅改善
- 見出し構造が成立している
- 情報整理が適切
- 実際に印刷できそうな完成度
細部にわずかな崩れは残るものの、
「修正前提なら業務利用可能」
と感じられる水準に到達していました。
まとめ
比較まとめ(2026年2月17日時点)
| モデル | 日本語精度 | デザイン | 実用性 |
|---|---|---|---|
| GPT-5.2 | △ | ◎ | △ |
| Nano Banana | × | △ | × |
| Nano Banana Pro | ○ | ◎ | ○ |
結論
- GPT-5.2は確実に進化しているが、日本語精度はまだ課題が残る
- 現時点では Nano Banana Proが最も実用に近い
生成AIによる画像生成のレベルは確実に向上しており、
日本語生成のクオリティも着実に改善しています。
特に Nano Banana Pro は、
単なる画像生成を超え、「情報構造を理解したレイアウト生成」に近づいている印象を受けました。
完全自動DTPにはあと一歩ですが、
補助ツールとしては十分に実務レベルに近づいていると言えそうです。
今後も、モデルのアップデートがあれば引き続き検証していきたいと思います。




