はじめに
今年最後の投稿は、まだ触れることが出来てなかったGoogle AI Studio と Nano Banana を扱ってみました。
今回は、Google AI StudioはNano Bananaを使うためのプラットフォームとしての役割でのみで使います。
Nano Banana ProはAPI Keyの作成にクレジットカード登録が必要なので、クレカ登録不要のNano Bananaを使うことにしました。
これまでも画像生成はChatGPT、Copilot、GeminiやStable Diffusion、Adobe Fireflyなどを使ってきました。
何れのサービスも素晴らしい画像を生成する能力があり、素人でも良質な画像が作れてしまうのは皆さん承知の通りです。
しかし、これらのサービスは画像の中に文字やキャッチフレーズを入れるだけで、使い物にならないレベルにまで品質が低下します。
今から、1年程前にAWSコミュニティで談話した食品会社の営業さんも似たようなことを仰っていました。
なので、今回はNano Bananaを使って、風景画だけでなく、宣伝広告も作れるかを検証してみようと思います。
Nano Bananaを使ってみる
Googleアカウントさえ持っていれば、下記URLにアクセスすればGoogle AI Studioは使えます。
https://aistudio.google.com/

1.Explore Nano Banana Proを選択します。

2.初期だとNano Banana Proになっているのでモデルを選択するためにNano Banana Proを選択します。

3.Nano Banana を選択し直します。
4.モデルを選択し直したら、Asprct ratioアスペクト比もAutoから16:9に変更します。
ここからは自分が作成したいイメージをチャットで入力すれば、画像を生成してくれます。
私は、以下のプロンプトを入力しました。
「ヨーロッパの城と湖の背景に満天の星空が見える写真風景画を作成してください。三日月も背景に描いてください。」

今どきの生成AIならば、この程度はお手のものですね。
では、今度は少し意地悪をして、ちょっとありえないシチュエーションをお願いすることにします。
「背景に太陽と土星を追加してください。月も満月にしてください。」

現実ではありえないですが、頑張ってそれっぽく仕上げてくれました。
次は宇宙船の中から見た地球を描くことにします。
「女性が宇宙船の中で床に座ってコーヒーを飲みながらPCで作業をしており、背景には大きな丸い窓から地球が写っている写真風イラストを作成してください。」

概ねイメージ通りのイラストが作成されました。依頼していない観葉植物も描かれています。
もう少し近未来っぽくしたいので、更なる追加注文を出します。
「背景に浮いている植物は削除してください。
女性の服装や髪形を近未来的なイメージに修正してください。
女性の髪色を金髪にしてください。
女性は椅子に座り、テーブル上にPCを置いてください。
女性は地球を懐かしむように地球を眺めているように修正してください。」
以下、Modelからの回答です。
承知いたしました。背景の浮いている植物を削除し、女性の服装や髪型を近未来的なイメージに修正します。女性の髪色を金髪にし、椅子に座ってテーブル上にPCを置き、地球を懐かしむように眺めている構図に修正します。

いや、金髪になってないし、地球を眺めてもいないし、いくつか依頼が反映されていません。
一度に複数のお願いをすると、忘れたりサボったりするのもAIのよくある傾向なのでこの程度は想定内です。
ここら辺はNano Bananaも他の画像生成AIと同様だなと感じました。
Nano Bananaはテキスト付画像を生成できるか
最後にこれまでの画像生成AIが最も苦手とする、テキスト付画像をどれだけ正確に作れるかを試します。
Nano Bananaがどんなことを出来るのかAIやITに疎い人に説明出来る絵付きの紹介文を描いてもらうことにします。
「AIやITに詳しくない人向けにGoogleのNano Banana(gemini-2.5 flash image)を紹介したいです。
googleのNano Banana(gemini-2.5 flash image)でできることを簡単に教えてください。
箇条書きでまとめて、それに絵と簡単な説明文を付けて、下記6つを紹介できるように整理して1枚の絵に描きおこしてみてください。
・Google Nano Bananaができることを4つ紹介してください
・Google Nano Bananaが苦手としていることを1つ紹介してください
・Google Nano Banana Proだとできることを1つ紹介してください」

うん、説明部分が全然ダメですね。
試しに文面を英語で出力するようにプロンプトを変えてみたのですが、結果は英語に変換してくれませんでした。
2025年はAIエージェントによるコードの実装、テスト、デプロイが格段に進歩したと実感した1年でした。
しかし、画像生成や動画生成は、まだまだ成長期だと感じています。
本当の食べ頃になるには、もう少し時間が必要みたいですね。今後に期待です。