Gemini 2.0 Flash Experimental の Web で話題になっていた画像生成系の事例を試してみた

Last updated at 2025-03-16Posted at 2025-03-16

はじめに

以下の記事やポストのまとめなど、複数の話題を見かけた「Gemini 2.0 Flash Experimental」関連の話に関する記事です。

●Google AI StudioのGemini 2.0 Flash Experimentalで画像編集を試す｜まゆひらa
　https://note.com/mayu_hiraizumi/n/nd643348f2e41

●Gemini新機能の画像加工がついにテキスト指示だけで背景の構図も自由自在に変えたり、出力したキャラを回転させられるように。 - Togetter [トゥギャッター]
　https://togetter.com/li/2524944

以下の公式記事にも登場する、画像生成に関連したものになります。

具体的に話題になっていたのは、「ある写真・画像を入力として、その写真の内容を維持したままで別方向から見た写真・画像にする」「複数の画像の出力において、見た目の一貫性を保ちつつ、別のシーン・連続したアニメーションになりそうな複数のフレームを出力する」というようなものなどです。

これは自分でも試さねば！、と思ってメモ的な記事を残しつつやってみました。
（とりあえず Google AI Studio で試しました）

いったん冒頭の記事などの中で事例として出ていたものを、いくつかピックアップしてみます（※ 2つほど、上で紹介したものと重複してます）。

それでは、Google AI Studio上で実際に試してみます。

利用するモデルには、以下を設定します。

自前で用意した内容を試す前に、公式のサンプルをまずは試してみます。

具体的には、以下の 2つです。

サンプル 1つ目を試した結果は以下のとおりです。

入力画像に対して、加工が行われた結果が出力されているのが分かります。

次はサンプル 2つ目です。

試した結果、わりと多くの画像が生成されました。

統一された見た目で、一連の画像が生成されていることが確認できました。

ちなみに、プロンプトは以下の内容が入力されていました。

【プロンプト】
Generate a story about a white baby goat going on an adventure in a farm in a 3d cartoon animation style. For each scene, generate an image.

それでは、既存の事例なども参考にしつつ、自分で用意した内容で試していきます。

以下は、とあるラーメン屋で撮影していた写真をもとに、別角度から見た写真に変えるというものです。

細かく見ると元の内容から変化してしまっている部分はありますが、おおまかなところでは、同じような見た目で真上から見た写真になっていることが分かります（※具材や、どんぶりの模様などは同じような感じを維持しつつ）。

次は、連続したアニメーションのフレームを生成する例です。

上で出てきていた例をもとに、まずは同じような内容を案として用意してみました。

【プロンプト案】
Generate multiple images for an animation, showing a seed growing into a plant and then blooming into a flower in a pixel art style.

その後、それに少し変更を加えてみようかと思い、1つではなく複数の花が咲く内容になるようなプロンプトにしてみました。

【試したプロンプト】
Generate multiple images for an animation, showing multiple seeds growing into plants and then blooming into flowers in a pixel art style.

これを試した結果は、以下のとおりです。

たまに、テキストの文章だけが出てきて画像が生成されないこともああったのですが、このように一連の流れの画像を得ることができました。