0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【Google Gemini】GoogleのGeminiに新しい画像生成AIが登場。

0
Posted at

 どうも、カーブミラーです。

 今回は、GoogleのGeminiに新しい画像生成AIが登場。そのご紹介です。

暑い日々が続きます。熱中症に
ご注意を。クーラーがあっても
油断しないで、体調管理をして
乗り切りましょう。水分補給だ
けでなく、栄養摂取もです😅

本記事は、Geminiについての
記事です。    あしからず。

 ChatGPT等の動作状況を知らせる
  OpenAIのステータスページ。
   OpenAIステータス


 こちらも載せますね。
  ChatGPTが使えない?ログインできない・反応しない原因やエラー時の対処法を解説


 著作権法については
  こちらを参照するのが
   良いのではないかと。

 文化庁レポートをもとにした
  著作権法についての動画(約20分)
   かいちのAI大学 【警告】ChatGPTの画像生成は危険です...【4o Image Generation】



 さっそく、【本題】です。

 今回は、
  GoogleのGeminiに
   新しい画像生成AIが登場。

 先日(2025/08/27)に
  ニュースとして、ご紹介しました
   “nano-banana”です。
    正式名として
     “Nano Banana”になりました。

 正式なモデル名は
  gemini-2.5-flash-image-preview
   です。

 “nano-banana”とは
  リリース前の
   正式名称を隠して公開された際の
    仮称のことです。

 それが正式に
  “Nano Banana”として
   公表されたわけです。


 とはいえ、
  モデル名を見て、
   おわかりのとおり、
    プレビュー版です。

 当初は、
  Google AI Studioでの
   利用だけでしたが、
    Geminiアプリ版からも
     使えるようになっています。


 X-Twitter上のGrok先生に
  教えてもらいました。

(Grok解説)
GoogleのNano Bananaは、Google DeepMindが開発したAI画像編集モデルで、正式名称はGemini 2.5 Flash Imageです。このモデルは、自然言語による指示で画像を生成・編集する高度な機能を持ち、2025年8月に話題を集めました。以下に、Nano Bananaの特徴や詳細を簡潔に説明します。

主な特徴

  1. 高いプロンプト追従性
    ユーザーがテキストで「背景を森に変更」「笑顔にする」などの指示を出すと、Nano Bananaは正確かつ迅速に画像を編集。複雑なマスクやレイヤー操作が不要で、初心者でも簡単に扱えます。

  2. キャラクタの一貫性
    複数回の編集でも、人物やオブジェクトの外見(顔、服装、スタイルなど)を一貫して維持。特に、人物やペットの特徴を保持しながら、背景や服装を変更するのに優れています。

  3. 高速処理
    他のAI画像編集ツールが10~15秒かかるのに対し、Nano Bananaは1~2秒で高品質な結果を生成。リアルタイムに近い編集が可能です。

  4. マルチターン編集
    連続した編集指示(例:「ソファを追加」「照明を柔らかく」)を記憶し、画像全体の整合性を保ちながら段階的に編集できます。

  5. 画像の融合
    複数の画像を組み合わせて新しい画像を生成可能。たとえば、人物とペットの写真を合成して新たなシーンを作り出すことができます。

  6. 透かし機能
    生成画像には「AI」透かし(目に見えるものと、SynthIDによる不可視のデジタル透かし)が付与され、AI生成画像であることを明示。ディープフェイクや誤情報のリスクを軽減します。

利用方法

  • Geminiアプリ:Nano BananaはGoogleのGeminiアプリに統合されており、無料プランでは1日100回、課金プランではさらに多くの編集が可能です。
  • Imogenアプリ:iOS/macOS向けの無料アプリ「Imogen」でも利用でき、直感的なインターフェースで編集が簡単。
  • 開発者向け:Gemini API、Google AI Studio、Vertex AIを通じて開発者も利用可能。価格は1画像あたり約0.039ドル(1290トークン)。
  • LMArena:当初、LMArenaのブラインドテストで匿名モデルとして登場し、競合モデルを圧倒。その後、GoogleがNano Bananaの正体を公開。

ユースケース

  • 個人利用:自撮りの服装や背景変更、ペットの写真にユニークな要素(例:チュチュを着せる)を追加。
  • 商用利用:Eコマースでの商品画像のカラー変更、広告キャンペーンの迅速な作成、ゲーム用のNPCポートレート生成など。コスト削減や効率化に貢献。
  • クリエイティブ:漫画の色付け、インテリアデザインのモックアップ、ストーリーテリングのための連続画像生成。

限界と課題

  • 細かい不正確さ:非常に複雑な指示や物理的に不可能なシナリオ(例:腕を完全に削除)では正確性が低下する場合がある。
  • テキスト生成の弱さ:画像内のテキスト生成(例:看板の文字)は苦手。
  • 倫理的懸念:ディープフェイクや不適切な画像生成のリスクに対処するため、Googleは「非合意的な親密な画像」の生成を禁止するガードレールを設けています

なぜ「Nano Banana」?

  • 名前はGoogleの内部コードネーム(果物にちなんだものが多い)に由来し、LMArenaでの匿名テスト中にバナナの絵文字やアイコンが使われたことからコミュニティで定着。Googleの遊び心ある命名が話題に。

現状と今後

  • 2025年8月時点で、Nano BananaはGeminiアプリや特定プラットフォームで利用可能。一部は試験運用中で、将来的にGemini 3.0シリーズに完全統合される可能性があります。
  • コミュニティでは「Photoshopを時代遅れにする」との声もある一方、精密な制御が必要なプロ向け作業ではまだPhotoshopが優位との意見も。

試してみたい場合

  • Geminiアプリ(Web/モバイル)で無料トライアル可能。
  • LMArena(lmarena.ai)でNano Banana(gemini-2.5-flash-preview)を試す。
  • FluxProWebMagicShotなどの外部プラットフォームでもアクセス可能。

 高速処理については、
  実際には、10秒くらいは掛かります。

 画像の融合については、
  融合しますが、
   取って付けた感じがします。

 透かし機能については、
  見えるものは、画像の右下に出ます。


 X-Twitterでポストされた
  活用方法をリストアップして
   もらいました。

(Grokリストアップ)
GoogleのNano Banana(Gemini 2.5 Flash Image)の活用方法として、Xやウェブ上でポストされた具体的なユースケースを以下にリストアップします。情報は2025年8月時点の公開情報に基づいています。

ポストされた活用方法

  1. 写真の背景変更

    • ユーザーが自撮りやペットの写真の背景を、ビーチ、森、都市の夜景などに瞬時に変更。例:「自宅の背景をハワイのビーチに変える」
  2. 服装やアクセサリーの編集

    • 人物写真の服の色やスタイルを変更(例:Tシャツをスーツに、ドレスに花柄を追加)。例:「結婚式の写真でドレスの色を赤から青に変えた」
  3. ペット画像のカスタマイズ

    • ペットに帽子や衣装を追加したり、背景にユニークな要素(例:宇宙や魔法の森)を合成。例:「愛犬にサンタ帽をかぶせてクリスマスカード作成」
  4. Eコマースの商品画像編集

    • 商品の色や背景を変更して、複数のバリエーションを迅速に作成。例:「スニーカーの色を10パターン生成してサイトに掲載」
  5. 広告クリエイティブの作成

    • 広告用のビジュアルを短時間で生成。例:「カフェのポスターでコーヒーカップにロゴを追加し、背景を温かみのあるカフェ風に」
  6. ゲームや漫画のキャラクターデザイン

    • NPCや漫画キャラのポートレートを生成・編集。例:「RPGのキャラに異なる鎧や表情を追加」
  7. インテリアデザインのモックアップ

    • 部屋の写真に家具や装飾を追加して、デザイン案を視覚化。例:「リビングにソファと観葉植物を追加して提案資料作成」
  8. ストーリーテリング用の連続画像生成

    • 物語のシーンを連続して生成し、ビジュアルストーリーを作成。例:「ファンタジー小説のシーンを5枚の画像で表現」
  9. イベント写真の強化

    • 結婚式やパーティーの写真に照明効果や装飾を追加。例:「暗いパーティー写真にカラフルなライトを追加」
  10. 教育やプレゼンのビジュアル作成

    • 講義やプレゼン用のカスタム画像を生成。例:「歴史の授業用に古代ローマの市場を再現」
  11. SNS向けコンテンツ作成

    • InstagramやX用の目を引くビジュアルを生成。例:「旅行写真にテキストオーバーレイで引用を追加」
  12. 画像の修復・補完

    • 古い写真や破損した画像を修復、欠けた部分を補完。例:「祖母の古い写真の傷を消してカラー化」

 ほかにも
 ・キャラのフィギュア化
  (パッケージ付きも)
 ・髪型や服装の試着
 ・背景写真と自分の写真の融合

 私がやったのは、
  フィギュア化とか
   ジオラマ化とか。

 それからいくつかお試しを。
 ・知り合いの写真から証明写真(失敗)
 ・日本語の描画
   →出してくれるが、文章が崩れる。
 ・生成画像のTシャツに
   指定画像をプリント
   これを利用して、
    ChatGPTで日本語文章を生成させ
     Nano Bananaで貼り付けると
      いい感じになりました。
 ・Grokアプリにて、動画化

 動画化に関してですが、
  GeminiアプリもGrokアプリも
   私は無料で使っています。

 それでも
  充分に楽しんでいます。

 ひとつの動画を完成するのに
  ヘタしたら、一分二分でできます。
   画像生成を含めてですよ😸

 そりゃ、もう
  驚きさね😸

 みなさんの
  作品制作の糧に
   なれば、幸いです。

 今回は、ここまで。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?