はじめに
一匹の猫があくびをしている何気ない写真。その背景を「道路」から「和室」に差し替えてしまいましょう。
猫はそのままで背景のみ和室に変わりました。
Googleの最新マルチモーダルAI Gemini を使うと、ほんの数秒でこんな別世界を生み出せます。
Geminiとは?
GeminiはGoogleが開発したマルチモーダルAIで、テキストの指示に応じて画像の生成や加工を行えます。
背景の差し替えやオブジェクトの追加だけでなく、写真全体をまるで別シーンに変えることも可能です。
画像の加工
写真とプロンプト(指示)を用意すれば、誰でも簡単にGeminiで画像加工ができます。
【4コマ漫画】
先ほど加工した猫の写真から4コマ漫画を生成します。
プロンプト:この画像を1コマ目に、4コマ漫画を作って
・最初はただの猫のあくび写真だったのに、背景を変えただけで 「日常のワンシーン」から「物語の一場面」 に。
・おばあさんと猫のやりとりが自然に描かれていて、見る人に想像を広げさせます。
・AIが生成したのに、人間と動物の温かい関係がしっかり伝わるのが面白いところ。
【イラストからリアルへ】
プロンプト:イラストのトイプードルをリアルなトイプードルにして
・Geminiを通すと、毛のふわふわ感や目のうるうる感まで表現された実写風の子犬に。
・「絵本のキャラクターが現実に現れた!」というワクワク感があります。
・実写化したときの毛並みや色合いが、イラストの雰囲気をうまく残している。
・単なる「別の犬の写真」ではなく、ちゃんと「イラストの子のリアル版」に見えるのが驚き。
【画像の服を着せる】
生成された画像↓
・元のワンちゃんに自然にフード付きの服を合成。
・フードの丸耳やふわふわの質感がしっかり出ていて、本当に売られているペット服みたい。
・実際に買う前に「この服が似合うか」を試せるツールになりそう。
・ペット写真を“キャラクター化”して楽しむ遊び方もあり。
【表情の加工】
生成された画像
・加工後はぱっちりと目を開けて「きりっとした可愛さ」が際立っています。
・毛並みや光の反射が違和感なく処理されていて、合成感が薄い。
・瞳のうるっとした質感まで表現されているのがすごい。
・ペット写真を「ベストショット」に仕上げる加工として活用できそう。
・人のポートレートでも「目を閉じちゃった集合写真を自然に修正」する応用が考えられる。
【画像の切れている部分を補正】
・車全体が映って、“旅に出る小さなドライバー” の物語がはっきりと浮かびます。
・車体の青の質感、タイヤの立体感、背景の空とのバランスが自然に描かれている。
・補完部分が不自然に浮いていないので、まるで最初からこう撮影されていたかのよう。
【別々の被写体が同じ世界に】
プロンプト:この3人がおなじ部屋で過ごしているような画像にして
・同じベッドの上でリラックスしていて、まるで最初から一緒に過ごしていた かのように見えます。
・AIでの合成にも関わらず、自然なアイコンタクトや距離感が生まれていて、温かい雰囲気に仕上がっています。
・合成すると、「休日の午後に3人でまったり過ごすシーン」という物語が浮かんできます。
【被写体の削除】
・人形たちがいたスペースに違和感なく芝生や花壇が描き足されている。
・まるで最初から誰もいなかったかのような仕上がりで、とても自然。
・被写体を削除すると「静かな庭と家の風景」になり、雰囲気がガラッと変わった。
・写真の意味が「人物中心」から「風景中心」に切り替わったのが面白いところ。
感想
・Geminiは「修正ツール」ではなく、“写真を物語に変えるツール” だと実感しました。
・背景変更、キャラクター追加、表情変換、イラスト実写化、画像補完……どの加工もただ楽しいだけでなく、「写真の世界観」を広げてくれます。
・特にペット写真では、可愛さとユーモアが掛け算され、見る人に笑顔や驚きを届けられるのが魅力。
まとめ
日常の一枚が、AIの力で「ファンタジー」や「ドラマ」や「冒険」に変わる。
Geminiの生成系加工は、クリエイティブな遊びにも、SNSやブログの記事ネタにも、さらには作品づくりのアイデアにも活用できると感じました。
フリーランスエンジニアです。
お仕事のご相談こちらまで
rockyshikoku@gmail.com
Core MLを使ったアプリを作っています。
機械学習関連の情報を発信しています。