Supershipの名畑です。先日劇場版アイドリッシュセブン LIVE 4bit BEYOND THE PERiODを鑑賞したのですが、こういうライブ映画もっと増えるといいなって思いました。楽しい。
はじめに
過去記事「画像からの「人や物」「背景」「テキスト」の除去をPythonとClipdrop APIsで実装してみた」に続いてClipdropについてです。ClipdropはStable Diffusionの提供元であるstability.aiによる画像編集ツールです。
今回の記事ではClipdropの機能の一つであるReimagine XLを紹介します。Reimagine XLについて詳しくは公式サイトの「Clipdrop、新しいReimagine XLをリリース」にまとまっていますが、ざっくり言うと
- 画像をアップロードする
- Stable Diffusionを用いて似た画像が生成される
- 生成された似た画像は元のピクセルソースに直接は依存しない
こんな感じです。
今回の記事ではこのReimagine XLにいくつかの画像をアップロードし、どのような似た画像が生成されたかをまとめていきます。
ClipdropのWebアプリで完結するため、プログラミング要素は登場しません。
木とビルの写真
元画像

木とビルの映った写真です。これを元にして類似画像の生成をかけてみました。
生成類似画像(3枚)



なんか見ていて心が軽くざわつく違和感がありますが、全体から受ける印象としては非常に似ているとは思います。
Stable Diffusionで生成した女性(リアル風)
元画像

私のQiita記事ではお馴染みのStable Diffusionで生成した女性画像です。この顔を何度見てきたことか。
生成類似画像(3枚)



正直、顔はまったく似ていないですが、服装や髪型などといった全体イメージは近いですね。
Stable Diffusionで生成した女性(イラスト風)
元画像

過去記事で作成しました女性イラストを元に生成してみます。
生成類似画像(3枚)



こちらも、顔は似ていないものの、服装や背景イメージなどはかなり特徴をとらえていますね。
線画1
元画像

次は線で書かれたイラストを元に生成してみます。
生成類似画像(3枚)



服に色がついたことは大きな変化ですが、かなり近しいものを生成しようとしたことは伝わってきます。
線画2
元画像

線画をもう一つアップロードしてみました。特徴としては、全体の半分をAという字が占めています。
生成類似画像(3枚)



画風は異なりますが、色や雰囲気は近いでしょうか。
Aの文字がかなり効いていますね。
最後に
- 生成前と生成後は全体像としてはかなり近い
- 生成後の画像同士は画風も含めてかなり近い
という所感です。
私の普段の生活/業務範囲での使い所は思い浮かんでいないですが、生成後画像を見ているだけで楽しいですね。
宣伝
SupershipのQiita Organizationを合わせてご覧いただけますと嬉しいです。他のメンバーの記事も多数あります。
Supershipではプロダクト開発やサービス開発に関わる方を絶賛募集しております。
興味がある方はSupership株式会社 採用サイトよりご確認ください。