はじめまして。
こんにちは。
この度初めてこちらのサイトに記事を投稿させていただくのですが、あまり自分の技術には自信がないので試しに話題のツールを使って任意の画像を生成した過程をご紹介してみようと思います。
今回は、自然言語による記述からあらゆる画像を作成できるAIの「DALL・E2」を使って、私の愛車であるCBR650Rの画像を生成してみようと思います。
こちらのリンク先で見れるバイクが私の愛車である2019年式のCBR650Rです。かっこいいですね。(https://www.bikebros.co.jp/catalog/1/999_77/#spec_top)
DALLE2を使ってみた
DALLE2は、前述の通り自然言語による記述からあらゆる画像を作成できるAIです。
試しに適当な画像を生成してみました。
以下の画像はDALLE2のメインページです。中央に表示されているテキストボックスに任意のテキストを入力しGenerateをクリックすると、生成が開始します。
(入力テキスト:Dog eating apple)
出力画像↓
おぉー。確かにリンゴを食べてるっぽい犬の画像が生成されました。すごい。
では次に、私の愛車の車種名である「CBR650R」と入力してみましょう。
(入力テキスト:CBR650R)
出力画像↓
うーん。確かにバイクの画像であることは間違いなさそうなのですが、これは650Rとは異なる排気量で販売されているCBR250RRやCBR400Rに似ているような気がします。
(参考:https://www.bikebros.co.jp/catalog/1/5_16#spec_top
https://www.bikebros.co.jp/catalog/1/5_25/#spec_top)
やはりブラウザでの検索数や出回っている画像の数などに依存してしまうのでしょうか。
より正確な出力を求め、今度は入力テキストに情報を追加してみました。
(入力テキスト:cbr650r using an inline 4-cylinder)
出力画像↓
バイクがおかしなことになった・・・
その後も「short silencer」とか特徴的なパーツの情報をプロンプトに組み込んでみたのですがなかなかうまくいかず…。あまり学習できていない画像や入力された回数が少ないであろう二輪車関連の用語が含まれるプロンプトなどはまだ綺麗に出力とはいかないのかもしれません。
おわりに
今回は目的の画像を上手く出力させることはできませんでしたが、この先DALLE2の学習量が増え、ユーザーのプロンプト記述も上手くなっていけばもっと繊細な画像も出力してくれるようになりそうですね。
ただ現時点でのDALLE2でも十分精度は高いと思うので、少し遊んでみる分にはとても面白いツールだと思います。まだ触ったことが無い方は是非!