DALL·E 2が公開利用可能になったので早速使ってみた
簡単な紹介
知らない人に紹介すると、DALL·E 2はOpenAI(イーロン・マスク所有)が開発した、テキストで画像生成されるAIモデルです。昔のAIモデルと比べると、精度が高くて、違和感がない画像が生成することができます。しかもより精細な説明文を入れると、より具体的な画像が生成されます。
今年公開利用可能
最新AIモデルと言っても、今年ほぼ制限なく誰でも申請すれば利用できます。
https://openai.com/dall-e-2/
「WAITLIST」でフォームを記入して申請したら1日後承認されて、すぐ使えますが、もちろん無料アカウントだと用量上限があります。
結果は素晴らしい
1.
最初から一番難しいリアル風な画像生成をやってみます。
テキスト:people watching a dinosaur running on Tokyo on a sunny day
(晴れた日に東京を走る恐竜を見ている人々)
写真みたいな画像でも中々違和感がなくて、修正しなくてもすぐ使えるレベルですね。建築物と人間もちゃんと日本っぽいです。
2.
実際写真生成のタスクというより、イラスト生成のタスクが多いと思いますのでイラストもやってみます。
テキスト:illustration of using computer to automate cooking food in a restaurant
(コンピューターを使用してレストランで料理を自動化するイラスト)
左上のパソコンが煙が出ている謎の画像を除いて違和感があまりないですが、左下の画像は恐らく3D印刷のイメージで、右下の画像はパソコンで料理のプロセスを監視するイメージで、右上の画像だけ正しく自動化の概念に基づいて生成されました。これは画像生成の精度問題ではなくテキストの理解問題ですね。
3a.
イラストはセールス資料として良く使いますので、これもAIモデルで生成されることができたらかなりコスト削減できると思います。
説明を読むとテキスト命令で異なるスタイルの画像生成が可能なので最初にリアル風な画像生成をやってみます。
テキスト:building up trust between our company and clients
(当社とお客様との信頼関係の構築)
写真に見えるけど写真ではない画像が生成されました。次はイラスト風をやってみます。
3b.
テキスト:illustration of building up trust between our company and clients
(当社とお客様との信頼関係構築イラスト)
やはり画像での文字生成はまだ課題ですが、アイコン自体は素晴らしくて、しかも毎回生成される画像も違いますので、本当にプレゼンテーション資料に入れてもまったく問題ないレベルですね。
4.
イラスト風以外に他のスタイルもいっぱいあります。今回ははがきのデザインタスクもAIに任せたくて、年賀状を作ってみます。
テキスト:a watercolor drawing of vintage Happy New Year postcard
(水彩画で描かれたヴィンテージの年賀はがき)
いい感じですね。簡単な文字なので今回はしっかりスペルのミスがなく普通に使えるはがきの画像が生成されました。日本語バージョンもできたら最高です。
5.
最後にアートセンスを求めるロゴのデザインで、イラストよりもう少しテキストの意味の理解と表現力を重視するタスクなので、リアル画像生成と同じく一番難しいだと思います。
テキスト:creative logo of a startup IT company in Japan focus on AI development
(AI開発に特化した日本のスタートアップIT企業のクリエイティブロゴ)
文字の部分を除いて、アイコンはちゃんとロゴっぽいし、配色も普通にいいレベルですね。実際に生成された画像をロゴとして使うのは法律的に問題があるかどうかはさておいて、ここまで来たらAIモデルの能力はもう間違いなく誇るしかありません。
最後
使ってみた感想としては、やはりテキストで絵を描く時代が来ました。今のDALL·E 2は用量で請求する仕組みで、1回の生成は20円もいかないので、先のイラスト生成・年賀状デザイン・ロゴのラフ案タスクから見ると相当安くて、イラストレーターさんの仕事が一部AIに取られても過言ではないかもしれませんね。