LoginSignup
43
18

「食パンをくわえて走る女子高生」のようにかなりレアと思われる画像をChatGPTのDALL·E 3で次々と生成してみた

Posted at

Supershipの名畑です。Dancing☆Starプリキュアは間違いなく絶対に確かにプリキュアでした。

はじめに

これまでに「「食パンをくわえて走る女子高生」のイラストをSketch to imageでAI生成してみた」とか「「食パンをくわえて走る女子高生」の画像をAdobe Photoshopを使ってAI生成してみた」といった記事を書いてきました。
端的に言うと「食パンをくわえて走る女子高生」というそうそうないシチュエーションの画像をなんとかAI生成しようと試みた記事です。

で、今回は、同じことをOpenAIDALL·E 3でやってみることにしたんですが、やってみると、あまりに簡単に「食パンをくわえて走る女子高生」の画像生成が実現してしまうという予想外の結果になり……。

まあ、プロンプトを工夫したり、あるいはControlNetなどの技術を使えばStable Diffusionでも同じことはさくっとできるのかもしれませんが、特に深く考えず雑に投げたプロンプトでもここまで意図通りに画像が生成されることにちょっと驚きました。

ということで「食パンをくわえて走る女子高生」だけではなく、現実でも創作でも希少性がありそうなプロンプトをDALL·E 3に雑に投げてどんな結果が出るかを試してみたというのが今回の記事の趣旨となります。

注意

画像容量の問題ですべて512x512にリサイズしております。

食パンをくわえて走る女子高生

まず「食パンをくわえて走る女子高生」の結果です。

これまでの記事同様、英語で「A high school girl running through a residential area with a piece of plain bread putted in her mouth」と投げています。日本語訳すると「食パン一切れを口に入れて住宅街を走る女子高生」ですね。「a slice of white bread」や「a slice of sandwich bread」の方がいいかとは思いつつ、過去記事に揃えます。

生成された画像は下記です。

dalle-bread-1.png
dalle-bread-2.png

びっくりするぐらいにちゃんと「食パンをくわえて走る女子高生」ですね。

画像のプロンプト

ちなみに、DALL·E 3は生成された画像のプロンプトを見ることができるのですが、それは下記でした(他の生成AIでも可能ではありますが)。これを読むのは勉強になります。

A high school girl with Asian descent, wearing a traditional sailor-style Japanese school uniform, is running through a quiet residential area. She has a piece of plain bread in her mouth, suggesting she's late and in a hurry. Her hair is black and tied back in a high ponytail, swinging with her movements. Around her, there are small houses with gardens, a few parked cars, and the streets are lined with trees and streetlamps. The morning light casts soft shadows on the pavement, giving a peaceful yet dynamic atmosphere to the scene.

また、さらに余談ですが

この画像のシード値はいくつですか?

というように聞くと、答えてはくれました。

痛バを持って池袋の街を歩く女性

ここからは日本語のままプロンプトを投げます。

次は「痛バを持って池袋の街を歩く女性」です。

現実には池袋をはじめとして特定の場所であればよく見かけますが、一般には比較的レアな部類なのではないかと考え、生成してみることにしました。ただ「Ita-Bag」としてWikipediaに項目が存在していたので、実は海外含め知られている?

知らない人もいるかもしれないので説明しておくと、痛バは「痛いバッグ」「痛バッグ」の略で、缶バッジなどを用いて推しへの愛を表現したカバンのことです。想像がつかない方はGoogleの画像検索をどうぞ。

生成された画像は下記です。

dalle-itaba-1.png
dalle-itaba-2.png

バッジに統一感が欲しい気はしますし、これは池袋ではなく渋谷ではというところですが、かなりイメージ通りです。

画像のプロンプト

A woman with an 'itabag' (a bag covered in badges and anime merchandise) walking through the streets of Ikebukuro, Tokyo. She is wearing casual, trendy clothes and has a joyful expression as she looks at the urban surroundings. The scene includes city buildings, a bustling crowd, and neon signboards in the background, reflecting the lively atmosphere of Ikebukuro. The itabag is colorful and heavily decorated, showcasing her enthusiasm for her favorite anime characters.

最近パンも売るようになった魚屋

最近パンも売るようになった魚屋」です。

もしかしたらどこかには存在するのかもしれませんがパンの二つを主として売る店を私は見たことがありません。

生成された画像は下記です。

dalle-fish-1.png
dalle-fish-2.png

うん、この店でパンを買いたいかは別として、ちゃんとプロンプト通りです。「TODAY」に「最近」が込められているのですね。

スペルの問題はまあ現時点の生成AIではやむなしということで。

画像のプロンプト

A fishmonger's shop that has recently started selling bread as well. The image shows a storefront with a display of fresh fish on ice and a variety of breads on wooden shelves. The signage includes both fish and bread icons, indicating the new addition to the store's offerings. A fishmonger in an apron stands behind the counter, proudly presenting a loaf of bread with one hand and a fish in the other, smiling at potential customers passing by. The shop has a welcoming, rustic charm, with a chalkboard listing today's catch and bread specials.

ビジュアル系バンドがライブハウスの受付で演奏を開始したが、バンギャはその前を走り抜けていく

前に私が個人的にツボだった動画として0.1gの誤算というバンドの「入場と同時に「受付で演奏を開始したら」バンギャはどんな反応をするか検証してみた」というものに触れたことがありますが、そのシチュエーションを再現してみてもらいました。おそらく、かなりレアだと思われます。
ちなみにバンギャバンドギャルの略です。日本以外にもある概念?

プロンプトは「ビジュアル系バンドがライブハウスの受付で演奏を開始したが、バンギャはその前を走り抜けていく」です。

dalle-band-1.png
dalle-band-2.png

なかなかにシュールな画像が出来上がりました。当たらずといえども遠からず。

画像のプロンプト

An image of a live house scene where a visual kei band starts an unplanned performance at the reception and fans are running through. The visual kei band is in the foreground, with their distinct style: heavy, artistic makeup, and elaborate, stylized costumes characteristic of the genre. Behind them, a fan is captured in motion, racing past the band to get into the main venue area. The fan is dressed in the visual kei aesthetic, with noticeable accessories and hair styled in an exaggerated fashion, her expression one of excitement and urgency as she bypasses the performance.

壁にオーストラリアの地図しか貼られていない美術館の館内

次に「壁にオーストラリアの地図しか貼られていない美術館の館内」です。

特定の要素だけの美術館はあれど、地図だけの展示もあれど、特定の国の地図だけの展示は私は見たことがない。

生成された画像は下記です。

dalle-museum-1.png
dalle-museum-2.png

地図の確かさはともかく、現実に存在していそうな美術館の絵が生成されました。

画像のプロンプト

Imagine the interior of a museum gallery with stark white walls, minimalist in design. The only artwork displayed is a large, detailed map of Australia filling one wall. The room has a polished concrete floor with a slight reflection, high ceilings, and directed spotlights emphasizing the map's presence. The atmosphere is quiet and contemplative, with a few patrons scattered around, observing the map. One patron is a Middle-Eastern male in casual clothing, another is a South Asian female in a business suit, and a third is a Black child looking curiously at the map. No other decorations or exhibits are visible, creating a focus on the geographical depiction of Australia.

山手線の路線図によく似た髪型をしている女性

次に「山手線の路線図によく似た髪型をしている女性」です。
自分で書いていて、どんな髪型かまったく想像がつきません。

生成された画像は下記です。

dalle-yamanote-1.png
dalle-yamanote-2.png

うん、山手線の路線図の特徴である環状にはなっていませんが、かなり意図は汲み取ってくれていると感じます。ヘアピンを用いての駅の表現はファッショナブル。

画像のプロンプト

A woman with a hairstyle that resembles the Yamanote Line train map in Tokyo. The hair is creatively styled in loops and lines with hairpins to represent the various stations, using green highlights to mimic the line's color. Her attire is modern and chic, complementing the innovative hairstyle. She has a confident smile, standing in front of a simple, subtle background that doesn't detract from the intricacy of her hair design.

お好み焼き屋でホットケーキを焼いているカップル

次に「お好み焼き屋でホットケーキを焼いているカップル」です。

私が知らないだけでこんな店、実はどこかにあったりするんですかね?

生成された画像は下記です。

dalle-okonomiyaki-1.png
dalle-okonomiyaki-2.png

この店、めちゃ楽しそう。

画像のプロンプト

Visualize a heartwarming scene in an okonomiyaki restaurant where a couple is actively engaged in cooking pancakes together. The restaurant is styled with an authentic Japanese ambiance, complete with a teppan grill at each table. The couple is at one of these tables, a Black woman and a White man, both wearing aprons and playful smiles as they pour batter and skillfully flip pancakes. The restaurant is filled with the inviting aroma of cooking pancakes, and other diners can be seen enjoying their meals in the background. The couple has a dynamic and joyful chemistry, laughing and collaborating in the cooking process, creating a delightful and engaging atmosphere.

10人が乗っているスケボー

最後に「10人が乗っているスケボー」です。

少なくとも私は街中では見たことがないです。2人乗りですらあるかどうか。

生成された画像は下記です。

dalle-skateboard-1.png
dalle-skateboard-2.png

少なくとも1枚目はほぼ意図通りです。2枚目はスケボーonスケボーになっちゃってますが。

どちらも10人ではないですが、数の概念が苦手なのはやはり現時点での生成AIの特徴ですかね。
けれど、これだけの人数をここまで違和感なく生成できるのは普通にすごい。

画像のプロンプト

Picture an oversized skateboard, crafted with careful detail to support ten people riding it simultaneously. The skateboard is placed in a spacious urban skate park with ramps and rails in the background. On the board, there's a mix of individuals, each with unique attire that reflects their personal style ranging from streetwear to athletic gear. The group consists of a diverse set of individuals including two Caucasian males, two Black females, two Asian males, two Hispanic females, and two Middle-Eastern males. They are balancing and coordinating with each other, some laughing and others concentrated, as they attempt to navigate the skateboard together in a display of teamwork and balance.

最後に

かなり今更な内容ではありますが、深く考えずに投げたプロンプトでこれだけ忠実に生成していってくれるのは、個人的には非常に印象深いです。生成AIとは手間を省くのが一つの大きな意義だと思うので「」への対応にはそれ相応の価値があるのではないかと、強引ながら結論づけます。

公式サイトに下記の通りあるので

DALL·E 3 is now available to all ChatGPT Plus and Enterprise users, and will be available via the API and in Labs later this fall.

過去記事「OpenAIのImages APIを用いた画像生成をPythonで実装してみた記録」のようにAPIから叩けるようになるのも近い将来のはず。楽しみです。

宣伝

SupershipのQiita Organizationを合わせてご覧いただけますと嬉しいです。他のメンバーの記事も多数あります。

Supershipではプロダクト開発やサービス開発に関わる方を絶賛募集しております。
興味がある方はSupership株式会社 採用サイトよりご確認ください。

43
18
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
43
18