Bing Image Creatorが登場したのでさっそく使い倒してみた

Last updated at 2023-03-22Posted at 2023-03-22

はじめに

米国時間の21日未明にかけて、Microsoftから新しい画像生成AI機能を搭載したサービスBing Image Creatorが登場しました。

このサービスの特徴は、ChatGPTでAIに対して問い合わせを行う感覚でプロンプティングを行うことでそのコンテキストに沿った画像を生成してもらえることが特徴となっております。

画像生成時に使われる機械学習モデルはDALL-Eとなっています。
テキストプロンプトの内容に沿って、最大４枚の画像を生成してくれます。

時々３枚しか生成してくれない場合もありました

使う方法

このサービスを使うためには、Microsoftアカウントが必要となっています。
Bing Image Creatorを初めて使う場合には、25回まで優先的に画像を生成することができるクレジットをもらうことができます。

このクレジットを使い果たしても、画像生成ができなくなるわけではありませんが、クレジットを使う場合に比べて生成に時間がかかることがあります。

対応言語

現在は英語でのテキストプロンプトのみが対応可能となっております。
そのほかの言語については将来的に対応予定とのことです。

良いプロンプトを作成するコツ

プロンプトを作成する際のコツとして、より説明的であることが良いとされています。
例えば、名詞だけプロンプトを作成するのではなく、形容詞と名詞を組み合わせてその名詞がどういう名詞を意味しているのかを形容詞で修飾してあげるといった作業が必要となります。

加えて、どのような画像スタイルでその名詞を描いてほしいのかといった修飾もより効果的とされています。例えば写実的である方が良いのか、それとも漫画アートのような画風が良いのかなどです。

具体的な組み合わせとしては、次のような形が理想的とされています。

形容詞 + 名詞 + 形容詞節（名詞を修飾（説明）する節）, 画風

実際のプロンプトに当てはめると、次の通りです。

fuzzy creature wearing sunglasses, digital art

実際に使ってみた例

例えば、ドラマ、シリコンバレーに登場するリチャード・ヘンドリクスのような人物を生成したいとします。

その場合、次のような特徴を挙げることができると思います。

portrait of a man, a programmer（男性プログラマーのポートレート）
man is wearing glasses（メガネを着用している）
hair is permed（髪型はパーマがかかっている）
standard body type（標準体型）
man dressed like he would work in Silicon Valley（シリコンバレーで働いていそうな服装をしている）
the man is white（その男性は白人である）
He is facing the camera directly.(カメラに対して正面を向いている)
background of the photo is an office in Silicon Valley（写真の背景にはシリコンバレーのオフィスが写っている）
young men(その男性は若者である)

ここで、ChatGPTを使って上記の特徴をとらえた上で、画像生成AIに対してのプロンプトを作成する依頼を行います。

Create the prompts in one line needed to generate images in midjourney based on the following content and examples.

Intent: ###
1. portrait of a man, a programmer
2. man is wearing glasses
3. hair is permed
4. standard body type
5. man dressed like he would work in Silicon Valley
6. the man is white
7. He is facing the camera directly.
8. background of the photo is an office in Silicon Valley
9. young men
###

Example: ###
It works best when you're highly descriptive. So, get creative and add details: adjectives, locations, even artistic styles such as "digital art" and "photorealistic."

Here's an example : instead of a text prompt of "creature" - try submitting a prompt for "fuzzy creature wearing sunglasses, digital art".
###

そして、ChatGPTからは次のテキストプロンプトが生成されました。

Create a photorealistic portrait of a young white man with a standard body type, permed hair, and wearing glasses, dressed in Silicon Valley work attire, facing the camera directly, in an office background of Silicon Valley, who is a programmer.

これを使って、Bing Image Creatorにて画像を生成してみました。
すると次のような結果が表示されました。

なかなか、的を得ていると思う結果となりました。
同じテキストプロンプトだとしても、実行するごとに生成結果が変わります。
そのため、自分の求めている結果が出るまで何度も生成してみると良いかもしれません。

ちなみに、何度か試した結果、リチャード・ヘンドリクスに一番近いであろう画像がたまたま生成されました。

より説明的であったり、より具体的なプロンプトであれば生成結果がより自分の求めているモノに近くなるはずですので、思ったような結果が出ない場合はプロンプトの方を修正することをお勧めします。

まとめ

この間登場したGPT-4から間も無く、こちらはDALL-Eですが、Bing Image Creatorというサービスがマイクロソフトから登場しました。

ビルゲイツがAIの開発はインターネットやマイクロプロセッサの登場に匹敵し、私たちの働き方や学び方、それにコミュニケーションそのものに変革をもたらすと公言しているように、今年はおそらくその記念すべき最初の一年となるかもしれません。

なので、この機会にぜひChatGPTやBing Image Creatorなどで、AIに説明する力を養い、これからのための基礎を固めておく必要があるのかもしれません。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up