1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

噂のハウルの動く城のプロンプトを要素分解する

Posted at

まずはこのポスト
https://twitter.com/HIROKICHI_PD/status/1751599530850812121

これはMidjourneyv6で作成されたとのこと。
再現性はかなり高いらしい。

なので、ほかのものを生成するにあたってもこのプロンプトの書き方をある程度マネすればよいということもあったりなかったりするかもしれないので、勉強も兼ねてプロンプトの要素を分解解析してみる。

まずはポストでも書かれているプロンプトはこれ。

This is a digital artwork that combines elements of steampunk and fantasy, depicting an elaborate, mechanical structure that resembles a house or castle with a Victorian architectural design. The main structure is perched atop a metallic, mechanical base, with multiple chimneys emitting smoke, suggesting that it's powered by steam or coal. It has a sense of being a self-sufficient, moving fortress, with cannons and various pipes jutting out at different angles.

The colors are a mix of the rustic reds and browns of rusting metal, the vivid greens of moss and vegetation that have overtaken parts of the structure, and the softer hues of the sky in the background. This juxtaposition of technology and nature gives the image a post-apocalyptic or alternative-history vibe.

The light appears to be natural, indicating either dawn or dusk, which adds a dramatic effect and highlights the textures of the metal and the organic growth on the structure. The quality of light creates an atmosphere that is both nostalgic, due to the old-fashioned architectural elements, and foreboding, due to the industrial, almost warlike aspects of the structure.

The composition is vertically oriented, with the structure towering above the landscape, creating a visual flow that leads the eye from the bottom of the rock foundation to the top of the highest chimney. The balance is achieved through the symmetrical placement of the main building, yet there is a sense of organized chaos in the details.

There's no specific cultural context indicated, but the style suggests a blend of 19th-century industrial and fantasy themes. The image is likely designed to evoke a sense of wonder and curiosity, as well as to stimulate the imagination regarding the story behind this fantastical creation.

The emotions evoked by this image can be mixed; there is the awe of the grandeur and complexity of the structure, and perhaps a touch of melancholy for the apparent absence of human life or the natural environment overtaken by machinery.

This artwork may be intended to make a statement about the relationship between humanity and technology, the impact of industrialization on the environment, or simply to serve as an escape into a visually rich and detailed world.

長い。本当にこんなに必要なのか?とも思うが、そんなことを言っていても仕方がないので解析してみる。

解析

ブロックごとに調べていこう。日本語訳をまずはする。

1ブロック

This is a digital artwork that combines elements of steampunk and fantasy, 
depicting an elaborate, mechanical structure that resembles a house or 
castle with a Victorian architectural design. The main structure is 
perched atop a metallic, mechanical base, with multiple chimneys emitting smoke, 
suggesting that it's powered by steam or coal. It has a sense of being a self-sufficient, 
moving fortress, with cannons and various pipes jutting out at different angles.

これはスチームパンクとファンタジーの要素を組み合わせたデジタル アートで、ビクトリア朝の建築デザインの家や城に似た精巧で機械的な構造を描いています。主要な構造物は金属製の機械的な基盤の上に置かれており、複数の煙突から煙が放出されており、蒸気または石炭によって動力を供給されていることが示唆されています。大砲やさまざまなパイプがさまざまな角度で突き出ており、自立した移動要塞のような雰囲気があります。

つまり

  • 大きな枠組みの説明
  • 時期、デザイン基準、参考にしている構造や素材など
  • 構造物のメインとなる設計、素材、どの部分がどのように稼働しているかの動作
  • 動作から想定される仕組みの説明
  • その他の構造物を具体的に説明、全体の雰囲気を例を出して比喩説明。

2ブロック

The colors are a mix of the rustic reds and browns of rusting metal, 
the vivid greens of moss and vegetation that have overtaken parts of 
the structure, and the softer hues of the sky in the background. 
This juxtaposition of technology and nature gives the image 
a post-apocalyptic or alternative-history vibe.

色は、錆びた金属の素朴な赤と茶色、構造物の一部を覆い尽くした苔や植物の鮮やかな緑、そして背景の空の柔らかな色合いが混ざり合っています。このテクノロジーと自然の並置により、この画像に黙示録的な、あるいは歴史改変のような雰囲気が与えられます。

つまり

1ブロックが素材や構造に対して、2ブロックは色や装飾物、背景など。

  • 装飾物
  • 背景の色、背景とのかかわり(色が混ざり合っている)
  • 画像の雰囲気の指定(こちらの雰囲気は世界観というか、かなり大きくみたもの?)

3ブロック

The light appears to be natural, indicating either dawn or dusk, 
which adds a dramatic effect and highlights the textures of the 
metal and the organic growth on the structure. The quality of 
light creates an atmosphere that is both nostalgic, due to 
the old-fashioned architectural elements, and foreboding, 
due to the industrial, almost warlike aspects of the structure.

光は自然に見え、夜明けか夕暮れを示します。
劇的な効果を加え、テクスチャーを強調します。
金属と構造上の有機成長。の品質光がノスタルジックな雰囲気を醸し出すので、
昔ながらの建築要素と予感、構造の産業的でほとんど戦争的な側面によるものです。

つまり

  • 照明、時間帯の示唆
  • 画像にかけるテクスチャーの効果。ちょっと雑?
  • さらに細かい光の指定と、それの効果による雰囲気への影響。
  • 建築物の時代背景や造形の目的など。

4ブロック

The composition is vertically oriented, with the structure towering 
above the landscape, creating a visual flow that leads the eye from 
the bottom of the rock foundation to the top of the highest chimney. 
The balance is achieved through the symmetrical placement of 
the main building, yet there is a sense of organized chaos in the details.

構図は垂直方向で、構造物が風景の上にそびえ立っており、岩の基礎の底から最も高い煙突の頂上まで視線を導く視覚的な流れを作り出しています。本館を左右対称に配置することでバランスをとっているが、細部には組織的なカオス感が漂っている。

つまり

  • 画像の構図の指定
  • 画像全体の構造、背景との関係性
  • 視覚効果
  • ここでも構造物の細かい描写についてと雰囲気

5ブロック

There's no specific cultural context indicated, but the style suggests 
a blend of 19th-century industrial and fantasy themes. The image is 
likely designed to evoke a sense of wonder and curiosity, as well 
as to stimulate the imagination regarding the story behind this fantastical creation.

特定の文化的背景は示されていませんが、スタイルは 19 世紀の産業テーマとファンタジーのテーマの融合を示唆しています。この画像はおそらく、この幻想的な作品の背後にある物語についての想像力を刺激するだけでなく、驚きや好奇心を呼び起こすようにデザインされていると考えられます。

つまり

  • 文化的背景、世界観の基準
  • 画像に対する、第三者的な評価としてどのようなものが想起されるか、見る人に何をイメージさせるか。

6ブロック

The emotions evoked by this image can be mixed; there is the awe of the 
grandeur and complexity of the structure, and perhaps a touch of 
melancholy for the apparent absence of human life or the natural 
environment overtaken by machinery.

この画像によって呼び起こされる感情は混合することができます。そこには、その構造の壮大さと複雑さに対する畏怖の念があり、また、明らかに人間の生命が存在しないことや、機械に占領された自然環境に対しては、おそらく少しの憂鬱も感じられます。

つまり

  • 画像からあたえる感情。
  • 構造物が与える印象や感情
  • 構造物から創造できる現象や世界観、影響度から得る感情

7ブロック

This artwork may be intended to make a statement about the relationship 
between humanity and technology, the impact of industrialization on 
the environment, or simply to serve as an escape into a visually rich and detailed world.

このアートワークは、人類とテクノロジーの関係、工業化が環境に与える影響、または単に視覚的に豊かで詳細な世界への逃避として機能することを目的としている可能性があります。

つまり

  • アートワーク(画像と同義か?)自体が見る人に求める機能目的。
  • この画像のもつ意味を言語化。(工業化、世界への逃避、人類とテクノロジーの関係  など)

つまり・・・どういうことだってばよ

書く順番も大事ではあるが、全体的に書いていることは

  • 具体的な描写
  • 時代背景、世界観
  • 画像効果
  • 構図
  • 雰囲気
    このあたりだろうか。特によくでてくるのが雰囲気。
    AIに認識させる上で重要なものが具体的な描写や世界観を重視しがちだが、雰囲気という漠然としたものが与える影響は大きい、ということになる。

そして、このプロンプトから感じられることは、「とにかく画像から想起されそうなことは全部書け」という印象。
もちろん最低限、見えるものをなるべく詳細に書くのは必須だが、それと同等かそれ以上に、世界観や雰囲気を重視している。
ネガティブプロンプトはかかれていないが、ネガティブプロンプトに関しても結局同様のことがいえるだろう。

総じて
現在2024年1月時点では、プロンプトはかなりの足し算で問題はない。
画像に求めるものはすべて書く。以上。

実際に出てくるものを見る

普通にやってもスゴイネーにしかならないので、せっかくだから各ブロックを順番に追加してみる。

1ブロックのみ

image.png

1+2

image.png

1+2+3

image.png

1+2+3+4

image.png

1+2+3+4+5

image.png

1+2+3+4+5+6

image.png

1+2+3+4+5+6+7

image.png

なるほど、あんまり変わらないような、変わっているような。

再現性という点では長い方がいいのか、と思ったりするくらいではある。

1文だけでどんなのが出てくるかも試してみる。

This is a digital artwork that combines elements of steampunk and fantasy,
depicting an elaborate, mechanical structure that resembles a house or
castle with a Victorian architectural design.

image.png

・・・あれ?全然かっこいいな。むしろいいような。

総論

今回つかったのはMidjourney。画像はよくもわるくもあまり変わらない感じに。
長いプロンプトは再現性が高まる、というメリットがあるが、逆に短文からでもイメージしやすいものに関してはわりかしでてきちゃうということ。

長いプロンプトが必要になるのは、短文でイメージしきれないもの(へんな髪形の人とか、ポーズとか、カメラアングルとか)には必要だと思う。
逆に、イメージしやすいものについては短文でも十分というのがなんとなくわかる。

長ければいいというものでもないってことだ。
大事なことは「必要としている、求めているものが出力される」ことなので、長いプロンプトで悦に浸る人は置いておいて、より正確なものが出せるプロンプトエンジニアになっていこう。そうしよう。

ということで今回はここまで。

よかったら僕のXもみてください。

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?