はじめに
ネットで見かけるイラストのほとんどが、AIによって生成されたものに置き換わってきている。一見すると写真のような画像も、実際は生成AIで出力されたCGだったりする。
AIの技術の進歩に日々驚きを隠せない。
ただ、いまだに「AI美女」の画像を目にした時、直観的に「これはAIだな」と理解できる。
なぜだろう。
そう、身近にいないからだ、そんな美女。
じゃあ普段身近にいるのは、誰だ?
そう、「おじさん」だ。
一緒に仕事をしている人も「おじさん」
通勤電車で前に座っているのも「おじさん」
定食屋で隣に座っているのも「おじさん」
それならば、私が生成すべき画像は「おじさん」だ。
それも「普通」のおじさん。
「普通のおじさん」画像であれば、直感的にAIだと気付かれないかもしれない。
こうして、ナチュラルな普通のおじさんを生成する戦いが始まった。
今回のゴール設定
「パッと見、“普通のおじさん”っぽく見える画像をAIで生成する」
その過程で、
- 生成AIのクセ
- プロンプト設計のコツ
- “普通さ”をどう言語化するか
を体験していく。
使うツール
- 画像生成:ImageFX
- 理由:コストがかからず、googleアカウントがあればすぐに使える
- プロンプト生成:Gemini、GPT、Claude
読者ターゲット
- 技術寄りの話を見たいけど、ガチガチの論文というよりは、少し息抜きできる記事を見たい人
第1章 【要件定義】 そもそも「普通のおじさん」とは誰なのか問題
「おじさん」と一言で言っても幅広い。
目指すのは「竹野○ 豊」や「阿○ 寛」のようなイケオジではない。「普通のおじさん」だ。
そもそも「普通のおじさん」とは何だろうか。
目を閉じていっしょに思い浮かべてほしい。
身近な人をイメージしよう。
私の場合はこうだ。
「SESの現場で業務をし、時には障害対応で残業して、木曜日頃には仕事の疲れが見えはじめ、金曜日には新橋のガード下で飲んで、帰りの電車の中で眠ってしまい、最寄り駅を寝過ごしてしまうおじさん」
他にはそうだな
- 白髪が混じった頭髪
- 年季の入ったビジネスバッグ
- 微妙にサイズが合っていないスーツ
- 特に意味のないため息
これだ。
私の若い頃に、SESの現場でたくさんのノウハウを教えてくれた、あのおじさん達だ。
このディテールこそが「普通」の正体。
AI美女に足りないのは、この「生活感」なのだ。
ここでいう“普通”はあくまで筆者の主観です
第2章 【実装フェーズ】 普通が生成できない
手始めに、思いつくプロンプトを使って、画像生成の感触を確かめてみようと思う。
パターン1:シンプルに指示
プロンプト:「50代の日本人男性、普通の見た目」
50-year-old Japanese man, ordinary appearance
...誰だこのダンディなおじさんは。
髪も服装も整いすぎている。
笑顔もさわやかすぎる。
私にとってこれは「普通のおじさん」ではない。「かっこいいおじさん」だ。
AIは「普通」という言葉を理解していないかもしれない。
あるいは、学習データに「普通のおじさん」が少ないのかもしれない。
考えてみれば当然だ。
誰が好き好んで普通のおじさんの写真をネットにアップするというのか。
「普通のおじさん」を連想させる具体的な特徴も加えていこう。
パターン2:具体的な特徴を足す
プロンプト:「薄い頭髪、グレーのポロシャツ、少し疲れた印象」
50-year-old Japanese man, thinning hair,
plain gray polo shirt, slightly tired expression
いいぞ。近づいてきた。
ただちょっと親戚のおじさん味が強い。
「背景」が家の中だからかもしれない。
シチュエーションも指示していこう。
パターン3:シチュエーションを与える
プロンプト:「地元のレストランで食事している、自然な状態」
a regular Japanese office worker in his 50s,
eating lunch at a local restaurant, candid photo style
これだ。
「一緒にランチに行って、隣に座っているおじさん」感が出た。
人物像だけでなく、シチュエーションも大事なんだ。
第3章 【発見】 「普通」を生むプロンプトの法則
このあと、数十回の試行錯誤で見えてきた法則がある。
【法則1】「普通」と書かない
→ 具体的な特徴の積み重ねで「普通」を構成する
【法則2】シチュエーションが命
→ 「定食屋で」「通勤電車で」など場面を指定すると自然になる
【法則3】「candid(自然体)」「casual snapshot」が効く
→ ポーズを取らせない指示が生活感を生む
【法則4】ネガティブプロンプトを活用
→ どうしてもかっこよくなりすぎる時がある。その時はネガティブプロンプトを書き、
handsome, model, celebrity, dramatic lighting などを除外する
第4章 【要件定義2】 リアリティのスパイスを足す
それでは、ここまでの学びを基にして、本格的に画像生成を進めていくとしよう。
生活感あふれるおじさん画像生成プロンプトを作るためにも、改めて、ここで「普通のおじさん」のスペックをより細かく定義する。
定義したスペック
- 年齢:45〜55歳くらい
- 体型:
- パターン①
- 体型:少しお腹が出ている、痩せすぎない
- 髪型:薄毛気味、白髪混じり、七三分け
- パターン②
- 体型:細身で引き締まっている
- 髪型:髪の毛はフサフサ、所々に白髪が混じっている、少しボサボサ
- パターン①
- 服装:ビジネスカジュアル、ワイシャツ、地味なネクタイ
- 表情:穏やかな笑顔、疲れた感じ
- 特徴:シワがある、完璧じゃない肌
この定義をベースに、私は数々のシチュエーションの「普通のおじさん」を生成した。
第5章 【実装フェーズ2】 完成した「普通のおじさん」たち
それでは、私のコレクションをお見せしよう。
炎上案件の火消しに投入された初日のおじさん
生成したプロンプト
A candid photo of an ordinary 50-year-old Japanese male IT engineer,
slim and lean build, full head of hair with gray streaks, slightly messy hair,
wearing a wrinkled light blue dress shirt with sleeves rolled up,
sitting at a messy desk covered with printed documents and sticky notes,
multiple monitors showing error logs and red warning messages,
expression of forced calm hiding deep anxiety and regret,
thousand-yard stare, sweating slightly on forehead,
dark circles under eyes, tight jaw, prominent cheekbones from stress,
fluorescent office lighting at night, empty energy drink cans nearby,
documentary style photography, shot on Sony A7IV, 35mm lens,
realistic, uncomfortable atmosphere
--ar 16:9 --v 6
おじさんが炎上案件に投入された初日。
ストレスで頬がこけ気味、髪は少し乱れている。
「何でこの案件受けた…」という後悔の表情が見て取れる。
若手エンジニアの転職相談を受けているおじさん
生成したプロンプト
A candid photo of an ordinary 50-year-old Japanese male IT engineer,
slim and lean build, full head of hair with gray streaks, neatly combed,
wearing a plain white dress shirt,
sitting across from a young person in a small meeting room,
listening with a complex expression mixing understanding and sadness,
slightly furrowed brow, gentle but tired eyes,
one hand touching his chin thoughtfully,
thin face showing years of experience and fatigue,
body language showing he has heard this many times before,
soft meeting room lighting, tissue box visible on table,
documentary style photography, shot on Canon EOS R5, 50mm lens,
melancholic atmosphere, realistic Japanese office setting
--ar 3:2 --v 6
落ち着いた雰囲気のおじさんが、若手の転職相談を聞いている。
「そうか…気持ちはわかるよ」という理解と寂しさが混じった表情だ。
自社帰社日に久しぶりに会ってホッとしているおじさん
生成したプロンプト
photorealistic, raw photo, average Japanese middle-aged man, 45 years old,
system engineer, slender body type, slim build, black short hair slightly messy,
wearing white shirt without tie, silver rimmed glasses, subtle stubble,
tired but sharp eyes, skin texture, high detailed, standing in a casual office meeting,
holding a can of beer, gentle relaxed smile, laughing softly, loosening collar,
rolled up sleeves, talking with blurred colleagues,warm indoor lighting,
comfortable atmosphere, candid photography style
派手に騒ぐのではなく、缶ビール片手に「いやー、やっと終わったよ」と苦笑いしながらリラックスしている様子のおじさん。
最後は、私がお世話になったベテランネットワークエンジニアのおじさん(イメージ)
生成したプロンプト
photorealistic, raw photo, Japanese man, early 60s, veteran network engineer,
completely bald head, shiny scalp, slightly large round eyes, cute eyes, innocent look,
serious expression but not angry, stern but caring, lecturing a young engineer,
pointing at a server rack, wearing blue work vest and white shirt,
server room background with many lan cables, depth of field, soft lighting, 8k
現場ではよく叱られた。特に「確認」することの大切さを教えてくれた。
所属会社は違ったが直属の部下のように指導してくれた。
今思えば、愛のある説教だった。その節は本当にお世話になりました。
最終章 【振り返り】 普通のおじさん生成から学んだこと
今回の戦いで学んだことがある。
AIが苦手なのは「普通(平均)」を生成することだ。
学習データには「映える」画像が多い。
美しい人、ドラマチックな構図、印象的なライティング。
AIはそれらを使って私たちに「忖度」をし、勝手に美化してしまう。
だからこそ「普通」は難しい。
平均値を出力させるには、意図的にノイズ(特徴)を入れる必要がある。
「普通」とは、特徴がないことではなく、「特徴的すぎない特徴の集合体」なのだ。
また、この記事を書いていて「部下への指示出し」にも通ずると感じた。
「普通にやって」では伝わらない。
「具体的にどういう状態が普通か」を言語化するスキルが問われる。
「パッと見、“普通のおじさん”っぽく見える画像をAIで生成する」という突拍子もないゴールを掲げて始まった今回の取り組みだったが、結果としてはたくさんのことを学ぶことができた。
ただ、次に記事を書く時は、さすがにもっと「普通」の記事にしようと思う。
私も、誰かにとっての「普通のおじさん」なのだから。
おまけ
おじさんだらけの記事で終わるのも何なので、AIっぽくない「AI美女」の画像生成にも本気で挑戦してみた。
生成したプロンプト
Ultra-realistic high-resolution photograph of a young Japanese woman with long black hair and bangs, dressed in a glamorous gold and black off-shoulder frilly dress with ruffles and ribbons. She is seated gracefully on a red, fancy, and ornately decorated chair, with intricate carvings and a luxurious cushion. Her hands are gently resting on the chair, and she is looking directly at the camera with a soft and delicate expression. The lighting is professional, capturing her natural beauty with soft shadows and highlights. The background is a dreamy, softly blurred black, enhancing the elegant and enchanting atmosphere. Shot with a full-frame DSLR camera, 85mm lens, and cinematic lighting, ensuring ultra-realistic skin texture, fabric details, and natural depth of field. No illustration, no anime, only professional photography with high-quality studio lighting
いかがだったでしょうか。
生成したプロンプト(いらないかもしれませんが載せておきます)
Ultra-realistic high-resolution photograph of an ordinary middle-aged Japanese male IT engineer, with short black hair and slight wrinkles around his eyes, dressed in a black and gold off-shoulder frilly outfit with ruffles and ribbons, his shoulders exposed. He is seated calmly on a red, fancy, and ornately decorated chair, with intricate carvings and a luxurious cushion. His hands are gently resting on the chair, and he turns slightly toward the camera, gazing slightly upward toward the lens with a soft and delicate expression. The lighting is professional, capturing his natural skin texture, the fabric details of his outfit, and soft shadows and highlights. The background is a dreamy, softly blurred black bokeh, enhancing the elegant and slightly surreal atmosphere. Shot with a full-frame DSLR camera, 85mm lens, and cinematic lighting, ensuring ultra-realistic skin texture, fabric details, and natural depth of field. No illustration, no anime, only professional photography with high-quality studio lighting, average appearance, not a model, not handsome.
おしまい








