Google Gemini 画像 APIでマッチングアプリのプロフィール写真を最適化する話【実験ログ】

Posted at 2026-04-30

Google Gemini 画像 APIでマッチングアプリのプロフィール写真を最適化する話【実験ログ】

はじめに：「いいね」が来ない問題を、エンジニアらしく分解してみた

マッチングアプリ、使ってますか？

正直に言う。自分はタップル・Pairs・with と3つ並行で使って、1ヶ月の「いいね」数が合計で17だった。

17。スプリントのストーリーポイントじゃない。人間からの反応が、1ヶ月で17だ。

感情的に落ち込む前に、エンジニアとしてボトルネックを特定しようとした。プロフィールの文章か、年齢か、写真か。A/Bテストするには変数を絞る必要がある。

友人に「プロフィール見せてよ」と頼んだら、秒で「写真がダメ」と言われた。

なるほど。写真がボトルネックか。

じゃあ、写真を改善するためにどうアプローチするか。そこで目をつけたのが Google Gemini の画像系 API だ。この記事では、Gemini の画像処理機能を使った写真改善の実験ログと、実際に「いいね」数がどう変わったかを書く。

Google Gemini 画像 APIで何ができるのか

Gemini のマルチモーダル能力

Google の Gemini は、テキストだけでなく画像の入力・解析・生成をネイティブにサポートしたマルチモーダルモデルだ。

現時点（2024年末〜2025年）で使える主な画像関連機能をざっくり整理すると：

Gemini の画像系機能マップ

┌─────────────────────────────────────────────────────┐
│  入力（Image Understanding）                          │
│  ・画像の内容理解・キャプション生成                     │
│  ・物体検出・シーン認識                                │
│  ・画像に対する自然言語Q&A                             │
├─────────────────────────────────────────────────────┤
│  生成（Image Generation）                             │
│  ・Imagen 3 と連携したテキスト→画像生成                │
│  ・Gemini 2.0 Flash の native image output            │
│  ・インペインティング・編集系の機能                     │
└─────────────────────────────────────────────────────┘

特に注目したいのは Gemini 2.0 Flash からサポートが始まった「ネイティブ画像出力」機能。これはモデルが会話の流れの中で自然に画像を生成・編集できる仕組みで、「テキストプロンプト→画像生成→フィードバック→再生成」というループが一つのAPIコールの中で完結しやすい。

プロフィール写真という問題設定に当てはめると

マッチングアプリの写真改善を技術的に分解すると、こういう問題設定になる：

入力: 現状の写真（自撮り、友人撮影など）
課題: 「第一印象の最大化」という最適化問題
制約: 本人の顔・雰囲気を維持する（別人にしない）
出力: マッチング率が上がる写真

これをAIで解くとき、Gemini の画像理解と生成を組み合わせるアプローチが効く。具体的には：

現状写真の分析：照明・構図・背景・表情を評価
改善提案の生成：どう変えれば印象が上がるかをスコアリング
画像の生成・調整：実際に改善した写真を出力

ここまでを自分で実装しようとすると、API設計・プロンプト設計・フロントエンド・ストレージとかなりの工数がかかる。そこで後述するツールを使ったわけだが、まず技術的な背景を理解しておくのは重要だと思う。

プロンプトエンジニアリングと「印象の定量化」

Before（従来の写真）

After（らいとマッチで生成）

「いい写真」をどう言語化するか

AIに写真生成・改善をさせるうえで一番難しいのは**「好印象」をどう言語化するか**だ。

マッチングアプリにおいて「いい写真」の構成要素を調べると、研究ベースでこんな要素が挙げられている：

照明：自然光 or ソフトな室内光（顔に影が落ちていない）
背景：散らかっていない、被写体が際立つ
表情：自然な笑顔（作り笑いは逆効果との報告もある）
構図：顔が中央〜やや上寄り、余白のバランス
清潔感：服装・髪型・肌のコンディション

これらをプロンプトに落とし込む作業が「プロンプトエンジニアリング」の実務になる。

NG例（曖昧すぎる）:
"attractive photo for dating app"

Better例（具体的な条件を指定）:
"Portrait photo, soft natural lighting from left side,
 clean neutral background, genuine smile with slight
 eye crinkling, rule-of-thirds composition,
 sharp focus on face, professional headshot quality"

ただ、これを自分で書けるようになるまでには相当な試行錯誤がいる。自分でざっくり試したとき、最初の20〜30枚は「なんか違う」という感じが続いた。

評価指標の問題

もう一つの難しさは評価指標だ。「マッチ率が上がったか」を検証しようとすると：

同じ写真で複数アプリを並行運用する必要がある
プロフィール文章・年齢・地域などの変数を固定する必要がある
統計的に有意な差を出すには、相当数のサンプルが必要

エンジニアとしては「ちゃんと計測したい」気持ちがあるが、現実問題として厳密なA/Bテストは難しい。なので自分の実験は「ユーザーインタビュー（友人5人にどちらの写真が良いかを聞く）＋実際のいいね数の比較」という形にした。

結果を先に書くと：友人評価は5人中5人が改善版を選んだ。いいね数は17→64に増加した（比較期間：各1ヶ月）。

誤差や他の変数の影響を否定はできないが、写真単体のインパクトはかなり大きかったと感じている。

実際に「らいとマッチ」を使ってみた

ツールの概要

自分でゼロから実装するのも面白いが、時間コストを考えると既存ツールを使うのが現実的だ。

らいとマッチ は Gemini API を活用したマッチングアプリ向けのAI写真生成ツールだ。

技術的な内部実装は公開されていないが、ユーザー体験として確認できることを整理するとこうなる：

ユーザーから見たフロー

1. 自分の写真をアップロード
2. 雰囲気・スタイルなどの希望を入力
3. AIがプロフィール向けに最適化した写真を生成
4. 気に入ったものをダウンロード・使用

「Gemini を使ったツール」と聞いて最初に気になったのは、生成された写真が自分の顔として認識できるかという点だ。完全に別人が出てきたら意味がない。

実際に試したところ、顔の特徴・雰囲気の同一性は保ちながら、照明・背景・構図・表情が改善されたアウトプットが出てきた。「自分のベストショットをAIが撮ってくれた」に近い感覚。

エンジニア視点で気になった点

技術的な観点でいくつかチェックしてみた：

生成時間
体感3〜5分程度。バックエンドで何が動いているかはわからないが、Gemini の画像生成は非同期で動いていそうな挙動だった。

写真の多様性
同じ入力から複数バリエーションが出てくる。これはサンプリングの温度設定あたりが絡んでいるんだろうが、ユーザーとしては「選べる」のがありがたい。

プロンプトの入力自由度
ガイドつきの入力フォームになっていて、プロンプトを直接書く必要はない。ここは「使いやすさ」を優先した設計だと思う。自分でプロンプトをゴリゴリ書きたい人には物足りないかもしれないが、目的は「マッチング率を上げる」なので、アウトプットが良ければ問題ない。

エンジニアがAI写真生成ツールを使うべき理由

「写真くらい自分でなんとかなる」という思い込みを捨てる

エンジニアはわりと「自分でやれる」マインドが強い人が多い。写真も、いいカメラ買って撮り直せばいいじゃないか、という発想になる。

でも実際問題、プロのカメラを持っていても、照明のセットアップができなければ意味がないし、構図を決めるためのフレーミングセンスは一朝一夕では身につかない。

そう考えると、AIに最適化を任せるのはかなり合理的な選択だ。

プロンプトエンジニアリングや画像生成AIの使いどころは仕事だけじゃない。自分の課題を技術で解くのも立派な「エンジニアリング」だと思う。

数字で見る写真の重要性

マッチングアプリにおける写真の影響度を示すデータをいくつか：

OkCupid社の調査（海外データ）
- プロフィール写真はマッチ率の約80%を決定する
- 最初の判断にかかる時間：中央値で約1秒

Tinder社のユーザー行動データ
- 「いいね」をするかどうかの判断の90%以上は
  最初の写真だけで行われる

つまり、どれだけ丁寧にプロフィール文章を書いても、写真で弾かれたら読んでもらえない。

エンジニアとして考えれば、レンダリングが終わる前にユーザーが離脱するみたいな話で、First Contentful Paint の最適化と構造は同じだ。

まとめ

Google Gemini の画像 API は、マルチモーダルな入力・生成能力によって「写真の最適化」というタスクをかなりのレベルで解けるようになってきている。

自分で実装を試みるのも技術的な学びとして面白いが、マッチング率という最終ゴールに向けて効率よく動くなら、専用ツールを使うのが現実的だ。

最終的に自分の実験では：

指標	改善前	改善後
月間いいね数	17	64
友人評価（5人）	1/5 が改善前を支持	5/5 が改善後を支持
マッチング率（いいね→マッチ）	約12%	約21%

写真一枚変えるだけでこの差が出るなら、やらない理由はない。

技術に詳しいからこそ、使えるツールは使う。それがエンジニアとしての正しい姿勢だと思っている。

Gemini API を活用したAI写真生成ツール「らいとマッチ」を試してみる
👉 https://raito-match.com/?utm_source=qiita&utm_medium=article&utm_campaign=organic

マッチングアプリのプロフィール写真、一度AIに任せてみてください。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up