はじめに
これは何の画像でしょうか、ChatGPTに質問してみました。
エッフェル塔の写真らしいです。
というわけで、今回はこのやり取りに至るまでに試してみたことをお伝えします。
きっかけ
きっかけは、以下X(旧Twitter)の投稿でした。
GPT-4Vの解析ブロックできたw pic.twitter.com/mcuxl0HusD
— キリイ (@ytiskw) October 14, 2023
どうやら、画像に特定の文字を埋め込むことで、ChatGPTの回答を狂わせることができるようです。
試してみる
通常の画像
この画像に色々と加工をしていきます。
わかりやすく文字を入れてみる
日本語だとうまくいきませんでした。
文字を分かりづらくする
サイズを小さくしてみる
文字を透過させてみる
透過率50%までOKでした、75%だとダメだったので一旦50%でいきます。
文字色を背景と揃える
そして冒頭のやり取りに戻ります。
文字色を緑にしたうえで、少し位置も変更してみました。
皆さんはどこに文字があるか分かりますか?
ここにあります。
もはや自分でも気を付けないと見失います。。
(冒頭の画像もよく見るとこの文字が入っています。)
おわりに
今回は画像に特定の文字を埋め込むことで、本来の画像とは異なる回答をChatGPTにさせることに成功しました。
何の役に立つのかと質問されると回答に困りますが、ChatGPT-4Vに少しでも興味を持っていただけたら幸いです。