はじめに
がちもとさんアドベントカレンダー8日目の記事です。
今日は、OpenAIのGPT-4V(画像説明)でもうちょっと遊んでみます。
実装方法はこちらです。
開発環境
- Windows 11 PC
- Python 3.11
実行結果
画像 |
説明 |
|
Q. 点字ブロックは映っていますか? A. はい、この写真には点字ブロ ックが映っています。床に黒色で目立つ直線状のガイドとして 設置されているのが 点字ブロックです。これは視覚障害者が歩行時に道を見つけやすくするためのもので、特に公共の場所でよく見られます。写真には、その点字ブロックが直進方向に伸びているのが確認できます。 |
|
Q.点字ブロックは映っていますか? A. いいえ、この写真には点字ブロックは映っていません。点字ブロックは、視覚障害者が歩行時に道を認識しやすくするための舗装材で、通常、地面に隆起した点や線が特徴です。この写真には、そういった特徴は見られません。フロアは様々な色のタイルで装飾されているように見えますが、点字ブロックではないようです。 |
|
Q. 現在位置はどこですか? A. この写真は、熊本市のエリアガイドという地図が掲示されている看板のようです。看板には「周辺案内」と記載されており、熊本市の主要な施設や道路が表示されています。写真だけでは看板が設置されている正確な場所を特定することはできませんが、熊本市内にあることは明らかです。熊本城や市街地が地図に描かれていることから、訪問者はこの地図を参考に周辺を探索することができるでしょう。具体的な場所や目的地を確認するためには、地図上の目印やインデックス、道路名などを見る必要があります。 |
|
Q. 花畑町はどっちですか? A. 花畑町(Hanabatacho)は左方向にあります。 |
|
Q. 何が映っていますか? A. この写真にはエスカレーターが映っています。エスカレーターの両側には手すりがあり、上がりと下がりの二つのエスカレーターが写されています。エスカレーターの近くには階段も見えます。そして、通路の床には滑り止めのマットが敷かれており、「B」の文字が マットに印刷されているので、これはおそらく地下階を表していると思われます。また、天井には照明が設置されており、照明からの光がエスカレーターを照らしています。避難経路を示す緑色の出口標識も画像の上部に見えます。 |
通常なら画像分類や物体検出をして、そこに点字ブロックやエスカレーターがあるとか理解させる必要があったのですが、画像説明でできちゃうとは思ってもみなかったです。マジでどうやってるんですかね、、もう人間みたいだし、可能性しかないですね。
お疲れさまでした。