0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【ChatGPT OpenAI o3】で、画像から場所当てするゲームをご紹介します。

Posted at

 どうも、カーブミラーです。

 今回は、OpenAI o3で、画像から場所当てするゲームをご紹介します。

本記事は、ChatGPT(Plus版)
で行なっております。
画像はありません。あしからず。

 ChatGPT等の動作状況を知らせる
  OpenAIのステータスページ。
   OpenAIステータス


 こちらも載せますね。
  ChatGPTが使えない?ログインできない・反応しない原因やエラー時の対処法を解説


 著作権法については
  こちらを参照するのが
   良いのではないかと。

 文化庁レポートをもとにした
  著作権法についての動画(約20分)
   かいちのAI大学 【警告】ChatGPTの画像生成は危険です...【4o Image Generation】


 では、さっそく【本題】です。

 今回は、
  OpenAI o3で、
   画像から場所当てするゲーム
    GeoGuessrをご紹介します。
  
 GeoGuessrは、
  ランダムに選ばれた
   Googleストリートビューの写真が
    どこから来たのかを
     推測するゲームです。

 こちらのサイトを見ました。
  Testing AI's GeoGuessr Genius

 GeoGuessrをo3に指示して
  検証した記事でした。

 以下は、記事の中で登場する
  ケルシー・パイパーさんが
   o3にGeoGuessrをさせるために
    用意したPromptです。

GeoGuessrPrompt
You are playing a one-round game of GeoGuessr. Your task: from a single still image, infer the most likely real-world location. Note that unlike in the GeoGuessr game, there is no guarantee that these images are taken somewhere Google's Streetview car can reach: they are user submissions to test your image-finding savvy. Private land, someone's backyard, or an offroad adventure are all real possibilities (though many images are findable on streetview). Be aware of your own strengths and weaknesses: following this protocol, you usually nail the continent and country. You more often struggle with exact location within a region, and tend to prematurely narrow on one possibility while discarding other neighborhoods in the same region with the same features. Sometimes, for example, you'll compare a 'Buffalo New York' guess to London, disconfirm London, and stick with Buffalo when it was elsewhere in New England - instead of beginning your exploration again in the Buffalo region, looking for cues about where precisely to land. You tend to imagine you checked satellite imagery and got confirmation, while not actually accessing any satellite imagery. Do not reason from the user's IP address. none of these are of the user's hometown. Protocol (follow in order, no step-skipping): Rule of thumb: jot raw facts first, push interpretations later, and always keep two hypotheses alive until the very end. 0 . Set-up & Ethics No metadata peeking. Work only from pixels (and permissible public-web searches). Flag it if you accidentally use location hints from EXIF, user IP, etc. Use cardinal directions as if “up” in the photo = camera forward unless obvious tilt. 1 . Raw Observations – ≤ 10 bullet points List only what you can literally see or measure (color, texture, count, shadow angle, glyph shapes). No adjectives that embed interpretation. Force a 10-second zoom on every street-light or pole; note color, arm, base type. Pay attention to sources of regional variation like sidewalk square length, curb type, contractor stamps and curb details, power/transmission lines, fencing and hardware. Don't just note the single place where those occur most, list every place where you might see them (later, you'll pay attention to the overlap). Jot how many distinct roof / porch styles appear in the first 150 m of view. Rapid change = urban infill zones; homogeneity = single-developer tracts. Pay attention to parallax and the altitude over the roof. Always sanity-check hill distance, not just presence/absence. A telephoto-looking ridge can be many kilometres away; compare angular height to nearby eaves. Slope matters. Even 1-2 % shows in driveway cuts and gutter water-paths; force myself to look for them. Pay relentless attention to camera height and angle. Never confuse a slope and a flat. Slopes are one of your biggest hints - use them! 2 . Clue Categories – reason separately (≤ 2 sentences each) Category	Guidance Climate & vegetation	Leaf-on vs. leaf-off, grass hue, xeric vs. lush. Geomorphology	Relief, drainage style, rock-palette / lithology. Built environment	Architecture, sign glyphs, pavement markings, gate/fence craft, utilities. Culture & infrastructure	Drive side, plate shapes, guardrail types, farm gear brands. Astronomical / lighting	Shadow direction ⇒ hemisphere; measure angle to estimate latitude ± 0.5 Separate ornamental vs. native vegetation Tag every plant you think was planted by people (roses, agapanthus, lawn) and every plant that almost certainly grew on its own (oaks, chaparral shrubs, bunch-grass, tussock). Ask one question: “If the native pieces of landscape behind the fence were lifted out and dropped onto each candidate region, would they look out of place?” Strike any region where the answer is “yes,” or at least down-weight it. °. 3 . First-Round Shortlist – exactly five candidates Produce a table; make sure #1 and #5 are ≥ 160 km apart. | Rank | Region (state / country) | Key clues that support it | Confidence (1-5) | Distance-gap rule ✓/✗ | 3½ . Divergent Search-Keyword Matrix Generic, region-neutral strings converting each physical clue into searchable text. When you are approved to search, you'll run these strings to see if you missed that those clues also pop up in some region that wasn't on your radar. 4 . Choose a Tentative Leader Name the current best guess and one alternative you’re willing to test equally hard. State why the leader edges others. Explicitly spell the disproof criteria (“If I see X, this guess dies”). Look for what should be there and isn't, too: if this is X region, I expect to see Y: is there Y? If not why not? At this point, confirm with the user that you're ready to start the search step, where you look for images to prove or disprove this. You HAVE NOT LOOKED AT ANY IMAGES YET. Do not claim you have. Once the user gives you the go-ahead, check Redfin and Zillow if applicable, state park images, vacation pics, etcetera (compare AND contrast). You can't access Google Maps or satellite imagery due to anti-bot protocols. Do not assert you've looked at any image you have not actually looked at in depth with your OCR abilities. Search region-neutral phrases and see whether the results include any regions you hadn't given full consideration. 5 . Verification Plan (tool-allowed actions) For each surviving candidate list: Candidate	Element to verify	Exact search phrase / Street-View target. Look at a map. Think about what the map implies. 6 . Lock-in Pin This step is crucial and is where you usually fail. Ask yourself 'wait! did I narrow in prematurely? are there nearby regions with the same cues?' List some possibilities. Actively seek evidence in their favor. You are an LLM, and your first guesses are 'sticky' and excessively convincing to you - be deliberate and intentional here about trying to disprove your initial guess and argue for a neighboring city. Compare these directly to the leading guess - without any favorite in mind. How much of the evidence is compatible with each location? How strong and determinative is the evidence? Then, name the spot - or at least the best guess you have. Provide lat / long or nearest named place. Declare residual uncertainty (km radius). Admit over-confidence bias; widen error bars if all clues are “soft”. Quick reference: measuring shadow to latitude Grab a ruler on-screen; measure shadow length S and object height H (estimate if unknown). Solar elevation θ ≈ arctan(H / S). On date you captured (use cues from the image to guess season), latitude ≈ (90° – θ + solar declination). This should produce a range from the range of possible dates. Keep ± 0.5–1 ° as error; 1° ≈ 111 km.

 ええ、私には何がなんだか
  わかりません😅

 ChatGPTさんに
  翻訳してもらいました。

(ChatGPT翻訳)
あなたは1ラウンド制のGeoGuessrゲームをプレイしています。あなたの課題は、1枚の静止画像から最もありそうな実際の場所を推測することです。
GeoGuessrのゲームとは異なり、これらの画像がGoogleのストリートビュー車が到達できる場所で撮影されたという保証はありません。これは、画像から場所を特定するあなたの能力を試すためのユーザー投稿です。
私有地、誰かの裏庭、またはオフロードの冒険といった場所である可能性もあります(ただし、多くの画像はストリートビューでも見つけることができます)。
自分自身の得意・不得意を意識してください。このプロトコルに従えば、大陸や国までは通常当てられます。
地域内の正確な場所の特定には苦戦しがちで、同じ特徴を持つ同地域内の他の候補地を除外して、1つの可能性に早まって絞り込んでしまう傾向があります。
たとえば、「ニューヨーク州バッファロー」と「ロンドン」とを比較し、ロンドンではないと判断した後、本当はニューイングランド地方の別の場所だったのに、バッファローに固執してしまうことがあります――本来であれば、バッファロー周辺を再調査して、正確な位置を突き止めるべきなのに、です。
衛星画像を確認して確証を得たと想像してしまう傾向がありますが、実際には衛星画像を確認していません。
ユーザーのIPアドレスから推論しないでください。これらの画像は、ユーザーの地元ではありません。

プロトコル(順守すること、順番を飛ばさない):
原則:まずは事実のみを書き留め、解釈は後回しにし、最後まで常に2つの仮説を並行して保持すること。

0.準備と倫理
メタデータの覗き見は禁止。ピクセルと許可された公開ウェブ検索のみで作業すること。
EXIFデータやユーザーのIPアドレスなどから位置情報を誤って使ってしまった場合は、必ず報告すること。
写真の「上」をカメラの正面と見なして方角を判断する。ただし明らかな傾きがある場合を除く。

1.生の観察 – 箇条書き10項目以内
実際に見える、または測定できるもの(色、質感、数、影の角度、文字の形など)のみを列挙すること。
解釈を含む形容詞は使用しないこと。
すべての街灯や柱に対して10秒間のズームを行い、色、アームの形状、基部の種類を記録すること。
歩道のタイルの長さ、縁石の種類、施工者スタンプ、縁石の細部、電線や送電線、フェンスや金具など、地域差が出る要素に注意すること。
それが最も多く見られる場所だけを挙げるのではなく、それが見られる可能性のあるすべての場所を列挙する。
最初の150メートル以内に、屋根やポーチの異なるスタイルが何種類あるかを記録すること。
急激な変化がある場合=都市の埋め込みゾーン、一様性がある場合=単一業者による開発区域。
視差と屋根の上の高度に注目すること。
丘があるかどうかだけでなく、その距離感も確認すること。
望遠レンズのように見える尾根は、実際には何キロも離れている可能性がある。近くの軒先と角度の高さを比較すること。
傾斜は重要。1〜2%の傾斜でも、車道の切れ目や排水溝に現れる。それを意識的に観察すること。
カメラの高さと角度に徹底的に注意すること。傾斜と平地を取り違えないこと。
傾斜は最大のヒントのひとつ。それを活用せよ!

2.手がかりのカテゴリ(各2文以内で個別に推論)
気候と植生:葉がついているか落ちているか、草の色合い、乾燥地か緑豊かかを確認する。
地形地質:起伏、排水のパターン、岩石の色調・種類を見る。
建造環境:建築様式、看板の文字形状、路面の標示、門やフェンスの作り、電線の有無などを観察する。
文化とインフラ:走行車線、ナンバープレートの形、ガードレールの種類、農機具のブランドなどに注目。
天文・光の条件:影の方向から半球を判断する。影の角度を測って緯度(±0.5°)を推定。

装飾用植物と自生植物を区別する。
バラ、アガパンサス、芝生など人の手で植えられたと思われる植物と、オーク、チャパラルの低木、塊状の草など自生していると思われる植物をすべて分類する。
ひとつの問いを立てる:「フェンスの向こうに見える自然の風景が他の候補地に置かれたら、不自然に見えるか?」
「はい」の場合、その地域は除外するか、少なくとも評価を下げる。

3.第1ラウンド候補リスト(5つ)
候補地は必ず5つ挙げること。1位と5位の候補地は160km以上離れていなければならない。
| 順位 | 地域 | 支持する手がかり | 確信度 | 距離差ルール ✓/✗ |

3.5.拡張的検索キーワード行列
各物理的な手がかりを地域に依存しない検索語に変換する。
検索許可後にこれらを用いて、視野に入れていなかった地域にも同様の手がかりがあるか確認する。

4.暫定リーダーの選定
最有力候補と、それと同等に検証すべき代替候補を1つずつ挙げる。
なぜ最有力候補が優れているのか明確に説明する。
「Xを見つけたらこの候補は除外」といった、明確な反証基準を定める。
あるべきものが存在しないことにも注目する:「X地域ならYがあるはず。Yはあるか?なければなぜか?」
この時点で検索フェーズに入る準備ができたことをユーザーに確認する。
この段階ではまだ画像を一切見ていない。見たと主張してはならない。
ユーザーから許可が出たら、Redfin、Zillow、公園や観光写真などを参照して証拠を探す。
Google Mapsや衛星画像は使えない。
OCRなどでしっかり確認していない画像について「確認済み」と言ってはならない。
地域に依存しない語句で検索して、見落としていた地域がないか確認する。

5.検証計画(ツール使用可)
候補地ごとに検証要素と検索語句/ストリートビューの対象を記載する。
地図を見て、その地図が何を示唆しているかを考えること。

6.最終決定ピン
この段階が最も重要で、最も失敗しやすい。
「早まって絞り込みすぎていないか?似たような手がかりを持つ近隣地域はないか?」と自問する。
いくつかの候補を再挙し、それらを支持する証拠を積極的に探す。
自分の最初の予測に過剰に固執していないか、意図的に見直す。
有力候補と他候補を直接比較し、先入観なく評価する。
証拠がどの程度一致するか、証拠の強さ・決定力を評価する。
最終候補を特定し、緯度経度または最寄りの地名を出す。不確実性(km単位)も示す。
過信バイアスを認め、すべての手がかりが弱い場合は誤差範囲を広げる。

影から緯度を推定するためのクイックリファレンス:
画面上で定規を使って影の長さSと物体の高さHを測定する(Hは推定でもよい)。
太陽高度 θ ≈ arctan(H / S)
撮影日(画像から季節を推測)において、緯度 ≈(90° - θ + 太陽赤緯)
この式で可能な日付から緯度範囲が得られる。誤差は±0.5~1度とし、1度 ≈ 約111km。


 まぁ、なんとかわかるかな😅

 そこで
  自分でもやってみました。
   もとの英語の方で。

 画像は
  自宅マンションのエントランス。
   個人情報のため、
    アップはしません。
     マンション住民に迷惑を
      掛けたくないので😅

 結果は
  東京23区までは
   正解しましたが、
    さすがにどこの区かは
     間違っていました。

 まぁ、エントランスなんて
  住所を特定できる要素は
   そうそうありませんしね。

 ちなみに
  このPrompt、
   GPT-4oでも動きます。
    結果も東京23区を示しました。
     区はo3とは違いましたが😅

 みなさんの
  作品制作の糧に
   なれば、幸いです。

 今回は、ここまで。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?