#初めに
この記事は自分用の論文まとめです。
またPOIの論文を読むのが初めてなのでわからない単語そのままです。
#論文
タイトル : POI Atmosphere Categorization Using Web Search Session Behavior(Web検索セッションの動作を使用したPOI雰囲気の分類)
URL : http://hayatokobayashi.com/paper/SIGSPATIAL2020_Tsubouchi_preprint.pdf
発表 : SIGSPATIAL '20: Proceedings of the 28th International Conference on Advances in Geographic Information Systems
#前提用語
POI : Point Of Interest の略、興味を持たれている特定の場所。つまり、ただの特定の場所という意味?
https://www.esrij.com/gis-guide/gis-other/point-of-interest/
DSSM : 検索クエリと検索ドキュメントの関連度を計算する教師ありDeep Learningのモデル
https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/cikm2013_DSSM_fullversion.pdf
LSTM : long-short-term-memoryの略、自然言語処理における深層学習のモデルの1つ
#0.概要
POIの雰囲気、つまり特定の場所の雰囲気によってカテゴリ分類するのは物件検索サービス等の商用サービスに便利である。
そこでPOIの雰囲気を捉える新しい分類方法を提案する。
#1.イントロ
同じ公園でもサラリーマンが多い公園と子供が多い公園では雰囲気は別物なので、その差を表したい。
POIに関連する検索をする人はその公園に関する予備知識を持っている場合が多い。POIの検索クエリと一緒に検索されるクエリにはその場所の雰囲気が含まれると考える。
検索クエリとクリックされた文章との関連度を計算するDSSMというモデルを使用する。ここではPOIに関連する検索クエリとその次に検索されたクエリは関連すると考え、その多数のペアを用いてDSSMをトレーニングする。
#2.提案手法
2.2データ
同一人物の検索履歴を取得する。その履歴の中で一定時間以内の間隔で検索された内容を1つの組とする。その組の単語群のペアを全通り取得し、それをデータとして用いる。
2.3DSSM訓練
3層のLSTMを用いてクエリ$Q$をエンコードする。それを$f(Q)$とする。これはいうならば、クエリの座標となる。
これを用いて2つのクエリ間の距離を計算する。これにはコサイン類似度を用いる。
$R(Q,Q')=\frac{f(Q)^Tf(Q')}{||f(Q)|| ||f(Q')||}$
そしてこの距離を用いて、あるクエリ$Q$が与えられた後にクエリ$Q_0$がくる確率を以下に示す。
$p(Q_0|Q)=\frac{exp(\beta R(Q,Q_0))}{\sum^K_{k=0} exp(\beta R(Q,Q_0))}$
また損失関数は以下のように計算する。
クエリ$Q$の後に実際に検索されたクエリを$Q_0'$としたときの$p(Q_0'|Q)$が最大化すればよく、つまりクロスエントロピーロスを用いる。
$\sum -\log{p(Q_0'|Q)}$
この損失関数を最小化する。
#3実験
訓練したDSSMを使って、検索クエリのマッピングを行い、そのマッピング値を使って結果を調べる。
##3.2 クエリエンコーダの特徴
コサイン類似度をクエリ間の類似スコアと考える。
『新宿』と『横浜』のスコアが0.7で高い!
『熱海』と『湯布院』のスコアが0.77で高い!
『富士山』と『富士通』のスコアが0.25で同じ単語がクエリ内に含まれていても低い!
『美しが丘公園』と綴りミスの『美しくしがおかこうえん』のスコアは0.79と高い!
単語の雰囲気が取れてそうなことが分かる。
##3.3公園およびその他のPOIの分類
公園、建物、レストラン街をマッピングすると、既存手法ではうまく分かれてくれないが、新しい手法だとかなり綺麗に分かれる。
渋谷ヒカリエは建物なのにレストラン街に近いマッピングになってしまってるが、渋谷ヒカリエにはレストランが多く入っているので直感的には理解できるマッピングとなっている。
(論文内の図5)
##3.5公園の雰囲気を現実の世界につなぐ
実際の公園の例を見ると、雰囲気が取れてる!すごい!
#5結論
検索クエリを使って、POIの雰囲気をつかんだ。
検索クエリは地理情報処理にも使える!
地理リソースも使えばより発展できそう。
#私的なまとめ
今までのPOIの分類法
地理におけるユーザーの行動、地理の空間的特徴
→これでは場所の雰囲気を捉えられない
場所を検索した次の検索にはその場所の情報を含まれる?
→その検索クエリを利用してその場所の雰囲気を捉える。
DSSM
3層LSTMによってクエリをマッピングする。
マッピングからコサイン類似度、事後確率を計算する。
真のクエリペアの事後確率をクロスエントロピーロスを損失関数として用いて最大化
→マッピングを学習
学習したDSSMを使ってクエリをマッピングして比較。
→直感的な雰囲気の理解ができてそう。
検索クエリは自然言語処理以外にも地理情報処理の有用!
自然言語処理と地理情報処理の架け橋的になった?