移動軌跡・人流データに関する調査メモ
人流データ・移動軌跡を可視化・分析に関する研究をしらべ自分用のメモを残します。(2024年4月12日現在)
自分用のメモですが一応、私は「アカデミックな人でも数理が得意な人でもデータサイエンスが得意な人でもないので正確さにかける」と断っておきます。
はじめに
人流データ・移動軌跡データは、可視化・分析するために考えることが多いと感じました。
なぜならば、
- 画一的なフォーマットが無い(データセット固有の特徴がある)
-
取得頻度や1トレースあたりの長さがきれいではない(データもある)
- どうやってデータを補完するかによってデータが大きくかわってしまう
- 個人情報保護のため、なんらかの制約がある(場合がある)
などのためです。
また、単純にデータ量が大きくなりがちであり、観察したい対象・期間を効率的に絞り込む何らかの手法が無ければ、データの前処理すら難しくなる場合がある点も挙げられます。
データセット固有の特徴として例えば…
kaggle - Taxi Trajectory Data
- このデータは、1行の軌跡(緯度経度の組のリスト)が入っている
- 緯度経度の組ごとの間隔は15秒とされ、長さはまちまち
- そして、賃走中のデータであり、常に動いている前提(滞留はない)
など
リストを平たく伸ばそうとしてえらい目をみた
可視化・分析の手法などについて
可視化・分析の方向性として、
- 何らかの方法で記号・文字列化し、パターンマッチ・テキストマイニング的な手法で人の流れを解析する
- [?] 室内などの限られた空間で行われている→広範囲への適応?
- 「滞留」している地点に着目し分析する
- [?] 「滞留」を検出する手法についてよく検討する必要がある
- 緯度経度をグラフ理論的に扱える形に集約・変換する
- [?] 着目するもの・前処理などについて
- 移動軌跡をベクトルと見なしてあつかう
- [?]長さ?
などがあげられるようです。
([?]
はその時感じた疑問点)
参考文献
ざっと系統別にメモ
参考文献の参考文献、研費、共同研究云々を当たれば大体いま机の上に刷ってある情報は引けるはず…
概要などの調査
- Big Trajectory Data Mining: A Survey of Methods, Applications, and Services
滞留に着目した研究
- 携帯端末から得られる低頻度測位な人流ビッグデータを用いた通勤・通学の推定及び分析
- 人流ビッグデータを用いたイベント参加前後の人々の滞留分析
人流データをネットワークとして扱う
- 人流データのクラスタリング手法に対する一考察
人流データを文字列化する
- Universal SAX: 空間充填曲線を利用したSAXの多次元時系列データへの適用
- 文字列化による人流データの圧縮と可視化
- 複数の時系列データの関連性発見に基づく言語化の一考察
観察すべき対象が定まっているならば&他に属性などのデータがあればこういう事も出来る?
- スマホ・アプリ型回遊調査データによる熊本都心部回遊行動圏の分析