はじめに
技研商事インターナショナルの柿沼です。
Location Tech Advent Calendar 2021 by LBMA Japan 🛰 Advent Calendar 2021の11日目の投稿となります。
位置情報と関連するテーマとしてデータの按分について簡単にですが書いてみました。
データの按分
「施設への来訪者の居住地データを町丁目単位で入手したがメッシュ単位での分析をしたい!」
このようなケースでデータの按分を検討することになりますが、シンプルな面積按分とその他の按分について比較してみました。
面積按分
面積按分とはその名の通り面積に応じてデータを配分する方法です。
例えば、上図での青枠の町丁目内に居住する来訪者100人を赤枠の3つのメッシュへ按分する時、町丁目の面積が3つのメッシュへ56%、43%、1%と属しているならば、来訪者100人をそれぞれ56人、43人、1人と配分する、ということになります。
面積按分以外
実は…
上の例のように面積按分はシンプルですが、実は次の図のように左上のメッシュには川が通っており河川敷で居住者が少ないエリアだったとすると、青枠の町丁目の来訪者を面積の比率に従い56%配分してしまうのはまずそうです。
例えば世帯数按分
面積を用いた按分ではダメということで、今回は世帯数データを使用して按分してみます。
例えば3つのメッシュの世帯数が上のような場合、まずは青枠のエリア内はそれぞれ何世帯となるか、面積按分で求めます。
↑求めました。
あとは最初の面積の代わりに世帯数の比率で青枠内の来訪者数を按分します。
最初の例と比べると大きな差がある結果となりました。
今回は「世帯数」をもとに按分した例を挙げていますが、来訪者の傾向に合わせて「20代人口」を採用する、といったケースも考えられるかと思います。
どこまでいっても実データとは一致しないということで、実際の運用ではデータ利用者にとって納得感のあるような按分手法を選択することも考えられます。
最後に
町丁目単位の来訪者数データをメッシュ単位に変換する今回の例のように、本来存在しないデータを作成することができる点が按分の大きなメリットです。
一方で、按分に使用できるような面積以外のデータが都合よく見つからなかったり、按分結果の検証も難しかったりと、実際にはいろいろとハードルがあります。
今回は簡単なケースの例示のみとなりましたが、今後このあたりのノウハウについても調べられたらと思っています。