完成したもの
とても高速なデータ分析プラットホームMapDを使用して日本全国における賃貸物件の家賃を地図とヒストグラムでビジュアライゼーションしました。
日本全国から皇居あたりへズームインしていくと家賃(m2単価)の分布が高い方へ移動していくのがわかります。
当たり前ですが皇居には賃貸物件がないので賃貸物件を地図にプロットするとに空白地帯となります。
m2単価とは
m2単価 = 家賃(円) / 面積(m2)
例えば、広さ20m2で家賃6万円なら、m2単価は3,000円です。
MapDとは
GPUを利用したデータ分析プラットフォームです。
- GPUデータベース
- インメモリ/カラムストア/SQL
- オープンソース https://github.com/mapd/mapd-core
- GPU描画処理
- データ可視化記述フォーマットVegaを使ってクエリに対する画像を返す
- オープンソース https://github.com/mapd/mapd-connector/tree/master/dist
参考:MapDの本気を見た
準備
AWS環境があればすぐに使うことができます!
データのアップロード(テーブル作成)
それほど重くなければCSVファイル等はドラッグ&ドロップでアップロードできます。
AWSのS3からインポートもできます(テーブル作成が必要です)。
https://www.mapd.com/docs/latest/mapd-core-guide/tables/
https://www.mapd.com/docs/latest/mapd-core-guide/loading-data/
地図ビジュアライゼーション
まずは日本全国における賃貸物件の家賃をビジュアライゼーション
地図にポイントを表示する
SOURCESから可視化したいテーブルを選択して、MEASURESで緯度/経度に対応するカラムをセットする。
そして、POINTMAPをクリックすると…
地図が表示できました!
ポイントの色は単位面積あたりのレコード数に対応しています。
地図タイルを変える
ポイントの色をm2単価に対応させる
デフォルトではポイントの色は単位面積あたりのレコード数に対応していましたが、m2単価に対応させてみます。
m2単価が高いエリア(東京、名古屋、大阪あたり)が黄色になっていて、他は青になっている地図が想像できます。
SizeとColorをm2単価にセットします。
ところが、予想に反して全体的に緑色になってしまいました。異常値が含まれていたためです。
異常値除外
首都圏もバッチリです!
Add Chart
Saveボタンを押して保存しましょう。
ヒストグラム
完成!
都心に近づくにつれて家賃が高くなっていき、都心から離れていくと家賃が安くなります。
地図のプロットとヒストグラムの表示がは連動しており、地図を動かすと地図内における賃貸物件のm2単価を集計して(クエリを実行して)ヒストグラムを表示します。
都度クエリを実行していますがMapDなら高速に処理できます!