はじめに
データ分析をするにあたり、データを地図に配置することで理解が深まることがあります。
地図上のデータの発生箇所にポイントするか、データの発生エリアを塗りつぶすか、どちらかの手法を取ることが多いと思われます。
今回は、Oracle Analytics Cloud(OAC)と容易に入手できるデータを使用して、データの発生箇所にポイントする方法を試してみます。
使用するデータ
JR東日本が公開している、駅別の乗車人員数データを使用します。
2022年度のトップ10駅のデータを加工して、Excelデータ化しました。
駅の住所は、Wikipediaを参照しました。
出典:JR東日本 各駅の乗車人員 2022年度 から上位10駅
住所から緯度・経度を求める
データを地図上にポイントするので、各駅の緯度と経度の情報が必要です。
ところが、JR東日本の公開データにはそれがありません。
住所を調べるのに Wikipedia を利用させていただきましたが、緯度・経度の情報もそこに記載されているので、それを使わせてもらっても良いのですが、無料で使用できるジオコーディング・サービスを利用しても良いかも知れません。
住所から緯度・経度へ変換することをジオコーディングといいますが、これを無料で実施してくれるサービスが世の中にはあります。
興味があれば調べてみてください。
ワークブックの作成
では、早速作成したデータ(Excelファイル)を使ってワークブックを作っていきます。
データセットの作成
OACにログインし、ExcelファイルをOACのホームを表示しているブラウザに直接ドラッグ&ドロップします。
ファイルを読み込んで内容が表示されるので、「ビジュアル化」をクリックします。
マップビューの作成
新規にワークブックが作成されます。
緯度と経度にあたる列をコントロールキーを押しながら同時に選択して、右クリックします。
「ビジュアライゼーションの選択」をクリックして、「マップ」をクリックします。
「カテゴリ (場所)」に緯度と経度を配置します。
「合計」(乗車人員数)を「サイズ」にドラッグ&ドロップして、円のサイズに反映させてみます。
マップ・ビューのプロパティを表示します。
背景マップを「OpenStreetMap」にして、デフォルト・マップ・タイプを「陽電子」にしました。
円の最小サイズと最大サイズを調整して、違いが際立つようにします。
新宿駅付近にズームしてみました。
ツールチップに「駅名」が表示されるようにしています。
おわりに
自治体が公開しているオープンデータの中にも座標付きのものがありますので、色々と試してみてください。