はじめに
前回・前々回は、主にSnowflake・dbt・Databricksを触ってみることを目的として、何も考えず提供された「物件」データだけで不動産価格予測のモデル構築・予測をしていました。
ただ、このチャレンジは「国土数値情報」の活用が必須となっているようなので、今回はGIS (Geographic Information System, 地理情報システム) データ初心者の私が、この「国土数値情報」に触れてみた話です。
ただし、モデル構築・予測には組み込むところまではできておらず、本記事では「国土数値情報」についての理解やその可視化、といった初めの一歩的な内容になっています。
※ 本チャレンジ終了は 2026/1/9 23:59 です、そうですこの記事作成時 (2026/1/9 0時) の約24時間後です。なのにまだ初めの一歩なのだ!楽しいですね!
「不動産情報ライブラリ」と「Kepler.gl」による可視化例を載せていますが、今回も使ってみた的側面が強いです。可視化の方法を知りたい方には有益かも知れませんが、可視化によるモデル構築に有用な示唆を得たい人は微妙です。最後まで読んでも、「各地方の中心的な都市の地価は高い」といったある種当たり前の示唆しか得られません。
第2回 国土交通省 地理空間情報データチャレンジとは
本チャレンジの公式ページは以下です、詳細は割愛します。
国土数値情報とは
こちらの動画が分かり良いです。不動産価格がどのように決まっているか?など不動産売買の基本も解説されており、このドメイン知識を活用してモデリングできると良さそうです。
「国土数値情報」は、国土交通省が整備するオープンデータであり、国土に関する基礎的な情報を全国統一的なフォーマットで整備、無償で提供しているGISデータです。
ダウンロードサイトを見てみると、多種多様なデータがあり、その数約190種類だそうです。
まずは、本データチャレンジに関係しそうな「地価公示データ」と「都道府県地価調査データ」を可視化し、不動産価格予測モデルの仮説構築に使えそうな情報・示唆を集めてみたいと思います。
不動産情報ライブラリ
なんとこのオープンデータ、Webビュアーがついてるようです。便利です。
左上の「地価情報」で「全選択」し、「条件設定」からコンペ対象期間を設定して、「決定」します。
出ました!各点が地価公示、都道府県地価調査のデータになっています。
都道府県地価調査
R5/7/1
住宅地
豊見城-1
110,000(円/m²)
「詳細情報」をクリックすると、詳細が見られます。「地価調査価格グラフ」で価格時系列も確認可能です。
※ APIも使えるらしいです、便利そうです。
Kepler.gl
もう少し直感的に分かるように可視化してみたくなりました。
超個人的に Kepler.gl を触ってみたかったので遊んでみました。
こちらはカッコイイ可視化ができるOSSです。
ノーコードでWebサービスとして使用できたり、
Pythonで使用することもできます。
ローコード (ちょっとSQL使用) で可視化
今回は、Webサービスを使ってみます。プレビュー版ではありますが、DuckDB版だとSQLが使用可能で、緯度経度情報の抽出時に便利ですのでこちらを選択します。他可視化時にも、データ抽出→可視化が楽に行えますのでこちらをおすすめします。
まず事前に国土数値情報(地価公示データ)をダウンロードしておきます。
今回は2023年のデータをダウンロードしました、L01-23.geojsonをドラッグ・アンド・ドロップします。
しばらくするとデータが読み込まれます。
その後、右メニューから「SQL」パネルを開き以下を実行して、結果を「Add Map」します。
SELECT
* EXCLUDE(_geojson),
ST_X(_geojson::GEOMETRY) AS longitude,
ST_Y(_geojson::GEOMETRY) AS latitude,
CAST(L01_006 AS DOUBLE) AS price_num
FROM "L01-23.geojson"
描画が増えました。
その後、「Add Filter」でポチポチ表示方法を選択して、表示を「3D」にして、グリグリ動かします。
すると…
おぉ、カッコイイ。
上記結果から得られる示唆としては「各地方の中心的な都市の地価は高い」ということでしょうか。
当たり前〜、当たり前〜、当たり前体操〜。
※ つまずきポイント的な話ですが、デフォルトだと緯度経度情報が_geojsonに入っていますが、このままだと明示的にカラムレベルで緯度経度を指定できないためか、上記Hexbinによる可視化ができませんでした。DuckDB版のSQL機能がよってよかった…
※ また、2023年(令和5年)版と細心の2025年(令和7年)版とで、地価公示データの構造が若干異なっていたのでご注意を。
おわりに
恥ずかしながら「国土数値情報」の存在を初めて知った & GISデータに馴染みのない私でしたが、各ページにデータの定義が書いてあったり、ダウンロードも登録不要で可能だったり、WebビュワーやAPIも用意されていたりで、いたれりつくせりで比較的簡単にデータ準備から分析 (今回は可視化) を行うことができました。
総じて、国土数値情報すげえな、という感想でした。皆様もぜひ活用してみてください。
※ EDAって大事ですが、ある程度仮説を持ってそれを検証する形で実施しないと無限に時間溶けていきますよね。特に可視化系は楽しいので気がついたら数時間経ってるのもザラですよね…気をつけましょう。
※ あと、Kepler.glもいいぞ。
おまけ
実はSnowflakeのマーケットプレイスには、いくつか国土数値情報を元にしたオープンデータが存在します。本チャレンジでは外部データの利用が禁止されているようなので利用はできませんが、他業務や個人開発などで使う際は候補の一つになりそうです。
Databricksのマーケットプレイスには、国土数値情報関係のデータは見当たらずでした。







