はじめに
e-Statから都道府県別の人口集中地区(DID)データをダウンロードして、マージする作業のメモ
環境
- Windows 10 のパソコン
- ラズベリーパイ(unvt/equinoxインストール済)
手順
いつもの通り統計局e-Statのページに行きます。統計地理情報システムの境界データダウンロードに行きます。
Step 1: データの確認
境界データから、国勢調査2020年を選び、人口集中地区(JGD2011)を選ぶ
データ定義書はこちら
注意書きはこちら
(一部抜粋・その1)人口集中地区は、統計データに基づいて一定の基準により都市的地域を定めたものであり、・・・、昭和35年国勢調査以来各回の調査ごとに設定されているものである。
(一部抜粋・その2)人口集中地区の設定に当たっては、国勢調査基本単位区及び基本単位区内に複数の調査区がある場合は調査区(以下「基本単位区等」という。)を基礎単位として、1)原則として人口密度が1平方キロメートル当たり4,000人以上の基本単位区等が市区町村の境域内で互いに隣接して、2)それらの隣接した地域の人口が国勢調査時に5,000人以上を有するこの地域を「人口集中地区」とした。
なお、人口集中地区は「都市的地域」を表す観点から、学校・研究所・神社・仏閣・運動場等の文教レクリエーション施設、工場・倉庫・事務所等の産業施設、官公庁・病院・療養所等の公共及び社会福祉施設のある基本単位区等で、それらの施設の面積を除いた残りの区域に人口が密集している基本単位区等又はそれらの施設の面積が2分の1以上占める基本単位区等が上記1)の基本単位区等に隣接している場合には、上記1)を構成する地域に含めた。
Step 2: シェープファイルのダウンロード
都道府県別になっているので、まずはURLを確認します。
データのダウンロードURLは以下の通り。codeの番号で都道府県を示すようだ。
- 北海道全域: https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=01&coordSys=1&format=shape&downloadType=5&datum=2011
- 青森県全域: https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=02&coordSys=1&format=shape&downloadType=5&datum=2011
- ・・・
- 沖縄県全域: https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=47&coordSys=1&format=shape&downloadType=5&datum=2011
いちいちクリックするのは面倒なので、Powershellで一括ダウンロードすることにします。まずPowerShellのコマンドを作成します。(URLに&などがあり、forループで上手くできなかったので47行作りました。)
curl.exe -o 01_src/R2_did_01.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=01&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_02.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=02&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_03.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=03&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_04.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=04&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_05.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=05&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_06.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=06&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_07.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=07&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_08.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=08&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_09.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=09&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_10.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=10&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_11.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=11&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_12.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=12&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_13.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=13&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_14.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=14&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_15.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=15&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_16.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=16&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_17.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=17&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_18.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=18&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_19.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=19&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_20.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=20&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_21.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=21&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_22.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=22&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_23.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=23&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_24.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=24&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_25.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=25&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_26.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=26&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_27.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=27&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_28.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=28&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_29.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=29&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_30.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=30&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_31.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=31&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_32.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=32&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_33.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=33&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_34.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=34&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_35.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=35&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_36.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=36&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_37.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=37&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_38.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=38&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_39.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=39&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_40.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=40&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_41.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=41&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_42.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=42&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_43.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=43&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_44.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=44&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_45.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=45&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_46.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=46&coordSys=1&format=shape&downloadType=5&datum=2011'
curl.exe -o 01_src/R2_did_47.zip 'https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=D002005112020&code=47&coordSys=1&format=shape&downloadType=5&datum=2011'
そして作成したテキストファイルを実行すればよいです↓。
mkdir 01_src
get-content "download.txt" | Invoke-Expression
ZIPファイルがダウンロードできました。
ファイルはGitHubレポジトリにあげておきます。
Step 3: 解凍とマージ
ここからはラズベリーパイを使います。インストールしているツールは以前の記事を参考にしてください。
まずレポジトリをクローンして作業します。01_srcにデータが入っています。これを解凍します。
git clone https://github.com/ubukawa/did2020
cd did2020
mkdir 02_unpack
for f in 01_src/*.zip; do unzip ${f} -d 02_unpack; done
マージはツールを使います。Encodingを指定しないと上手くいきませんでした。
mkdir 03_merge
ogrmerge.py -single -o 03_merge/did2020-all.shp 02_unpack/*.shp -lco ENCODING=UTF-8
これで03_merge/did2020-all.shpという一つのシェープファイルができました。
(おまけ)タイル作り
せっかくなのでタイルも作りました。シェープファイルからではなくて、解凍したそれぞれのファイルから作成します。
mkdir 04_tile
for f in 02_unpack/*.shp; do ogr2ogr -f GeoJSONSeq -lco RS=YES /vsistdout/ ${f};done | tippecanoe -e 04_tile/did2020 -Z10 -z16 --no-feature-limit --no-tile-size-limit -l did2020
gitをプッシュ
git add 02_unpack
git add 03_merge
git add 04_tile
git commit -m "did"
git push
これで終わりです。
まとめ
e-StatのDID情報をダウンロードして、マージしたり、タイルにしたりしました。