今回はオンハンズなしです。
Overview
In this lesson, we will learn how to handle spatial data in Python using Geopandas. Geopandas combines the power of Pandas to analyse tabular data and shapely for handling geometries.
We will learn how to read and write spatial data from and to files, how to manipulate geometries, and how to transform data between different coordinate reference systems (CRS).
Geopandas を使って Python で空間データを扱う方法を学びます。
ファイル経由で空間データを読み書きする方法、ジオメトリを操作する方法、異なる座標参照系 (CRS) 間でデータを変換する方法を学びます。
Learning goals
- read and write spatial data from and to common file formats,
- filter and re-group data by spatial and non-spatial characteristics, and
- manage and transform a data set’s coordinate reference system.
- 一般的なファイルフォーマットで空間データを読み書きします
- データをフィルタしたり、再グループ化します
- データの座標参照系を変換します
Key concepts
Check your understanding
Before diving into this week’s Python lesson, you should already be familiar with some basic spatial data file formats and projection definitions, such as these:
ハンズオンを始める前に、空間データフォーマットや座標参照系の基本を理解しておく必要があります。
原文の翻訳よりも日本語のサイトのほうがわかりやすいと思いますので、関連するサイトのリンクのみとします。
- Shapefile
Shapefileとは、GISデータのフォーマットのひとつで、GISソフトで扱えるベクター形式のデータです。特定の建物を点で示す「ポイント」、河川や道路を線で表す「ライン」、湖沼や森林などを面で表す「ポリゴン」などの形で地図上の空間要素を示します。
- GeoPackage
「GeoPackage(GPKG)」とは、地理空間データを保存するためのデータ形式の1つで、データベース管理システムのSQLiteをベースとしています。これは、OGC(Open Geospatial Consortium)が策定した標準規格のデータ形式であり、GISや地理データの取り扱いに特化した多機能なフォーマットです。
- CRS
座標参照系(CRS)とは、Coordinate Reference Systemの略語で、緯度や経度をはじめ、球体である地球上の位置を平面に投影する方法を意味する概念です。
CRSは、以下の2つの組み合わせによって構成されています。
- 測地系:地球上を楕円形にとらえた上で、地球上の位置と経緯度を対応させる基準のことです。
- 座標系:数値による位置の表し方を指します。経度と緯度で表現される地理座標系と、それ以外の方法(球体を平面に変換するなど)の方法で表現される投影座標系の2種類が存在します。
- datum
測地系 (datum)とは、ひらたくいえば、地表の地点と座標(緯度,経度)の対応のことである.多くの人は、この対応は一意的なものと思っているだろうが、実はそうではない。つまり、ある地点の位置を表すのに、様々な緯度・経度の値がありえるのである。
- EPSG
EPSGコードとは、GISで使用される様々な要素に必要なパラメータを1つにまとめ、そのパラメータの集合体どうしを区別するためにコードを割り振ったコード体系のことです。
GISで使用される要素には、座標参照系、測地系、本初子午線、地図投影法などがあります。
EPSG(European Petroleum Survey Group)という団体によって作成され、現在ではいろいろなGISで使用されています。
次回からハンズオンです。