- この記事は,次の文献の抄訳としてまとめたものです。原文はCC-BY 4.0で公開されています。Sieber, R. (2019). Open data and geospatial. In T. Davies, S. Walker, M. Rubinstein, & F. Perini (Eds.), The state of open data: Histories and horizons (pp. 137–150). Cape Town and Ottawa: African Minds and International Development Research Centre. https://www.idrc.ca/en/book/state-open-data-histories-and-horizons
- 文中のカッコ無い表記や太字は訳者によるものを示しています。
地理空間 by Renée Sieber
- 政府データの約80%は位置情報を含んでいると言われている。
- 地理空間データの開放は、オープンデータ推進の初期の重要な要素であり大きく進展してきた。しかし、政府の地理空間データの多くは、依然として制限的な知的財産権の下にある。
- 地理空間データのオープンな技術やインフラに関する取り組みは、オープンデータの概念や実装よりも先行しているが、地理空間データのオープンコミュニティとその他のオープンデータコミュニティの間の連携は比較的弱い。オープンデータのコミュニティでは、空間分析のための重要な能力を構築することができる。
- 地図による可視化はオープンデータを提示する一般的な方法であるが、空間分析については洗練されていないことが多い。地図上に現れる関係は、統計的に有意でない場合がある。地理的な関係は、表やグラフなど他の形で示すことができることを認識することが重要である。
導入
- 多くのユーザーはオンライン地図を紙地図と同じように扱っていたが,2005年のGoogle Maps登場によりインタラクティブになった。またOpenStreetMapの登場で知的財産権(IP)の制限を受けない地図データの収集・表示のプラットフォームが現れた。
- データの利用可能性や可視化ツールの開発には大きな進展があったが、地理空間とオープンデータのコミュニティをより良く結びつけ、地理空間データの作成者と利用者に、単なる地図作成にとどまらず、地理空間データ分析の恩恵を最大限に受けるために必要な重要なスキル(および技術プラットフォーム)を身につけさせるためには、かなりの作業が必要
- 地理空間データの利用が拡大することにより、データの可用性が高まると同時に対処すべき重大なリスク(データの所有権とプライバシー)という点もある点に着目
入門: オープンな地理空間データの概要
- オープンデータの多くの用途は、基本的な地理的なフレームワークを有するデータを「マッピング」されることに依拠する。
- 例えば,社会経済統計を行政区域上に・土壌に関するデータは数値標高モデルに など
- マッピングは一般的に地理空間データそのものとレイヤ(行政区域や河川道路など。衛星画像を含める場合もある)を一緒に表示するもの
- 地理空間をxとyの座標で考えることが多く,通常は緯度と経度で表される。ただし,座標には多くの種類がある子を認識することが重要。
- データの開放性に関して,閲覧は自由でもダウンロードできない・再利用を制限するライセンス・専用のソフトウェアを必要とするフォーマットなど,オープンな地理空間データを理解するためには、「どのようなデータなのか」「どの程度オープンなのか」 を問う必要がある。
コラム:構造、表現、解析の観点から見た多くの種類の地理空間データについて
- 省略
発展:オープンな地理空間データの利用可能性とインフラ
- 地理空間データセットのオープン化における大きな前進として,以下の事例がある
- 2013年、デンマーク政府は、基本データプログラムを通じて、デジタル地図データをオープンライセンスの下で無料公開した。
- 2009年に米国のランドサット衛星画像を自由に利用できるようになり、年間18億ドルの経済的価値が生まれたと推定されている。連邦政府の地理空間データのオープン化への取り組みは、世界のオープンデータに関する多くの検討よりも先行
- 地理空間データが最初のオープンな政府データである理由は、国または地域的な空間データ基盤(NSDI)の確立が1980年代から進められてきた点が大きい。
- 完全な標準化には、地理空間データが同じ座標系、空間的範囲、更新、データ定義で同じ投影(projection)になることが必要。レイヤーが互いにきれいに「重なる」ようにデータを調整することは決して簡単ではない。
- 地理空間データのオープン性は世界的にまだ不均等になっており、Open Data Indexでは、政府が完全にオープンな国土空間データを提供している国はわずか12カ国。
- 単に既存のデータセットにライセンスを適用するだけでなく、地理空間データに特化した政策、標準、人材の採用が必要
- 地理空間データのギャップは,国境を超えた衛星画像の利用によって解決されつつある。
- 民間企業や市民社会によって政府データの補完が行われている側面も重要
- 他方,民間企業によるAPI提供などは,突然の価格変更やライセンス変更などの影響を受けることに注意
- クラウドソーシングによるオープンな地理空間データの最大のプラットフォームであるOSMは,多くのデータを提供し維持するマッパーたちのコミュニティによって構築されている
- 政府機関が地理空間データを整備する場合は,予算削減リスクや資金提供体制を整備するように求められるケースもあり,北米ではGoogle Waze,Strava Metro,Uber Movementなどのプロジェクトとの提携を模索する動きも
- 民間企業が提供するデータが政府データに含まれると、データの正確性、対象範囲、編集や更新の適時性といった点で、政府からのコントロールを考慮する必要がある。他方、政府に対するリスク(現実または認識されているもの)が増大するという点もある。
コラム:オープンな地理空間データの4つの事例
- 犯罪地図・近隣地域のアセット・災害対応・援助マッピング
課題:知財(IP)・プライバシー・標準化
- 知財:多くの国がIP規制のために主要なデータセット公開に難色を示している(例:イギリスとカナダの郵便番号データに係る問題)。空間データインフラにおいて、どれだけの国が実質的なIPの所有権を持っているかについての信頼できるデータは少ないが、オープンな地理空間データの格差を少なくするためには、今後10年間追跡調査すべき重要な分野
- プライバシー:個人に関するデータである場合、位置情報はしばしばプライバシー保護よりも、監視を可能にする点に留意。ウェブ上に個人の地理的データの痕跡を残すことが多くなっており、位置情報とタイムスタンプが一致する他のデータセットの匿名性が損なわれる可能性がある。
- データの匿名化を解除する能力は、人工知能や機械学習がオープンデータに適用されるにつれて向上していくだろう。オープンデータセットが一般的に個人を特定しないのに対し、地理的なインデックスを持つデータの利用可能性が高まっていることは、オープンデータセットを作成、共有、利用する際に考慮する必要
- 標準化:相互運用性を高めるための大きな課題で。地理学で最もよく使われる標準は、緯度・経度という座標の「原子標準」である。ただし投影法が統一されていないと、あるデータセットを他のデータレイヤーに正しく重ね合わせることができず、移動距離の計算など他の操作に支障をきたす可能性がある。
- schema.orgの場所に関する標準には、領域間の包含、重複、交差、等値といった少なくとも10種類の関係が含まれており、単純な点の位置を超えた幾何学的構造の複雑さがあり、標準の採用の議論よりも教育的な理解が前提として必要
- コミュニティ:オープンデータのコミュニティと従来から地理空間データを扱ってきたコミュニティとの間の相互作用の欠如。
- オープンデータの世界ではマッピングに重点が置かれ、地理的な分析にはほとんど焦点が当てられていないのが現状。コミュニティ間の交流を深めることで、スキルや分析を向上させることができる可能性が大いに残されている。
落とし穴と可能性:マッピングから分析へ
- マッピングは重要だが、地理的可視化は多くの戦略のうちの1つに過ぎない。オープンデータから結論を導き出し、その分析結果に基づいて新しく改良された地図を作成できるように、詳細な空間統計と分析のスキルを拡大することは、オープンデータ・コミュニティにおいて高い優先度を持つべきこと。
- 一般的なデータリテラシーの能力は向上しているが、地理空間データリテラシーを促進するためのツール、リソース、アウトリーチの利用可能性はかなり少ない。
- 地理空間データのオープンデータの多くは「フィーチャージオメトリ」(ポイントデータ)データであり,活動の拠点なのか,幾何学的な中心点なのかがあいまいで地図が伝えるメッセージに影響を与えることもある
- 点の位置に頼るべきではなく,面的なスケール(尺度)によって適切に表現されるべき
- 貧困の状況などは政治的境界線(行政区域)によってなされるべきだが,境界をめぐって論争が起こる可能性がある点も留意が必要。
- 行政区域ごとの分析は,集計やクラスタリングが一般的で,六角形ビンニング(hexbins)や矩形グリッド(メッシュなど)があげられる。
- ラスタ(画像)データを扱って分析する場合は,経験やソフトウェアが必要なケースもある。
- 地理学では、集計単位が定義上人為的なものと理解され、データ集計の結果が単位の選択に依存する、**可変単位地区問題(MAUP)**を広く議論してきた。結果(例:数、率、密度、相関関係)は、単位の形状や方向(例:長方形のグリッドのわずかな傾きや拡大)、および単位の組み合わせ方(スケール)に影響される。
- 行政区域の境界を利用したものも含め、完璧な集計はなく、集計がもたらす結果の不確実性や限界についての理解を深めることが重要
- オープンソースの地理空間データツールの改善に取り組んできた。
- クリティカルジオグラファーやコミュニティジオグラファーは、地理空間データへのアクセスをオープンにし、一般利用をサポートする方法を長い間研究。
- データのオープン化を急ぎ、**最新の商用ツールや簡素化されたマッピングプラットフォームのみに依存するだけでなく、この分野における幅広い学習と思考が無視されることがあってはならない。
まとめ
- 地理空間データのオープン化には大きな進展があった。しかし、IP、標準化、プライバシー、分析能力などに関する多くのギャップが残っている。オープンデータの次の10年では、より良い地図を作成し、過去10年間にリリースされたオープンデータ内の豊富な地理的コンテンツからより大きな価値を実証できるように、地理学/GISとオープンデータのコミュニティ間の連携を強化する必要
- 地理的なオープンデータを扱う場合は、批判的な視点でデータに接する必要。
- このデータを作成するにあたって、どのような選択(choice)がなされたのか?
- 既存の地理空間データコミュニティから、データ分析に役立つどんな教訓が得られるだろうか?
参考文献
- Armstrong, M. & Ruggles, A.J. (2005). Geographic information technologies and personal privacy. Cartographica: The International Journal for Geographic Information and Geovisualization, 40(4), 63–73.
- Johnson, P., Sieber, R., Scassa, T., Stephens, M., & Robinson, P. (2017). The cost(s) of geospatial open data. Transactions in GIScience, 21(3), 434–445.
- MacEachren, A.M. & Kraak, M.J. (2001). Research challenges in geovisualization. Cartography and Geographic Information Science, 28(1), 3–12.
- Monmonier, M. (2018). How to lie with maps. 3rd edition. Chicago, IL: University of Chicago Press.
- Openshaw, S. (1983). The modifiable areal unit problem. Norwick: Geo Books.
執筆者について
Renée Sieber 氏は、マギル大学地理学部・環境学部の准教授として、社会変革のための地理空間情報の利用と価値について研究。コミュニティの貧困、社会運動(特に環境運動)、先住民グループのためのGIS活用を研究。https://www.twitter.com/re_sieber