opendata

電子行政オープンデータ推進のためのロードマップ

※原文: http://www.kantei.go.jp/jp/singi/it2/kettei/pdf/20130614/siryou3.pdf

平成25年6月14日

高度情報通信ネットワーク社会推進戦略本部決定

1 オープンデータ推進の重要性

インターネット等の普及により、データを低コストかつ即時に提供することが可能となるとともに、データを利用する企業・国民等においても、コンピュータの能力向上、端末の高度化・多様化等により、大量・多様なデータを処理・利用できるようになってきている。

このような状況において、政府、独立行政法人、地方公共団体等が保有する多様で膨大な公共データについて、ビジネスや身近な公共サービスへの活用が期待されるようになってきている。

このような状況のもと、「電子行政オープンデータ戦略」(平成24年7月4日高度情報通信ネットワーク社会推進戦略本部(IT戦略本部)決定)は、公共データの活用を促進するための取組に速やかに着手し、それを広く展開することにより、国民生活の向上、企業活動の活性化等を図り、我が国の社会経済全体の発展に寄与することが重要であるとの考えを明らかにしている。

また、同戦略においては、我が国における公共データの活用の取組に当たり、①政府自ら積極的に公共データを公開すること、②機械判読可能な形式で公開すること、③営利目的、非営利目的を問わず活用を促進すること、④取組可能な公共データから速やかに公開等の具体的な取組に着手し、成果を確実に蓄積していくこと、という4つの基本原則を掲げている。

これらの社会・経済状況や政策方針を踏まえ、機械判読1に適したデータ形式のデータを、営利目的も含めた二次利用が可能な利用ルールで公開する「オープンデータ」の取組を推進することが重要である。

各府省においては、本ロードマップに基づき、それぞれ、また内閣官房と連携して、オープンデータの取組を推進していくものとする。

また、取組に当たっては、民間、地方公共団体等と十分に連携を図り、民間、地方公共団体等に円滑かつ速やかにオープンデータの取組が普及できるように留意するものとする。なお、民間等との連携という観点からは、機械判読に適したデータ形式での公開の拡大に当たって、民間等が保有する技術・ノウハウ等を活用し効率的かつ効果的に進めていくことも重要である。

さらに、具体的な取組に当たっては、十分な情報セキュリティを確保した上で、推進していくこととする。

2 電子行政オープンデータ推進のための具体的な取組

(1)二次利用を促進する利用ルールの整備

①現状の課題

現在、各府省がホームページ等で公開している文書、数値、図表等の各種情報(以下「公開データ」という。)の利用条件は、ごく一部の例外を除き、各府省ホームページ等全体としての利用ルールが包括的に適用・表示されている状況にある。

しかしながら、当該利用ルールについては、著作物に該当しないデータについても著作権の対象であるかのような包括的な表現となっており、個別のコンテンツに即した内容・表示になっていない。また、著作権以外の根拠に基づき二次利用を制限している場合について、その根拠・内容が分かりにくいものもある。

以上のようなことから、利用者の観点からは、どこまで二次利用できるのかが明確でなく、公開データの活用が進まない一因となっている。

②具体的な取組

本ロードマップ策定後、国が著作権者である公開データについては、二次利用を制限する具体的かつ合理的な根拠があるものを除き、二次利用を認めることを原則とする。

二次利用を制限する場合の根拠・内容については、コンテンツごとに可能な限り分かりやすく統一的に表示する。

(注)第三者が著作権者である著作物や既に作成・保有しているデータに含まれる著作権者が明確でない著作物については、その範囲を明確にし、それ以外のデータとは別に取り扱うこととする。

また、二次利用可能なデータ公開を促進するため、公開データの二次利用により生じた損害に関する免責についても明確にすることとする。

さらに、上記以外の利用ルール(手数料、機械からのアクセスルール、機微情報の取扱い、法令に基づき作成・取得するデータの利用可能な範囲等)についても、電子行政オープンデータ実務者会議(以下単に「実務者会議」という。)で検討し、可能な限り具体的に整理していくこととする。

(2)機械判読に適したデータ形式での公開の拡大

①現状の課題

現在の公開データは、人が読む(画面上又は印刷して)という利用形態に適したデータの構造(タグの付け方、表の形式等)やデータ形式で公開されているものが多い。

そのため、検索も難しく、大量・多様なデータをコンピュータで高速に、横断的に又は組み合わせて処理・利用しようとした場合、データの構造やデータ形式を変換するためにコストや手間がかかっている。

なお、統計データについては、「統計調査等業務の業務・システム最適化計画」(平成18年3月31日各府省情報化統括責任者(CIO)連絡会議決定。平成24年9月7日最終改定)に基づき、統計情報の電子的提供の推進を含む取組を実施しているところであり、その目標達成のために一層の推進が求められる。

②具体的な取組

本ロードマップ策定後に作成し、インターネットを通じて公開するデータについては、機械判読を考慮した構造で、かつ機械判読に適したデータ形式でも掲載することを原則とする。

(注)国民への情報公開の観点から、人が読むという従来からの利用形態に適したデータ形式での公開も継続する。

統計データについては、従来から「統計調査等業務の業務・システム最適化計画」に基づき、統計表管理システムの統計表の統計情報データベースを通じた提供の推進を含む統計情報データベースを通じた統計データの提供が推進されているところであり、引き続きこの取組を推進する。また、地理情報を活用した統計データの拡充を行うとともに、統計データの機械からのアクセス性等の利便性の向上を図る。

統計情報データベースを通じて提供される統計データ(統計情報データベースを通じた提供を推進している統計表管理システムの統計表を含む。)以外のデータの構造やデータ形式を整える取組については、特に重点分野(白書、防災・減災情報、地理空間情報、人の移動に関する情報、予算・決算・調達情報)から優先的に、費用対効果を踏まえつつ取り組むこととする。具体的にどのようなデータから取組を進めるかについては、実務者会議で検討する。

機械判読に適したデータ形式については、特定のアプリケーションに依存しないデータ形式であることを要件とし、可能なところから、順次より高度な利用が可能なデータ形式での公開を拡大していく。

機械判読に適したデータ形式でのデータ公開に当たっては、併せて当該データのURLリストの公開を行うとともに、機械向けのインターフェイス(API(Application Program Interface))の整備も考慮する。

また、併せて、関連するデータを連携・融合して利用する観点から、統計等で利用される場所を示すコード、企業・組織等を識別するコード等も機械判読に適したデータ形式での公開を進める。

さらに、ある内容を示す用語や同じ用語の定義が組織によって異なっているとデータを横断的に又は組み合わせて処理・利用することが困難となるため、「新たな情報通信技術戦略 工程表(平成24 年7月4日改訂IT戦略本部決定)」を参照しつつ、新たなIT戦略の策定に伴って定めることとする分担に従い、用語やその定義の標準化、効率的なデータ連係のためのツール等の整備について、内閣官房、総務省及び経済産業省が連携して進める。

なお、本ロードマップ策定後に行う行政情報システム(安全保障に関する情報等公開に適さない情報のみを扱う行政情報システムを除く。)の構築・更新に当たっては、機械判読に適したデータ形式のデータの出力を考慮したシステム設計を行うこととする。

(3)データカタログ(ポータルサイト)の整備

①現状の課題

二次利用可能で機械判読に適したデータ形式のデータは、各データを個別に公開するだけでなく、どこにどのようなデータがあるかを分かりやすく案内し、必要なデータ取得を容易にする「データカタログ」(ポータルサイト)を整備することで、その利用が促進される。

データカタログには、データの横断的検索、コンピュータからの要求に応じた自動的データ取得等の機能やAPIを装備することが重要である。

②具体的な取組

データの横断的検索、コンピュータからの要求に応じた自動的データ提供等の機能やAPIを装備した「データカタログ」(ポータルサイト)を整備する。

データカタログの在り方や機能等(メタデータの在り方を含む。)については、内閣官房、総務省、経済産業省による実証事業等における知見も踏まえつつ、実務者会議で検討する。

データカタログの運用に当たっては、データ特性に応じたデータの更新・継続性等に関するルールを整備するとともに、各府省において、データカタログを念頭に置いた留意事項・手順等に従ってデータの作成・登録を行う。

(4)公開データの拡大

①現状の課題

これまで、各府省のホームページ等で多様な情報が公開されているが、公開可能な情報がすべてインターネットを通じて公開されているわけではない。

多様で膨大なデータを収集・分析し、組み合わせるという観点から、新たなビジネスや身近な公共サービスに利用できるデータ、行政の透明性・信頼性の向上のため重要と考えられるデータについて、一層の公開の拡大が期待されている。

また、学術研究、気象、災害等のデータの国際的な横断的利用等の観点から、二次利用可能で機械判読に適したデータ形式の公開データの英語による表記の充実も求められている。

②具体的な取組

公開できない理由が明確なものを除き、保有するデータはすべて公開するという理念の下、具体的な取組としては、以下のとおり進めていく。

重点分野(白書、防災・減災情報、地理空間情報、人の移動に関する情報、予算・決算・調達情報)において、新たなビジネスや身近な公共サービスへの利用が期待されるデータや行政の透明性・信頼性の向上のため重要と考えられるデータについて、二次利用可能なものを、原則として機械判読に適したデータ形式で、公開を拡大していく。具体的にどのようなデータの公開が求められるかについては、実務者会議で検討する。

また、新規にインターネットを通じて公開するためのコストが小さいデータや、利用者のニーズ(要望)が強いデータについては、公開できない(行政機関の保有する情報の公開に関する法律第5条の不開示情報に該当する等)もの及び具体的かつ合理的な根拠により二次利用が認められないものを除き、原則として機械判読に適したデータ形式で、公開を拡大していく。

併せて、具体的な内容は実務者会議で検討しつつ、二次利用可能で機械判読に適したデータ形式の公開データについて、英語表記のコンテンツも充実させていく。

(5)普及・啓発、評価

①現状の課題

オープンデータの取組は黎明期である。そのため、どのような利用の方法・形態があるのかまだ十分に明らかになっていない面がある。

しかしながら、情報への到達コストが圧縮され、これまでビジネスには使えなかったデータが利用できるようになることによって、イノベーション(新サービスの創出、新しい価値の発見等)が起きることが期待されることから、利用者の具体的ニーズの発掘・把握と併せ、その効果を定量的に評価することが重要である。

②具体的な取組

公共データの活用ニーズを発掘・喚起し、新たなサービス・ビジネスの創出等の成果を実現していくため、有用な情報の紹介、普及行事の開催・参加等の利活用の支援を行うとともに、公開データの利用ルール、データ形式等や公開データの拡大などについて、利用者のニーズ(要望)・意見を把握し、それを取組に反映させる仕組み(利用者向けの一元的相談窓口や各府省に対するコンサルティングを含む。)を構築する。

また、取組の費用と効果を適切に把握し、継続的に取組内容の改善を行うための評価の方法を実務者会議で検討し、それに基づく評価を実施する。

さらに、オープンデータの取組を独立行政法人、地方公共団体等に普及させていくため、地方公共団体のデータの公開の考え方を整理・提示するなど、国として必要な施策を行う。その具体的内容については、実務者会議で検討する。

3 電子行政オープンデータ推進のためのロードマップ

(1)ロードマップ(工程表)の考え方

前項で示した具体的な取組について、各府省による平成25年度以降の進め方をロードマップとして整理したものが、別紙「電子行政オープンデータ推進のためのロードマップ(工程表)」である。

ロードマップに示す取組により、平成27年度末において、他の先進国と同水準のオープンデータの公開と利用を実現する。

なお、平成24年度に実務者会議で検討・整理した各府省が早急に取り組むべき事項等については、二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)として取りまとめることとする。前項の具体的な取組において、実務者会議で検討・整理するとされている事項については、今後の実務者会議の検討・整理を踏まえ、上記ガイドライン(仮称)を随時改定するものとする。

また、同ガイドラインのうち、「行政情報の電子的提供に関する基本的考え方(指針)」(平成16年11月12日 各府省情報化統括責任者(CIO)連絡会議決定)に盛り込むことが適当な内容については、同指針に反映させることとし、同ガイドラインの取りまとめ後、同指針の改定について検討を行うこととする。

(2)ロードマップの進捗状況等のフォロー

各種施策のレビュー及びフォローアップのため、ロードマップに記載された施策の取組状況や課題等について、内閣官房は各府省から適宜報告・説明を求めることとする。

(以上)


  1. ここでの「機械判読」とは、コンピュータプログラム(この注において、以下単に「コンピュータ」という。)が自動的にデータを再利用(加工、編集等)できるということである。人手をどれだけ要せずに、コンピュータがデータを再利用できるかにより、「機械判読に適した度合」には、いくつかの段階がある。コンピュータが自動的にデータを再利用するためには、コンピュータが、当該データの論理的な構造を識別(判読)でき、構造中の値(表の中に入っている数値、テキスト等)が処理できるようになっている必要がある。