2022年3月に LOD チャレンジ 2021 の 授賞式シンポジウム が開催されてから時間が経ってしまいましたが、このイベント時点での LOD の利用状況と私たちの取り組みを(ログとして残す目的も兼ねて)レポートしておきたいと思います。
LOD とは Linked Open Data の略で、公共機関や企業がオープンデータを公開する際に、ユーザーの活用の幅を広げるための最も効果的な手法として提案されているものです。LOD チャレンジはこの技術普及の促進を目指したコンテストとして 2011年より毎年開催されています。
その間、オープンデータの重要性は広く認識されるようになり、ウェブ上のオープンデータは大きく増加しました。科学論文誌や生命科学データの共有といった一部の研究機関によるオープンデータ利用だけでなく、公共機関がデータを公開することにより市民が課題解決に参加できるようになるという考え方が一般的になり、各国でオープンデータへの取り組みが義務付けられました。
同時に、データの公開手法についても、技術的な議論が進みました。多くの場合、ただ文書ファイルのようなデータをサイト上に置いておくよりも、機械可読なデータにすることによりより簡単にデータ分析やアプリケーション開発が可能になります。LOD とともに提案されている「オープンデータのための 5つ星スキーム」は、これが常に必須もしくは正解とは言えないまでも、一つの指針として広く知られるようになりました。
※ https://5stardata.info/images/5-star-steps.png
現在では、統計センターや文化庁のように積極的に LOD を提供している公共機関が多く見受けられるようになりました。これら信頼のあるデータソースを核として、その他のオープンデータ、例えば、ウェブ上でメンテナンスされている地図や、メディア企業が提供するコンテンツ、博物館や図書館の所蔵品、といった情報も紐付けられてきています。
例えば、統計センターのサイト「e-Stat」では「統計 LOD」の API が公開されており、プログラムを書けるユーザーはここにアクセスすることで、データを分析したりアプリケーションを作成したりすることができます。このようなユーザーは「市民データサイエンティスト」と呼ばれ、市民の IT リテラシの向上を社会課題に役立てるために重要な役割を担っています。
※ https://data.e-stat.go.jp/lodw/
LOD チャレンジ 2021 では実際に統計 LOD から取得されたデータを用いて開発された「全国人口ピラミッダー」といった作品も見受けられました。お住まいの市区町村の人口の変化をすぐに見ることができるので、こちらからぜひ試してみてください。今後、データが広く活用されることで、データの整備も進んでいくといった好循環が生まれることが期待されます。
※ https://www.mirko.jp/pyramid/
今回、弊社(日本オラクル)はスポンサーとして LOD チャレンジに参加させていただきました。技術パートナーとして、Oracle Cloud の無料枠を
利用して SPARQL エンドポイント(= LOD 公開のためのサーバー)を構築する方法をセミナーにて紹介しました。学生にも参加いただけるよう、クレジットカードなしでクラウドのアカウントを作成できるようにしましたが、実際の作品でお使いいただいた例はまだまだ限られていました。
また、オラクル賞は 学習指導要領 LOD という作品に授与されましたので、その講評をこちらに再掲させていただきます。この作品はデータ整備の価値が高く評価されて最優秀も受賞しており、今後の利活用が期待されます。受賞作品の一覧はこちらから確認することができます。
学習指導要領という用途の広い情報のモデル構築に貢献されているだけでなく、各リソース URI に対する HTML ページや英語の概要ページ、GitHub を使った issue 管理やサイト公開など、丁寧かつ独創的な LOD の作成手法であると評価しました。 今後、外部データとの連携や SPARQL エンドポイントの公開など、LOD 構築の見本となる活動として発展されることを期待しています。
現在、LOD チャレンジ 2022 の作品を募集中で、セミナーにて Oracle Cloud アカウントも提供されます。SPARQL エンドポイントの構築方法は Qiita 記事にもしていますので、ぜひご参照ください。
- LOD チャレンジ 2022(応募期間:2022年6月12日~10月2日)
- SPARQL エンドポイントの使い方・作り方 2022(2022年8月30日)
- Always Free 環境で SPARQL エンドポイントを構築!(Qiita 記事)