これは CivicTechテック好き Advent Calendar 2020の記事です。この記事をまとめるにあたっては、2020年11月20日に開催されたアーバンデータチャレンジ2020 ウェビナー#2「ジャパンサーチを使い倒す!/生活・文化・地域アーカイブの観点から」における発表内容や,第22回Social Hack Day(主催Code for Japan)の「プロジェクト(インフラデータチャレンジ&アーバンデータチャレンジ」)で行った取り組みを元に構成・執筆しています.
ジャパンサーチの機能について,より深く知りたい方は,アーバンデータチャレンジ2020 ウェビナー#2「ジャパンサーチを使い倒す!/生活・文化・地域アーカイブの観点から」の動画も合わせて,ぜひご覧ください.
ジャパンサーチとは?
ジャパンサーチは,2020年8月より正式公開されたWebポータルで,次の大きな2つの特徴を持っています.(https://jpsearch.go.jp/)
- さまざまな分野のデジタルアーカイブと連携し,我が国が保有する多様なコンテンツのメタデータ(図書館の書誌データや博物館・美術館の収蔵品の目録データなど,コンテンツの内容や所蔵等を記述したもの)を,一つのサイトでまとめて検索できる国の分野横断型統合ポータル
- 集約したメタデータを利活用しやすい形式で共有しコンテンツの利活用を促す基盤(プラットフォーム) としての役割も果たす
もので,政府の知的財産推進計画にも掲げられている取り組みとして,運用主体として,デジタルアーカイブジャパン推進委員会・ 実務者検討委員会(事務局:内閣府知的財産戦略推進事務局)と,システム運用については,国立国会図書館がそれぞれ担っています.
これまで,国立国会図書館を始め,図書館や博物館・美術館などが収集し整備されてきた多くのコンテンツは,それぞれの機関のデータポータルやプラットフォームで公開され,データの提供方法もまちまちでしたが,ジャパンサーチの整備にあたっては,デジタルアーカイブ分野で長年課題になっていたような,横断検索やコンテンツ・メタデータ標準化などがしやすくなり,蓄積から発見し・活用しやすくなるようになることが期待されています.
(アーバンデータチャレンジ2020 ウェビナー#2 奥田倫子さん「ジャパンサーチのデータ・機能利用tips」資料より)
ジャパンサーチに掲載されているコンテンツ
ジャパンサーチでは,正式公開前後より,多くの連携機関やデータベースが参加し,この記事を執筆している12月20日時点で,統計ページによると,51機関・116データベース,メタデータ件数としては21,851,212ものデジタルアーカイブが検索・発見することができます.https://jpsearch.go.jp/stats
基本的な分類としては,カテゴリと呼ばれる14種類にまとめられ,全体の約半数が書籍等に分類される歴史的な文書や図書資料に関するものです.シビックテックでの活用という意味では,地域で,新潟大学・長野県立図書館・三重県・和歌山県立文書館などが保有する地域の郷土資料が,30万件以上収録されていますし,文化財は,文化庁や国立文化財機構が保有する指定文化財や国宝などのデジタルデータ,さらに数は少ないものの地図は,各種古地図コレクションなどが閲覧・活用できます.
さらに細かな分類は,メタデータ内にtypeと呼ばれる属性で定義されており,ジャパンサーチのSPARQL機能によって高度に検索することも可能です.
SELECT ?type (count(?cho) as ?count) WHERE {
?cho a ?type ;
jps:sourceInfo ?source .
} GROUP BY ?type
によると,一覧を取り出すことができます(@gakuji tamaki さんありがとうございます).
せっかくなので,おすすめからコンテンツを見てみたい
何しろ膨大な件数がジャパンサーチの入口からあれこれ,検索することができるので,あっという間に自分の興味のあるコンテンツを探すために,先ほどご紹介したカテゴリやタイプだけでなく,キーワード検索に時間を使うことも楽しいのですが,ジャパンサーチに関わっておられる図書館や博物館などプロの方の目線で紹介されているおすすめ作品をじっくり見たいということもできます.
具体的にはトップページからスクロールすると「ピックアップ」という段があり,上の図のようにサムネイルと元資料の所蔵機関,そして説明の一部を見ることができます.名称をクリックするとさらに詳細な説明や,画像の拡大,ライセンスの確認などを見ることができます.ハートマークをクリックすると,ジャパンサーチの右上にメモ帳のアイコンで表示されている「ノート」と呼ばれるお気に入りリストに登録することでき,後ほど振り返ることも出来ます.
これは,ピックアップから,上野公園の[不忍池]を閲覧している場面です.PDMという表記は,パブリックドメインを示し,この絵画が商用・非商用問わず自由に使うことができることを表しています.ジャパンサーチに収録されている作品は様々な機関やコレクションと連携しているため,ライセンスの形態も様々ありますが,このように各コンテンツごとにライセンスが(多くの場合)定められています.
さらに複数の作品をじっくり見たい場合は,ピックアップの下段にあるギャラリーも魅力的で,特定のキーワードにまつわる様々なおすすめ資料(書籍やその他のコンテンツ,動画などのリストを同時に見ることができる)を一括してみることができます.このギャラリーそのものを先ほどと同様に「ノート」に加えることもできるため,とても短時間では見きれないリストを保存しておくことも可能です.
- もの(49), 人(18), 自然物(17), 作品(17),出来事(16), 建築物(13), 地名(3)
なお,作成したノート自体も,リストとしてCSVやJSONなどに出力することができるので,Web展示会さながらに「わたしが集めたデジタル・アーカイブのコレクション」を共有できます.
ジャパンサーチに収録されているコンテンツのAPIやエンドポイント
開発者向け情報も非常に多くまとまっており,トップーページの最下部(右下)にまとまっています.
- 利活用スキーマ解説:https://jpsearch.go.jp/static/developer/introduction/ja.html
- SPARQLエンドポイント解説:https://jpsearch.go.jp/static/developer/sparql-explain/ja.html
- ジャパンサーチのSPARQLエンドポイント:https://jpsearch.go.jp/static/developer/sparql-explain/ja.html
- 簡易Web API 概説 • https://jpsearch.go.jp/static/developer/webapi/
この簡易Web APIを使ってさらに「時間」や「場所」などの条件を絞った検索(JSON)も可能です.例えば,下記のようなものがあげられます.
例)「地図」をメタデータに含む16世紀のアイテムを検索
https://jpsearch.go.jp/api/item/search/jps-cross?r-timespan=1500-01-01,1600-12- 31&keyword=地図
例)国立国会図書館東京本館から3km圏内のアイテムを検索
https://jpsearch.go.jp/api/item/search/jps-cross?g-coordinates=35.679813,139.7435848,3km
このAPIの詳細は,下記の資料がとても参考になりますので,是非参考にしてみてください.
https://jpsearch.go.jp/static/developer/webapi/#sec6
おわりに
今回ご紹介した「ジャパンサーチ」のシステム運用をされている国立国会図書館さんが「データ提供・支援拠点」として今年も参加いただいている,アーバンデータチャレンジ(UDC)2020は,今年も各種データを使った作品募集を絶賛開催中です!昨年度は特別賞もあり,地域アーカイブ関係を使った作品も増えていますのでチャンスです.我こそはと思う方はぜひ!