先日、私が公開しているWebサイト 図書館施設データポータル について紹介した以下のQiitaの記事
が、はてなブックマークにて、200を超えるブックマークをいただき、TwitterなどSNS等でも多数の共有をいただけたようで、多くの方に私の公開するWebサイトを知っていただきとてもうれしかったです。
また、私の想像よりも図書館が持つデジタルデータに興味を持っている方々がたくさんおられるのだなと思いました。その反面、過去の騒動の影響か図書館のデータの利用に不安を持たれている方も少なからずおられるようでした。
図書館施設データポータル で使用しているデータは、先のQiitaの記事でも書いていますが、各館のWebサイトをスクレイピングしたものではなく国立国会図書館が公開する「図書館及び関連組織のための国際標準識別子(ISIL)」試行版LODのデータセットをダウンロード・加工して使用しています。
国立国会図書館さんのWebサイトからもデータ活用例の一つとして紹介していただいていますので、特に問題はないかと思います。
さて、このデータセット以外にも図書館から様々な有用な、面白いデータがたくさん公開されています。
私が知る限りではありますが、安心して利用できる図書館データをここでいくつか紹介したいと思います。
安心して利用できるデータとは
例えばWebアプリ等で利用する場合、どういう用途で使用していいのか・いけないのかが明確でないデータはとても使いにくいですし、逆にそれらが明確に定められていれば安心して利用できると思います。
なので、ここでは
利用規約・ライセンスが明確なデータ = 安心して利用できるデータ
としたいと思います。
以下で紹介するものについては、全て利用規約・ライセンスが確認できるリンクを追加していますので、利用するときに確認してみてください。
図書館データ
国立国会図書館サーチ
国立国会図書館が運営する蔵書検索システム(OPAC)「国立国会図書館サーチ」をWeb APIから検索、データ取得することが可能です。
使い方
利用規約・ライセンス
非営利・営利目的を問わず、無償で利用可能。当館への申請不要。
※同サービスで提供される他機関提供データは提供機関の定める利用条件に拠る。
※ https://lab.ndl.go.jp/data_set/dataset/より引用
Web NDL Authorities
国立国会図書館が持つ著者(個人や団体など)データの検索・データ取得が可能です。
使い方
利用規約・ライセンス
非営利・営利目的を問わず、無償で利用可能。当館への申請不要。
※ https://lab.ndl.go.jp/data_set/dataset/より引用
国会会議録検索システム 検索用API
国会での発言について検索が可能
使い方
利用規約・ライセンス
著作権は著作権者に帰属。著作権法の権利制限の範囲内で利用可。検索用APIを提供。営利目的は要申請。
※ https://lab.ndl.go.jp/data_set/dataset/より引用
詳しくは、https://kokkai.ndl.go.jp/api.html#terms_of_condition 参照
レファレンス協同データベース
図書館のレファレンスサービス(本に対する質問について該当する資料を紹介するサービス)に寄せられた質問とそれに対する回答の事例をまとめたデータベース「レファレンス協同データベース」のデータをAPIとして提供
SNSでたまに図書館で受け付けられた質問についてバズってますが、大概はこのサービスのものです。
- [B! 日本語] 「てふ」と書いてなぜ「ちょう」と読むのか知りたい。 | レファレンス協同データベース
- [B! 図書館] 魔法がつかえるようになりたい。 | レファレンス協同データベース
使い方
利用規約・ライセンス
個々のデータの著作権はデータ提供館に帰属。検索用APIを提供。営利目的は要申請。
※ https://lab.ndl.go.jp/data_set/dataset/より引用
詳しくは https://crd.ndl.go.jp/jp/help/general/api.html#api ご利用にあたって 節参照
国立国会図書館デジタルコレクション
国立国会図書館が運営する国立国会図書館デジタルコレクションで提供されるデジタル化した資料の書誌情報と資料の画像ファイルをAPIから取得可能。
使い方
利用規約・ライセンス
著作権保護期間満了のもの(約35万点)は、利用者の責任において自由利用可。
※ https://lab.ndl.go.jp/data_set/dataset/より引用
詳しくは https://dl.ndl.go.jp/ja/help_iiif.html#api-の利用について 参照。
「図書館及び関連組織のための国際標準識別子(ISIL)」試行版LOD
日本全国の図書館のさまざまなデータをRDFとして提供。
図書館施設データポータル でも使用しています。
使い方
からダウンロード可能
利用規約・ライセンス
営利・非営利の目的を問わず、利用手続なしで自由に利用可。
※ https://lab.ndl.go.jp/data_set/dataset/より引用
ジャパンサーチ
ジャパンサーチは、書籍等分野、文化財分野、メディア芸術分野など、さまざまな分野のデジタルアーカイブと連携して、我が国が保有する多様なコンテンツのメタデータをまとめて検索できる「国の分野横断型統合ポータル」です。
※ https://jpsearch.go.jp/about より
というサイトです。
かなりいろいろなメタデータがAPIから取得可能です。
使い方
利用規約・ライセンス
メタデータ及びサムネイル画像の利用に当たっては、連携機関の各データベースの紹介ページに記載された利用条件を確認してください。なお、メタデータについては、データベースの紹介ページに特に利用条件の記載がない場合は「CC0(CC0 1.0 全世界 パブリック・ドメイン提供)」の規定により利用できます。
個別のデジタルコンテンツについては、検索結果詳細画面に記載された二次利用条件を確認してください(各データベースの紹介ページとコンテンツの検索結果詳細画面とで利用条件が異なる場合は、検索結果詳細画面が優先されます。)。データを利用するに当たっては、連携機関の元データベースの利用条件も併せて確認してください。
※https://jpsearch.go.jp/policy#anchor03 より
カーリル 図書館 API
カーリルで提供されている公共図書館の蔵書の有無や貸し出し状態を所得可能なAPIを利用可能です。
使い方
利用規約・ライセンス
法人・個人を問わず無償で利用できます。
※ https://calil.jp/doc/api.html より
なお、API利用にはアプリケーションキーを取得する必要があります。
OpenDB
本の書誌情報や書影(表紙の画像)データを取得可能なAPIを提供しています。
使い方
利用規約・ライセンス
・openBD APIが提供するのはデータの「利用権」です。
・openBD APIが提供する書誌・書影・内容紹介・書評情報などすべての情報は、本の販促・紹介目的に限り使用できます。個人・団体・企業を問いません。
・提供するデータには近刊情報が含まれますから書誌の内容や書影が時間とともに変更・修正、さらには削除される可能性があります。利用側の事情で書誌データをキャッシュする場合は、データの変更をできるだけ早く反映するようにしてください。
・個別の書誌・書影情報について、openBDプロジェクトからの削除要請があった場合には、速やかにそれに従うものとします。
・openBD APIから得られたデータを、任意に改変してはいけません。不具合の報告や改善の提案は歓迎します。
※https://openbd.jp/terms/ より
カーリルブックウォーク ISBNリスト
カーリルブックウォーク というWebサイトで利用されている20万冊の本のISBNをダウンロード可能です。
この20万冊は
・カーリルの読みたいリストに3名以上が入れていること
・国会図書館を含めた全国の公立図書館が3冊以上所蔵していること
・openBDプロジェクトを通して書影が提供されていること
を基準に選ばれたそうですので、人気の本のデータセットと考えてよさそうです。
ISBNのみの提供ですが、ここで紹介しているデータセット・APIと組み合わせることでタイトルなど補うことはそう難しくはないでしょう。
使い方
利用規約・ライセンス
ライセンス CC-0
CC-0とのことなので、自由に利用できそうです。
CiNii ウェブAPI
国立情報学研究所 が提供する CiNii Books や CiNii Articles などの検索サービスを API を通じて結果を取得することができます。
使い方
利用規約・ライセンス
https://support.nii.ac.jp/ja/cinii/api/developer の「APIのご利用にあたって」節参照
メディア芸術データベース
図書館ではありませんが、文化庁が公開するマンガ・アニメーション・ゲーム・メディアアート分野のデータが検索可能なメディア芸術データベース ベータ版がAPIを提供しています。
取得データの中には、国立国会図書館のデータも含まれます。
使い方
利用規約・ライセンス
小倉百人一首LOD
図書館関係の有志の方々が作成された小倉百人一首に関するデータセットです。
このデータセットには、国立国会図書館デジタルコレクションに収録される関連する画像のリンクが含まれます。
また、複数のマッシュアップ作品があり、小倉百人一首LODのビューア兼APIを提供する「小倉百人一首LODの世界」や、小倉百人一首を題材としたクイズゲーム「小倉百人一首クイズ」などがあります。
使い方
などからダウンロード可能です。
詳しくは公式ページを参照してください。
利用規約・ライセンス
上記3つのデータセットはCC BYにより提供されています。
おわりに
今回、安心して利用できる(利用規約・ライセンスが明確な)図書館関係で公開されるデータをいくつか紹介しました。単純に図書館の本のメタデータ以外にも書影、昔の本のスキャンデータ、アニメのデータなど多様なデータが公開されていますので、利用できる範囲内で是非活用してもらえればと思います。
国立国会図書館が提供する各データについては、NDLラボ内でここに紹介した以上の詳しい情報が得られます。GitHubアカウントでもソフトウェアを提供しています。是非参照してください。
また、これら以外にも、たくさんのデータが公開されています。「図書館 オープンデータ」と検索するとたくさん出てくると思いますので、利用規約やライセンスを確認の上、利用してみてください。