ウィキデータに登録すべきもの、すべきでないものについて調べてみました。詳細は「Wikidata:方針とガイドラインの一覧」を参照してください。
特筆性
ウィキペディア
ウィキペディアには「独立記事作成の目安」というガイドラインがあり、取り扱う対象には百科事典の記事として言及するにふさわしい価値が必要として、これを特筆性(notability)と呼んでいます。
ウィキデータ
ウィキデータはウィキペディアと緊密に連携しているため、そのガイドラインとも通じるところが多く見受けられます。しかしながらCC0でライセンスされている構造化データはウィキペディアの記事のように著作物ではありません。また、ウィキデータの目的は複数のウィキペディアに跨る言語間リンクを集約すること、および世界全体に普遍的な知識ベースを提供すること、とされておりウィキペディアとは異なります。このため似てはいるものの一部独自のガイドラインとなっています。
ウィキデータのガイドラインでは現在notabilityは「情報価値」と訳されており、項目を作成するには下記3つの基準のうち少なくとも1つを満たす必要があるとされています。
- ウィキペディア、ウィキボヤージュ、ウィキソース、ウィキクォート、ウィキニュース、ウィキブックス、ウィキデータ、ウィキメディア・コモンズのいずれかのページへの少なくとも1つの有効なサイトリンクを含んでいること。
- 確実に確認可能な概念または具体的な実体を参照していること。その実体には情報価値がなければなりません。それはつまり、堅いかつ公的に参照可能な情報源を使って記述することができる、という意味です。あなたに関する項目がまだない場合は、あなたにはおそらく情報価値がありません。
- 構造化する上での必要性があること。例えば、他の項目内で作られた文をより有益なものにするために必要とされている、といったことです。
CC0の下で提供することに同意するからといって、どんなデータでも入れて良いという訳ではありません。いくつか例を挙げて考えてみます。お気づきの点はコメントください。
1)ウィキペディアに既に記事がある項目
これは1.の基準を満たすので問題ありません。おそらく既にボットなどにより主要なプロパティを移入した項目が作成されていると思います。個人的な経験ではウィキペディアに記事を書いてから1ヶ月後くらいに移入されていました。
以下はウィキペディアにまだ記事が無い場合についてです。
2)ウィキペディアの「独立記事作成の目安」を満たす項目(ウィキペディアに記事を作成しても問題無さそうな項目)
これはまだウィキペディアに記事が無くても、おそらく2.の基準を満たすのでウィキデータに項目を作成しても問題無いと思います。ウィキペディアの記事も作成することが望ましいと思いますが。
3)マクドナルド 幕張テクノガーデン店
日本マクドナルドという会社自体は1.の基準を満たしていますが、個々の店舗はそうではありません。
2.の基準については「情報価値」とは何なのか、価値は人により異なる主観的なものなので捉え方が難しいですが、「特筆性」と読み替えた方が分かりやすいのではないでしょうか。「堅いかつ公的に参照可能な情報源を使って記述することができる」かどうか、とあるので幕張テクノガーデン店について、日本マクドナルドのサイトや食事案内サイト以外でそのような情報源が見つからないので2.の基準は満たさないと思われます。
3.の基準については、日本マクドナルドという項目に、その全店舗がぶら下がっているようなデータ構造はとても有益なので、私自身は3.の基準は満たすのではないかと思っていますが、どうなんでしょう。ただ、国内で3000件ほどある店舗データを初期投入は何とか頑張ったとしても(ボランタリーなモチベーションだと)更新はかなり難しいだろうという気はします。
いずれにしても、ウィキデータの項目として、チェーン店の個別店舗を書いたものはまだ見つけきれていないので、こういった項目を実際に作る場合にはウィキデータのコミュニティに相談した方が良さそうですね。
私自身はOpenStreetMap(OSM)のコミュニティに参加しているのですが、ウィキデータとOSMの間ではデータそのものを受け渡すというより同じ内容を指す項目どうしをキーでつなぐようなことが始まっています。OSM側でいえば、ファストフードの個別店舗などはまさに地図でよく探す目的地なので、当然個別にデータ化されています。これらは位置情報を持ったデータとして価値のある情報だと思います。ウィキデータの方ではこういったデータは対象外と考えているのか、つなぎ込むことを考えているのか、詳しい方にお話を伺ってみたいところです。
ウィキペディアで特筆性の無い個別店舗を対象外としている趣旨は分かるのですが、データ(事実情報)のプロジェクトとしては網羅性が高まるにつれて有用性も高まるという気がしています。
4)地域にある歴史的な由緒が記された記念碑
1.の基準はウィキペディアに独立記事として掲載するほどの特筆性は無いものも多いので、その場合は満たさないと思います。
2.の基準は、こういったものは自治体の公式サイトや郷土史の書籍に掲載されていることが多いので、その場合は満たすと考えられるのではないでしょうか。
3.の基準は、例えば神社の境内によくある記念碑などであれば、その神社の項目に関連するものとして追加すると神社の項目の利用価値が高まると思われるので、満たすと思います。
まとめ
上記4つの事例を3つの基準のうちいずれか1つでも満たしているか、という観点でまとめると以下の通りとなります。(あくまで私見)
1)◯(ウィキデータに登録して良い)
2)◯(ウィキデータに登録して良い)
3)?(不明)
4)◯(ウィキデータに登録して良い)
常識で判断する
これは「物事は常識で判断しましょう」というシンプルな方針で、これ以外の方針やガイドラインがさまたげになったときは、常識で判断して無視してください、ということを言っています。発展途上のプロジェクトなので、こういった柔軟さは非常に頼もしいです。
その他
法的な制限事項への配慮
「Wikidata:方針とガイドラインの一覧」では明記していませんが、当然ながら個人情報、プライバシーその他、法的にパブリックな場所での公開が制限されている事項は登録してはいけません。
利用規約への配慮
一般的に、特段の創意工夫が無い事実情報には著作権は無い、とされていますが、よくウェブサイトなどで事実情報と著作物を区別せずに、利用時は連絡や申請が必要といった条件が付けられている場合があります。これは事実情報に対しては無効である可能性が高いのですが、無断転載が発覚した場合、無用なトラブルを招く恐れがありますので注意したほうが良いと思います。