• 2
    いいね
  • 0
    コメント

※いまさらですが、当方、ウィキデータを知ってまだ日が浅いのでお気づきの点などありましたらコメント欄でご指摘ください。

項目(item)の構造

ウィキデータは世界のあらゆる物事や概念を項目(item)という単位で表現します。下図の全体が項目です。

wikidata_model_ja.png

その内容をごく簡単に説明します。詳細はヘルプ・ポータルのあたりを参照してください。

項目を識別するための記述

ラベル(label)

項目の内容を表す、タイトルに相当します。一般的な名前でなるだけ短いものを使用します。必ずしも一意である必要はなく、他の項目と同じになっても構いません。ウィキペディアでは同一タイトルの記事は「浅間神社 (松戸市)」のようにカッコ書きで区別されますが、ウィキデータではカッコ書きは不要で、次の説明欄と併せて類似の他の項目と区別できるように記述します。最低限ラベルだけあれば、項目を登録することができます。例:浅間神社

説明(description)

項目について、他と識別できるような最低限の説明を記述します。サブタイトル的な短い説明で最後の句点(。)は付けません。例:千葉県松戸市にある神社

別名(alias)

ラベル以外にも同一のものを指す別の名前がある場合に記述します。表記の揺れがある場合のバリエーションや新字体に対して旧字体がある場合などにも使います。

項目の属性についての記述

文(statement)

「プロパティ」-「値」のペアを基本として、項目に対する属性を、該当するプロパティが存在する分だけデータとして入れていきます。

プロパティ(property)

項目に対する属性を示し、新しいプロパティを登録するためには所定の手続きが必要です。その構造は項目とよく似ていますがサイトリンクの追加はできず、代わりに値に対するデータ型が決められています。

値(value)

プロパティに対応する値。

ランク(rank)

推奨ランク:人口など、調査年ごとにあるような値のうち、最新のものに設定。
通常ランク:デフォルト。
非推奨ランク:記録としては残してあるが、現在は正しくないと認識されているようなもの。例えば江戸時代の人口が記録として残されているが、それは正しくないことが一般的に認識されているような場合。

修飾子(qualifier)

プロパティと値のセットが有効な範囲などを修飾します。例えば人口と数字のセットに対する調査時点の日付など。

出典(reference)

修飾子と同様に、プロパティと値のセットに対して、その出典を記述します。
<例>
「移入元」-「ウィキペディア日本語版」
「出典」-「(本の名前)」
「出典URL」-「(閲覧したURL)」

アカウント作成

アカウントが無くてもデータの編集には参加できますが、いたずらでないことを示すためにもアカウントを作成して参加されることをオススメします。
ウィキペディアやウィキメディアにアカウントを作成していれば、それを共通で使うことができます。ひとつも持っていない方は作成してください。

項目を修正してみる

初めのうちは身近な物事から始めると良いと思います。私のオフィスは上野なので、ウィキデータのサイト右上にある検索窓で「上野」を検索してみます。
searchbox.png

上野と名の付くものはいろいろありますがここでは「上野恩賜公園」を選んでみます。

上野恩賜公園   Wikidata.png

「説明」欄が未入力なので、これを入力してみましょう。「上野にある公園」だとどこの上野だよ、ってことになるので「東京都台東区にある公園」くらいが良いと思います。項目ページの右上にある「編集」をクリックします。

上野恩賜公園   Wikidata_edit.png

説明欄で「東京都台東区にある公園」と入力します。また通称としてよく使う「上野公園」の名称が無いので別名欄にあわせて追加し、右上の「保存」をクリックします。なお、この部分についてはごく一般的な内容しか記述しないため、出典表記は不要です。

上野恩賜公園   Wikidata_edit_after.png

今度は「上野公園」で検索してみると以下のように候補が表示され、「別名」や「説明」があることで検索時に判別しやすくなったことが分かります。

searchboc_after.png

ウィキデータはこのように誰でも編集に参加することができます。

今回、編集の初めの一歩として、項目を識別するための部分(ラベル、説明、別名)を少し編集してみましたが、同じ物事や概念はひとつの項目で管理されており世界中からそれぞれの言語で更新されます。それはすなわちウィキデータがCC0の翻訳辞書としての利用も可能ということです。上の例でも日本語の下に英語の行がありますが、英語が分かる方はそちらも併せて充実させて行くと良いと思います。ラベルの下の「入力済みの全言語」をクリックするとそれ以外の言語も全て表示されます。

ウィキデータの紹介#2 | ウィキデータの紹介#4