データ、情報、知識
ウィキデータとは何かを語る前にデータとは何かを考えてみましょう。データとは何なのか、とっさに答えられる人はさほど多くはないでしょう。その定義はJIS規格でいう「情報の表現であって、伝達、解釈または処理に適するように形式化され、再度情報として解釈できるもの」を始めいろいろありますが、ここでは「データとは物事に割り当てられた値」であると表現してみます。
例えば「松戸市の第9-10代市長」という物事は「松本清」という値を、「松戸市の人口」という物事は「485,616」(2016/6/1現在)という値を持っています。これがデータです。しかしこのデータは単に事実を表わしているだけで、これだけでは受験生やクイズが大好きという人以外にはあまり興味を惹くものではありません。データは複数の値を集計したり、他との関係性をたどったり比較したりすることができて初めて情報となります。
「松本清」について調べてみると「マツキヨ」の創始者であり、国内自治体で「すぐやる課」を初めて設置した人物であることが分かります。これが情報です。さらに「すぐやる課」を調べてその目的や長所短所を理解したとしたらそれは知識であり、自分が同じような状況に出会った時にその知識を活かせるかもしれません。
このようにデータをもとに情報、ひいては知識として活かすためにはデータを複数集めて構造化することが不可欠です。データを構造化することで、こういったことを人間が目や手でやらなくても、機械が自動的に処理することができます。つまり人力だと途方もなく時間が掛かったり、あるいは気づくことすらできなかったことまで機械が短時間でやってくれる可能性を秘めているということです。
ウィキデータの概要(さわりだけ)
ウィキデータは、ウィキメディア財団によるプロジェクトです。自由な、共同作業による、多言語の二次情報データベースであり、ウィキペディア、ウィキメディア・コモンズなどのウィキメディアのプロジェクトのためだけでなく、より広範囲に提供するために構造化データを収集しています。(「ウィキデータ:はじめに」より,CC BY-SA 3.0)