はじめに
本記事は、Googleデータアナリティクスのプロフェッショナル認定証のプログラムより、参照させて頂いています。興味を持った方は、是非受講してみてください。

データにおけるコンテキストやバイアスを認識する
データは孤立して存在するのではなく、 コンテキストを必要とします。
『コンテキスト、つまり文脈とは、何かが存在する、あるいは起こる状態、状況 のこと』
私たちはさまざまなレベルで データを活用しています。 先月の出張旅費はいくらだったか、 といった質問に答えるための 説明的なデータであることもあります。 先月出張費が増加した理由を理解するなど、 診断的・予測的なインサイトが得られると、 データの価値は高まります。 しかし、データが最も価値を持つのは、 処方箋となるようなインサイトを 得られたときです。
- 例えば、より効率的な出張を奨励するには データをどのように活用すれば よいでしょうか?

データの意味を理解することは データを収集することと 同じくらい重要です。 データアナリストとしての 仕事の大部分は、
- データをコンテキストに 当てはめる
- 結論を出す前に、 客観性をもち、あらゆる側面から 俯瞰する
コンテキストというのは、 非常に属人的なものです。 同じデータセットを 2 人がキュレーションし、 その 2 人が同じ指示に従ったとしても、 最終的に異なる結果になる 可能性もあります。 なぜでしょうか?それは、 コンテキストの解釈は 普遍的でないからです。 誰もが自分なりの方法で アプローチしているのです。 たとえデータ収集のプロセスが正しくても、 分析結果が誤った解釈を されてしまうこともあります。 結論は、文化的、社会的、 市場的一般常識に基づく、あなた自身の 意識的、または無意識のバイアスに 影響されることがあります。
- 例えば、ボストンに住んでいる人に、 どの野球チームが一番強いかと尋ねたら、 おそらくボストン・レッドソックスと 答えることでしょう。
ここで、私たちはデータ分析の 大きな限界に気づきます。 分析が客観的でない場合、 結論は誤解を招く可能性があります。
データの内容を 本当の意味で理解するためには 誰が、何を、 どこで、いつ、どのように、そしてなぜ、 ということを考えなければなりません。
- そのデータは、誰が収集したのか?
- そのデータは、何についてなのか?
- そのデータは、世の中の何を表しているのか、 他のデータとどのような関係があるのか?
-
そのデータは、いつ収集されたのか?
- 少し前に収集されたデータは、 現在の状況下においては 注意が必要かもしれません。
- 例えば、過去 100 年間の 電話番号を収集した場合、 ある時点で携帯電話が登場しているはずで 携帯電話番号欄も必要になってきます。
-
そのデータは、どこで収集されたものなのか?
- 都市、州、国によって、 データは大きく変わりますし、 どのように収集したのかも重要です。
-
そのデータは「なぜ」収集するのか?
- 理由は、特にバイアスと 強い関連性を持つことがあります。 なぜなら、 データはある意図のために収集されたり、 あるいは作られたりすることが あるからです。 データの公正さと正確さのために あなたができる最善のことは、 母集団を正確に示し、 最も適切かつ 客観的な方法で データを収集することです。
コンテキストの重要性
データ分析においてコンテキストが重要なのは、膨大な量の無秩序なデータをふるいにかけて、意味のあるものに変えるのに役立つからです。実際、データはコンテキストと対になっていなければ、ほとんど価値を持ちません。
データの背後にあるコンテキストを理解することで、データ分析プロセスのあらゆる段階で、データをより意味のあるものにすることができます。例えば、次のデータが何を表している数字なのか、ある程度推測することはできるかもしれませんが、もっとコンテキストを理解しないと確かなことは言えません。

一方、1 列目に調査を実施した年、2 列目にその調査に回答した人数を表示すれば、この表はもっと意味を持つようになるはずです。さらに、5 年ごとにアンケートを実施していることに気づくかもしれません。このようにコンテキストを追加することで、表中に 5 年の差がある理由まで理解することができます

コンテキストは、ローデータを意味のある情報に変えることができます。
データアナリストにとって、データを文脈化することは非常に重要です。これは、データを定義することによって、データに視点を持たせることを意味します。そのためには、以下を意識してください。
- 誰が: データの収集、および/または資金提供を行った個人や組織
- 何を: データが影響を与える可能性のある世の中のこと / もの
- どこで: データの起源
- いつ: データが作成または収集された時期
- なぜ: データが作成または収集された理由
- どうやって: データの作成または収集に用いた方法
コンテキストを理解して考慮することは、分析プロセスの各ステップにおいて重要ですので、キャリアの早い段階から慣れておくとよいでしょう。例えば、データ収集の際には、そのビジネス自体やビジネスプロセスを理解するために、コンテキストについて質問することをお勧めします。データ整理の際には、項目の命名規則、変数間の関係の表し方、残すべきもの、省くべきものなどのコンテキストが重要になります。 そして最終的なプレゼンテーションの際にも、ステークホルダーがあなたの分析をよりよく理解できるように、コンテキストに関する情報を含めることが重要です。