0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Googleデータアナリティクス:コンテキスト

Posted at

はじめに

本記事は、Googleデータアナリティクスのプロフェッショナル認定証のプログラムより、参照させて頂いています。興味を持った方は、是非受講してみてください。

データにおけるコンテキストやバイアスを認識する

データは孤立して存在するのではなく、 コンテキストを必要とします。

『コンテキスト、つまり文脈とは、何かが存在する、あるいは起こる状態、状況 のこと』

私たちはさまざまなレベルで データを活用しています。 先月の出張旅費はいくらだったか、 といった質問に答えるための 説明的なデータであることもあります。 先月出張費が増加した理由を理解するなど、 診断的・予測的なインサイトが得られると、 データの価値は高まります。 しかし、データが最も価値を持つのは、 処方箋となるようなインサイトを 得られたときです。

  • 例えば、より効率的な出張を奨励するには データをどのように活用すれば よいでしょうか?

データの意味を理解することは データを収集することと 同じくらい重要です。 データアナリストとしての 仕事の大部分は、

  • データをコンテキストに 当てはめる
  • 結論を出す前に、 客観性をもち、あらゆる側面から 俯瞰する

コンテキストというのは、 非常に属人的なものです。 同じデータセットを 2 人がキュレーションし、 その 2 人が同じ指示に従ったとしても、 最終的に異なる結果になる 可能性もあります。 なぜでしょうか?それは、 コンテキストの解釈は 普遍的でないからです。 誰もが自分なりの方法で アプローチしているのです。 たとえデータ収集のプロセスが正しくても、 分析結果が誤った解釈を されてしまうこともあります。 結論は、文化的、社会的、 市場的一般常識に基づく、あなた自身の 意識的、または無意識のバイアスに 影響されることがあります。

  • 例えば、ボストンに住んでいる人に、 どの野球チームが一番強いかと尋ねたら、 おそらくボストン・レッドソックスと 答えることでしょう。

ここで、私たちはデータ分析の 大きな限界に気づきます。 分析が客観的でない場合、 結論は誤解を招く可能性があります。

データの内容を 本当の意味で理解するためには 誰が、何を、 どこで、いつ、どのように、そしてなぜ、 ということを考えなければなりません。

  • そのデータは、誰が収集したのか?
  • そのデータは、何についてなのか?
  • そのデータは、世の中の何を表しているのか、 他のデータとどのような関係があるのか?
  • そのデータは、いつ収集されたのか?
    • 少し前に収集されたデータは、 現在の状況下においては 注意が必要かもしれません。
    • 例えば、過去 100 年間の 電話番号を収集した場合、 ある時点で携帯電話が登場しているはずで 携帯電話番号欄も必要になってきます。
  • そのデータは、どこで収集されたものなのか?
    • 都市、州、国によって、 データは大きく変わりますし、 どのように収集したのかも重要です。
  • そのデータは「なぜ」収集するのか?
    • 理由は、特にバイアスと 強い関連性を持つことがあります。 なぜなら、 データはある意図のために収集されたり、 あるいは作られたりすることが あるからです。 データの公正さと正確さのために あなたができる最善のことは、 母集団を正確に示し、 最も適切かつ 客観的な方法で データを収集することです。

コンテキストの重要性

データ分析においてコンテキストが重要なのは、膨大な量の無秩序なデータをふるいにかけて、意味のあるものに変えるのに役立つからです。実際、データはコンテキストと対になっていなければ、ほとんど価値を持ちません。

データの背後にあるコンテキストを理解することで、データ分析プロセスのあらゆる段階で、データをより意味のあるものにすることができます。例えば、次のデータが何を表している数字なのか、ある程度推測することはできるかもしれませんが、もっとコンテキストを理解しないと確かなことは言えません。

一方、1 列目に調査を実施した年、2 列目にその調査に回答した人数を表示すれば、この表はもっと意味を持つようになるはずです。さらに、5 年ごとにアンケートを実施していることに気づくかもしれません。このようにコンテキストを追加することで、表中に 5 年の差がある理由まで理解することができます

コンテキストは、ローデータを意味のある情報に変えることができます。

データアナリストにとって、データを文脈化することは非常に重要です。これは、データを定義することによって、データに視点を持たせることを意味します。そのためには、以下を意識してください。

  • 誰が: データの収集、および/または資金提供を行った個人や組織
  • 何を: データが影響を与える可能性のある世の中のこと / もの
  • どこで: データの起源
  • いつ: データが作成または収集された時期
  • なぜ: データが作成または収集された理由
  • どうやって: データの作成または収集に用いた方法

コンテキストを理解して考慮することは、分析プロセスの各ステップにおいて重要ですので、キャリアの早い段階から慣れておくとよいでしょう。例えば、データ収集の際には、そのビジネス自体やビジネスプロセスを理解するために、コンテキストについて質問することをお勧めします。データ整理の際には、項目の命名規則、変数間の関係の表し方、残すべきもの、省くべきものなどのコンテキストが重要になります。 そして最終的なプレゼンテーションの際にも、ステークホルダーがあなたの分析をよりよく理解できるように、コンテキストに関する情報を含めることが重要です。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?