0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Googleデータアナリティクス:データの収集

Last updated at Posted at 2023-04-09

はじめに

本記事は、Googleデータアナリティクスのプロフェッショナル認定証のプログラムより、参照させて頂いています。興味を持った方は、是非受講してみてください。

どのようにデータを収集するのか?

データにはさまざまな種類があり、 それを収集する方法もさまざまです。

  • インタビュー
    • 例えば、あなたが就職面接を 受けたとします。 採用担当者に好印象を与えるために、 あなたは自分自身の情報を 共有したいと考えています。 採用担当者はそのデータを収集し、 分析することで、 あなたを採用するかどうかを決定します。 しかし、それは双方向なものです。 あなた自身も、その会社が 自分に合うかどうかを判断するために、 自分でその会社に関するデータを 集めることもできます。 あるいは、集めたデータから 面接官に尋ねるべき 質問を考えることもできます。
  • 観察
    • 科学者たちもデータを生成しています。 彼らは仕事の中で多くのことを 観察しています。 例えば、動物の行動を研究したり、 顕微鏡でバクテリアを見たりして データを収集することがあります。
  • フォーム
  • アンケート
  • 調査
  • クッキー
    • オンラインのデータは、 必ずしも直接的に発生するわけでは ありません。 例えば、オンライン広告が 的確なサジェストをすることや、 ウェブサイトがユーザーの好みを 理解していることを不思議に思った ことはありませんか? これは、ユーザーに関する 情報を含むコンピュータに保存される 小さなファイルである Cookieを 使用して行われています。 Cookie は、あなたが普段している ネットサーフィンから得た、 個人的な興味や習慣を、 個人を特定することなく 広告主に知らせるのに役立ちます。

収集すべきデータを判断する

データアナリストとして、 どのようなデータを収集し、 使用するかは、 プロジェクトごとに判断する 必要があります。 無限にあると言ってもいいデータの中で、 これはかなり悩ましいこととも言えますが、 良いこともあります。 通常は、必要なデータが与えられている、 または事業タスクや課題によって 選択肢が既に絞られているため、 適したデータを選ぶのは そう時間がかからないはずです。

ここでは、

”あなたの街の 通勤ラッシュの交通量増の原因は何か”

という問いかけから始めてみましょう。

データをどのように 収集するか? (データソース)

交通パターンを観察し、 特定の時間帯に 市街地を走っている車の数を 数えるのもいいでしょう。 そこで、特定の道路で車が 渋滞していることに気がついたとします。 そこでデータソースの話が出てきます。 この交通量の例では、 観測データは ファーストパーティ データになります。

『ファーストパーティ データとは、個人またはグループが 独自のリソースを使用して 収集したデータ』

一般的に、 ファーストパーティ データの収集は そのデータの出所が 正確に分かるため、 好ましい方法であるといえます。

内部データは、解決すべき 課題に関連した情報であるうえ それ自体をすでに会社が 所有しているため、 無料で入手することができます。 内部データがあれば データアナリストは外部のデータに 煩わされることなく あらゆるデータプロジェクトに 取り組めます。

『セカンドパーティ データとは、 あるグループがユーザーから直接収集し、 販売するデータ』

例えば、自社でデータを 収集できない場合は 市内の交通パターンの 調査を行っている組織から データを購入できます。 このデータは、 自分で入手したものではありませんが、 交通分析の経験があるところから 得たものなので、信頼性は高いといえます。

しかし、サードパーティ データや、 直接収集していない、外部ソースから 収集したデータについては、 必ずしもそうとも言えません。 このタイプのデータは、 あなたの調査以前に、 いくつもの異なるソースが 提供したものかもしれません。 信頼性は低いかもしれませんが、 だからといって、 有用でないとは限りません。 あなたは、正確さ、偏り、信憑性を 確認する必要があります。 実際、どのようなデータを使うにしても、 正確さと信頼性を検証する 必要があるのです。

データアナリストとして、 どのデータを活用するか、 決めるのはあなたの仕事です。 それは、答えや 課題解決に導いてくれる データを選び、 その他のデータには惑わされないように するということです。 例えば先ほどの交通の話の場合、 財務データはおそらく 役に立たないでしょう。 しかし、交通量の多い時間帯に関する 既存のデータであれば、役に立つでしょう。

どのくらいの量のデータを 収集するか?

『母集団とは、あるデータセットに含まれる すべてのデータ値のこと』

例えば、ある都市の 交通量データを分析する場合、 母集団はその地域にある すべての自動車になります。 しかし、母集団全体から データを収集することは 実際のところ、かなり困難です。 そこで有効なのが、 サンプルの活用です。

『サンプルとは、集団を代表する 一部分のこと』

街のある場所について データサンプルを集め、 そこの交通量を 分析することもできますし、 母集団の既存のデータすべてから 無作為にサンプルを 抽出することもできます。 サンプルをどのように選択するかは、 プロジェクトによって異なります。

適切なデータのタイプは?

交通データの場合、 適切なデータのタイプは、 年月日表示で保存された 日付ごとの交通記録といえます。 日付から、将来的に交通量が 増えそうな曜日を 把握することができるでしょう。

データ収集の時間枠は?

すぐに答えが必要な場合は、 すでに存在するデータ、つまり 過去のデータを活用する必要があります。 しかし、長期にわたって 交通パターンを追跡する必要が ある場合はどうでしょう。 その場合、データ収集中に 判断が変わってくることもあり得ます。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?