LoginSignup
2
6

More than 1 year has passed since last update.

各データ分析手法の特徴を備忘録的にまとめる。

Last updated at Posted at 2023-03-20

自分用、あるいは分析手法の比較検討に悩んでる時のため、
簡単に各分析手法の特徴をメモとして残しておきます。
(気が向けば時々増やしていくかもしれません。)

一覧

回帰分析
決定木分析
クラスター分析
ロジスティック回帰分析
アソシエーション分析
コレスポンデンス分析

回帰分析

因果関係を関数の形で明らかにする分析手法です。
影響を与える値(広告)と影響を与えられる値(売上)の一方向の関係性を調べることができます。

<活用例>

出店や販売等の効果測定など
(8月にやったイベントのおかげでほかの月よりこれくらい伸びた~とか)

<メリット>

散布図と直線の関係性を利用するため、視覚的に分かりやすい。

<デメリット>

目的変数と説明変数の扱い方を間違えると、見当違いの推論結果になる。

決定木分析

「予測」「判別」「分類」を目的として使われる手法です。
決定木と呼ばれる樹形図を作成して分析します。

<活用例>

顧客の解約率予測や解約の原因探索など。

<メリット>

結果が分かりやすく、必要な前処理が少ない。
分類、回帰どちらにも対応可能。

<デメリット>

分類性能は低い。
機械学習に使用すると、過学習を起こしやすい。
線形性のあるデータにはあまり適していない。
(重回帰分析の方が向いている。)

クラスター分析

異なるものが混ざりあっている集団の中から、互いに似たものを集めて集落(クラスター)を作り、対象を分類する手法です。

<活用例>

顧客層の特性分け分析やブランドのポジショニング分析など。
例:何歳くらいの客層が多い、他店とや他ブランドとこういうところが違う、など。

<メリット>

・非階層型クラスター分析
  分析結果を出してから判断基準のラインを変えて「クラスター化する分割数」を変更できる。
・非階層型クラスター分析
  階層型クラスター分析よりも計算が簡略化される。
  計算しきれないビッグデータも効率的に分類できる。

<デメリット>

事前に何度か設定数値を変えた試算をしなければならない

ロジスティック回帰分析

いくつかの説明変数から2値の結果(目的変数)が起こる確率を説明・予測することができる。

<活用例>

異常検知、気象観測

<メリット>

汎用性が高い。
確率として扱うことができる。

<デメリット>

表現力の低さ。
解釈が難しくなる。

アソシエーション分析

主に購買データを基に、消費者の購買行動の中にある関連性を見つけ出す分析手法です。
「もし~だったら~(if)になるであろう(then)」という関連性を出すことができます。

【活用例】

「この商品を買った人はこんな商品も買っています」というリコメンドに活用することができる。

<メリット>

複数のデータ間の因果関係を対象としているため、明確な結果がでやすい。

<デメリット>

データを抽出しただけでは無意味。
※何のためにデータを抽出するのか、調べるのかを明確にしておくことが大切。

コレスポンデンス分析

アンケート調査などのクロス集計結果を散布図にして見やすくする手法。

【活用例】

分析結果を散布図として可視化することができる。

<メリット>

項目間の関係性の可視化ができる。

<デメリット>

回答者の数などのサンプルサイズにおける大小が反映されない。
(どれくらいの人がそう答えたのかがわかりにくい。)

記事作成:K&Q

2
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
6