LoginSignup
6

各データ分析手法の特徴を備忘録的にまとめる。

Last updated at Posted at 2023-03-20

自分用、あるいは分析手法の比較検討に悩んでる時のため、
簡単に各分析手法の特徴をメモとして残しておきます。
(気が向けば時々増やしていくかもしれません。)

一覧

回帰分析
決定木分析
クラスター分析
ロジスティック回帰分析
アソシエーション分析
コレスポンデンス分析

回帰分析

因果関係を関数の形で明らかにする分析手法です。
影響を与える値(広告)と影響を与えられる値(売上)の一方向の関係性を調べることができます。

<活用例>

出店や販売等の効果測定など
(8月にやったイベントのおかげでほかの月よりこれくらい伸びた~とか)

<メリット>

散布図と直線の関係性を利用するため、視覚的に分かりやすい。

<デメリット>

目的変数と説明変数の扱い方を間違えると、見当違いの推論結果になる。

決定木分析

「予測」「判別」「分類」を目的として使われる手法です。
決定木と呼ばれる樹形図を作成して分析します。

<活用例>

顧客の解約率予測や解約の原因探索など。

<メリット>

結果が分かりやすく、必要な前処理が少ない。
分類、回帰どちらにも対応可能。

<デメリット>

分類性能は低い。
機械学習に使用すると、過学習を起こしやすい。
線形性のあるデータにはあまり適していない。
(重回帰分析の方が向いている。)

クラスター分析

異なるものが混ざりあっている集団の中から、互いに似たものを集めて集落(クラスター)を作り、対象を分類する手法です。

<活用例>

顧客層の特性分け分析やブランドのポジショニング分析など。
例:何歳くらいの客層が多い、他店とや他ブランドとこういうところが違う、など。

<メリット>

・非階層型クラスター分析
  分析結果を出してから判断基準のラインを変えて「クラスター化する分割数」を変更できる。
・非階層型クラスター分析
  階層型クラスター分析よりも計算が簡略化される。
  計算しきれないビッグデータも効率的に分類できる。

<デメリット>

事前に何度か設定数値を変えた試算をしなければならない

ロジスティック回帰分析

いくつかの説明変数から2値の結果(目的変数)が起こる確率を説明・予測することができる。

<活用例>

異常検知、気象観測

<メリット>

汎用性が高い。
確率として扱うことができる。

<デメリット>

表現力の低さ。
解釈が難しくなる。

アソシエーション分析

主に購買データを基に、消費者の購買行動の中にある関連性を見つけ出す分析手法です。
「もし~だったら~(if)になるであろう(then)」という関連性を出すことができます。

【活用例】

「この商品を買った人はこんな商品も買っています」というリコメンドに活用することができる。

<メリット>

複数のデータ間の因果関係を対象としているため、明確な結果がでやすい。

<デメリット>

データを抽出しただけでは無意味。
※何のためにデータを抽出するのか、調べるのかを明確にしておくことが大切。

コレスポンデンス分析

アンケート調査などのクロス集計結果を散布図にして見やすくする手法。

【活用例】

分析結果を散布図として可視化することができる。

<メリット>

項目間の関係性の可視化ができる。

<デメリット>

回答者の数などのサンプルサイズにおける大小が反映されない。
(どれくらいの人がそう答えたのかがわかりにくい。)

記事作成:K&Q

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
6