自分用、あるいは分析手法の比較検討に悩んでる時のため、
簡単に各分析手法の特徴をメモとして残しておきます。
(気が向けば時々増やしていくかもしれません。)
一覧
回帰分析
決定木分析
クラスター分析
ロジスティック回帰分析
アソシエーション分析
コレスポンデンス分析
回帰分析
因果関係を関数の形で明らかにする分析手法です。
影響を与える値(広告)と影響を与えられる値(売上)の一方向の関係性を調べることができます。
<活用例>
出店や販売等の効果測定など
(8月にやったイベントのおかげでほかの月よりこれくらい伸びた~とか)
<メリット>
散布図と直線の関係性を利用するため、視覚的に分かりやすい。
<デメリット>
目的変数と説明変数の扱い方を間違えると、見当違いの推論結果になる。
決定木分析
「予測」「判別」「分類」を目的として使われる手法です。
決定木と呼ばれる樹形図を作成して分析します。
<活用例>
顧客の解約率予測や解約の原因探索など。
<メリット>
結果が分かりやすく、必要な前処理が少ない。
分類、回帰どちらにも対応可能。
<デメリット>
分類性能は低い。
機械学習に使用すると、過学習を起こしやすい。
線形性のあるデータにはあまり適していない。
(重回帰分析の方が向いている。)
クラスター分析
異なるものが混ざりあっている集団の中から、互いに似たものを集めて集落(クラスター)を作り、対象を分類する手法です。
<活用例>
顧客層の特性分け分析やブランドのポジショニング分析など。
例:何歳くらいの客層が多い、他店とや他ブランドとこういうところが違う、など。
<メリット>
・非階層型クラスター分析
分析結果を出してから判断基準のラインを変えて「クラスター化する分割数」を変更できる。
・非階層型クラスター分析
階層型クラスター分析よりも計算が簡略化される。
計算しきれないビッグデータも効率的に分類できる。
<デメリット>
事前に何度か設定数値を変えた試算をしなければならない
ロジスティック回帰分析
いくつかの説明変数から2値の結果(目的変数)が起こる確率を説明・予測することができる。
<活用例>
異常検知、気象観測。
<メリット>
汎用性が高い。
確率として扱うことができる。
<デメリット>
表現力の低さ。
解釈が難しくなる。
アソシエーション分析
主に購買データを基に、消費者の購買行動の中にある関連性を見つけ出す分析手法です。
「もし~だったら~(if)になるであろう(then)」という関連性を出すことができます。
【活用例】
「この商品を買った人はこんな商品も買っています」というリコメンドに活用することができる。
<メリット>
複数のデータ間の因果関係を対象としているため、明確な結果がでやすい。
<デメリット>
データを抽出しただけでは無意味。
※何のためにデータを抽出するのか、調べるのかを明確にしておくことが大切。
コレスポンデンス分析
アンケート調査などのクロス集計結果を散布図にして見やすくする手法。
【活用例】
分析結果を散布図として可視化することができる。
<メリット>
項目間の関係性の可視化ができる。
<デメリット>
回答者の数などのサンプルサイズにおける大小が反映されない。
(どれくらいの人がそう答えたのかがわかりにくい。)
記事作成:K&Q